Hjem Personlig finansiering Måling Lighed mellem vektorer til maskinlæring - dummies

Måling Lighed mellem vektorer til maskinlæring - dummies

Indholdsfortegnelse:

Video: Geometry: Collinearity, Betweenness, and Assumptions (Level 1 of 4) | Triangle Inequality 2025

Video: Geometry: Collinearity, Betweenness, and Assumptions (Level 1 of 4) | Triangle Inequality 2025
Anonim

Du kan nemt sammenligne eksempler fra dine data ved hjælp af beregninger, hvis du tænker på hver af dem som en vektor. Følgende oplysninger beskriver, hvordan man måler lighed mellem vektorer for at udføre opgaver som at beregne afstanden mellem vektorer til læringsformål.

Forstå lighed

I en vektorform kan du se hver variabel i dine eksempler som en række koordinater, hvor alle peger på en position i en anden rumdimension. Hvis en vektor har to elementer, det vil sige, den har kun to variabler. Det er ligesom at kontrollere en varens position på et kort ved at bruge det første tal for positionen på øst-vest-aksen og den anden på nord- Sydaksen.

Eksempler på værdier plottet som punkter på et diagram.

F.eks. Er tallene mellem parenteser (1, 2) (3, 2) og (3, 3) alle eksempler på punkter. Hvert eksempel er en ordnet liste over værdier (kaldet en tuple), der let kan placeres og udskrives på et kort ved hjælp af den første værdi af listen for x (den vandrette akse) og den anden for y (den lodrette akse). Resultatet er en scatterplot.

Hvis dit datasæt i matrixformularen har mange numeriske funktioner (kolonnerne), repræsenterer antallet af funktionerne fortrinsvis dimensionerne af dataruimet, mens rækkerne (eksemplerne) repræsenterer hver punkt, som matematisk er en vektor. Når din vektor har mere end to elementer, bliver visualisering besværlig, fordi repræsentation af dimensioner over den tredje er ikke let (vi lever jo trods alt i en tredimensionel verden).

Du kan dog stræbe efter at formidle flere dimensioner ved hjælp af en hvilken som helst hensigtsmæssig, f.eks. Ved at bruge størrelse, form eller farve til andre dimensioner. Det er klart, at det ikke er en nem opgave, og ofte er resultatet langt fra at være intuitivt. Du kan dog forstå ideen om, hvor punkterne ville være i dit dataruim ved systematisk at udskrive mange grafer, mens man overvejer dimensionerne to for to. Sådanne tomter kaldes matricer af scatterplots.

Du skal ikke bekymre dig om multidimensionalitet. Du udvider reglerne du lærte i to eller tre dimensioner til flere dimensioner, så hvis en regel fungerer i et tovimensionelt rum, fungerer det også i en flerhed. Derfor henviser alle eksemplerne først til todimensionelle eksempler.

Computing afstande til læring

En algoritme kan lære ved at bruge vektorer af tal, der bruger distance målinger. Ofte er rummet, som er angivet af dine vektorer, et metrisk, der er et rum, hvis afstande respekterer visse specifikke forhold:

  • Der findes ingen negative afstande, og din afstand er kun nul, når startpunktet og slutpunktet falder sammen (kaldet nonnegativity).
  • Afstanden er den samme, der går fra et punkt til et andet og omvendt (kaldet symmetri). Afstanden mellem et indledende punkt og en sidste er altid større end eller værre det samme som afstanden fra det indledende til et tredje punkt og derfra til den endelige (kaldet
  • trekant ulighed < - hvilket betyder at der ikke er genveje). Afstande, der måler et metrisk rum, er den euklidiske afstand, Manhattan-afstanden og Chebyshev-afstanden. Disse er alle afstande, der kan gælde for numeriske vektorer. Euklidisk afstand

Den mest almindelige er den euklidiske afstand, også beskrevet som l2-norm for to vektorer (læs denne diskussion af l1, l2 og linfinitetsnormer). I et todimensionalt plan reflekterer den euklidiske afstand som den lige linje, der forbinder to punkter, og du beregner den som kvadratroden af ​​summen af ​​den kvadratiske forskel mellem elementerne i to vektorer. I det forrige plot kan den euklidiske afstand mellem punkterne (1, 2) og (3, 3) beregnes i R som sqrt ((1-3) ^ 2 + (2-3) ^ 2), hvilket resulterer i en afstand på ca. 2. 236.

Manhattan afstand

En anden nyttig foranstaltning er Manhattan-afstanden (også beskrevet som l1-norm for to vektorer). Du beregner Manhattan-afstanden ved at summere den absolutte værdi af forskellen mellem vektorernes elementer. Hvis den euklidiske afstand markerer den korteste rute, markerer Manhattan-afstanden den længste rute, der ligner retningen for en taxa, der flytter i en by. (Afstanden er også kendt som taxicab eller city-block afstand.)

For eksempel er Manhattan afstanden mellem punkterne (1, 2) og (3, 3) abs (1-3) og abs (2-3)), hvilket resulterer i 3.

Chebyshev-afstand

Chebyshev-afstanden eller maksimummetrisken tager maksimum af den absolutte forskel mellem elementerne af vektorerne. Det er en afstandsmåling, der kan repræsentere, hvordan en konge bevæger sig i skakspil eller i lagerlogistik, de operationer der kræves af en overheadkran for at flytte en kasse fra et sted til et andet.

I maskinlæring kan Chebyshev-afstanden vise sig nyttig, når du har mange dimensioner at overveje, og de fleste af dem er bare irrelevante eller overflødige (i Chebyshev vælger du bare den, hvis absolutte forskel er den største). I eksemplet anvendt ovenfor er afstanden simpelthen 2, maksimum mellem (1-3) og abs (2-3).

Måling Lighed mellem vektorer til maskinlæring - dummies

Valg af editor

Hvordan man skriver en check for en fremragende bill i QuickBooks Online - dummies

Hvordan man skriver en check for en fremragende bill i QuickBooks Online - dummies

Du kan Brug QuickBooks Online (QBO) Check vinduet til at skrive en check for at betale et faktura, du tidligere indtastede - noget, du ikke kan gøre i QuickBooks desktop produkt. Brug ikke Check-transaktionen, hvis du planlægger at betale flere regninger. Hvis du vælger en betalingsmodtager, for hvem der foreligger en udestående faktura, QBO ...

Sådan afskrives fakturaer med QuickBooks Online Accountant - dummies

Sådan afskrives fakturaer med QuickBooks Online Accountant - dummies

Vælger skrivefakturaer fra revisionsværktøjerne menuen i QBOA viser siden Skriv ud fakturaer, som giver dig mulighed for at se fakturaer, du måske vil afskrive, og derefter skrive dem til en konto efter eget valg. Øverst på siden indstiller du filtre for at få vist de fakturaer, du vil have ...

Importrevisorens ændringer til QuickBooks 2012 Datafil - dummies

Importrevisorens ændringer til QuickBooks 2012 Datafil - dummies

Din klient importerer de ændringer, som du ' har lavet i revisorens kopi af QuickBooks 2012-datafilen i hendes arbejdskopi af datafilen. For at gøre dette vælger klienten filen Arkiv → Revisorens Kopi → Klientaktiviteter → Kommandoen Import Revisorens Ændringer. QuickBooks viser dialogboksen Importer regnskabsførerens ændringer. For at bruge importkontoens ændringer ...

Valg af editor

Brug Flash med Nature Photography - dummies

Brug Flash med Nature Photography - dummies

Som regel afhænger du af naturlig belysning til naturfotografering. Du kan dog bruge flash-flash eller en ekstra flash-enhed til at øge naturlig belysning. On-flash-kamera De fleste digitale kameraer leveres med en flash på kameraet. Blitzenheden springer op, når det er nødvendigt. Du kan også aktivere flash på kameraet, når du skal tilføje en ...

Brug tredjeparts rå software til HDR fotografi - dummies

Brug tredjeparts rå software til HDR fotografi - dummies

Du kan købe eller downloade et væld af Råredigerere og konvertere fra tredjepart, der hjælper dig med at lave billeder med høj dynamisk rækkevidde. Hvis du er utilfreds med din nuværende software og vil prøve noget nyt, skal du hænde på en eller flere af de programmer, der er angivet i tabellen. Rå redaktører fra tredjepart Navn URL Platform (er) Freeware? ...

Brug dekorative accenter i mad stil og madfotografi - dummies

Brug dekorative accenter i mad stil og madfotografi - dummies

Når fødevaren alene ikke skaber Det drama eller den intrigue, du vil have i din fotografering med dekorative accenter - af farve, form eller tekstur - kan give dine billeder den ekstra effekt, du leder efter. Accenter er forbedringer af fødevarematerialet, og selvom de tjener formålet med at ophæve maden, er de ...

Valg af editor

Sådan finder du formatering i Word 2007 - dummies

Sådan finder du formatering i Word 2007 - dummies

Du kan bruge kommandoen Find til at skure dit Word 2007-dokument til formatering af oplysninger. Hvis du f.eks. Kun vil finde de forekomster af ordet, der ligger i fed skrift, kan du gøre det. Dette eksempel søger efter teksten gåseæg med en skriftstørrelse på 24 point i en ...

Hvordan man finder tekst i Word 2016 - dummies

Hvordan man finder tekst i Word 2016 - dummies

Ikke gider med båndet! For at finde tekst i dit Word 2016-dokument, tryk Ctrl + F, den mindeværdige tastaturgenvej til kommandoen Find. Du ser navigationsruden, svarende til hvad der vises her. Navigationsruden. Skriv den tekst, du vil lokalisere, i feltet Søg dokument. Når du skriver forekomster af teksten ...

Hvordan man finder stilarter i Word 2016 - dummies

Hvordan man finder stilarter i Word 2016 - dummies

Stilarter bor på Word 2016 Home-fanen navngivet Styles-gruppe, som vist her. Hvad du ser på båndet er Style Gallery, som kan udvides til en fuld menu med stilvalg. Hvor Word-stilarter lurer. Klik på dialogboksen launcher i det nederste højre hjørne af Styles-gruppen ...