Video: SCP-093 Red Sea Object | euclid | portal / extradimensional scp 2025
Uanset om maskinens læringsproblem er at gætte et tal eller en klasse, Ideen bag læringsstrategien for k-Nabo-nabo (kNN) -algoritmen er altid den samme. Algoritmen finder de mest lignende observationer til den, du skal forudsige, og hvorfra du får en god intuition af det mulige svar ved at gennemsnitlige naboskabsværdierne eller ved at vælge den hyppigste svarklasse blandt dem.
Læringsstrategien i et kNN er mere som memorisering. Det er ligesom at huske, hvad svaret skal være, når spørgsmålet har visse karakteristika (baseret på omstændigheder eller tidligere eksempler) i stedet for virkelig at vide svaret, fordi du forstår spørgsmålet ved hjælp af specifikke klassifikationsregler. På en måde defineres kNN ofte som en doven algoritme, fordi der ikke sker en reel læring på træningstiden, kun dataoptagelse.
At være en doven algoritme indebærer, at kNN er ret hurtigt i træning, men meget langsomt ved forudsigelsen. (De fleste søgninger og beregninger på naboerne udføres på det tidspunkt.) Det indebærer også, at algoritmen er ret hukommelsesintensiv, fordi du skal gemme dit datasæt i hukommelsen (hvilket betyder, at der er en grænse for mulige applikationer, når beskæftiger sig med store data).
Ideelt set kan kNN gøre forskellen, når du arbejder på klassificering, og du har mange etiketter at håndtere (f.eks. Når en softwareagent posterer et mærke på et socialt netværk eller når du foreslår en salgsanbefaling). kNN kan nemt håndtere hundredvis af etiketter, mens andre læringsalgoritmer skal angive en anden model for hver etiket.
Normalt arbejder kNN naboerne for en observation efter at have brugt en måling af afstand som Euclidean (det mest almindelige valg) eller Manhattan (fungerer bedre, når du har mange overflødige funktioner i dine data). Der findes ikke absolutte regler for, hvilken afstandsmåde der er bedst at bruge. Det afhænger virkelig af den implementering, du har. Du skal også teste hver afstand som en særskilt hypotese og verificere ved krydsvalidering om, hvilken foranstaltning der fungerer bedre med det problem, du løser.