Hjem Personlig finansiering Basics af K-Means og DBSCAN Clustering Models for Predictive Analytics - dummies <[SET:descriptionda]Uovervåget læring

Basics af K-Means og DBSCAN Clustering Models for Predictive Analytics - dummies <[SET:descriptionda]Uovervåget læring

Video: Auburn Coach Wife Kristi Malzahn Agrees with Match & eHarmony: Men are Jerks 2024

Video: Auburn Coach Wife Kristi Malzahn Agrees with Match & eHarmony: Men are Jerks 2024
Anonim

Uovervåget læring har mange udfordringer for prædiktiv analyse - herunder ikke at vide, hvad man kan forvente, når man kører en algoritme. Hver algoritme vil producere forskellige resultater; du vil aldrig være sikker på, om et resultat er bedre end det andet - eller om resultatet er af nogen værdi.

Når du ved, hvad resultaterne skal være, kan du tilpasse algoritmerne til at producere de ønskede resultater. I rigtige datasæt vil du ikke have denne luksus. Du skal afhænge af nogle forudgående kendskab til dataene - eller intuitionen - for at bestemme hvilke initialiseringsparametre og algoritmer der skal bruges, når du opretter din model.

I reelle uovervågede læringsopgaver er denne forudgående viden imidlertid utilgængelig, og det ønskede resultat er svært at finde. At vælge det rigtige antal klynger er nøgleproblemet. Hvis du tilfældigvis snuble over det rigtige antal klynger, vil dine data give indsigt, som du kan lave meget præcise forudsigelser. På forsiden kan gætte det forkerte antal klynger muligvis give resultater.

K-middel algoritmen er et godt valg til datasæt, der har et lille antal klynger med proportionalstørrelser og lineært adskilelige data - og du kan skala det op for at bruge algoritmen på meget store datasæt.

Tænk på lineært adskilelig data som en flok punkter i en graf, der kan adskilles ved hjælp af en lige linje. Hvis dataene ikke er lineært adskilt, skal der bruges mere avancerede versioner af K-midler - hvilket vil blive dyrere beregningsmæssigt og muligvis ikke egnet til meget store datasæt. I sin standard implementering er kompleksiteten til at beregne klyngesentre og afstande lav.

K-midler er i vid udstrækning ansat til at løse problemer med store data, fordi det er nemt at bruge, effektivt og meget skalerbart. Ikke underligt, at de fleste kommercielle leverandører bruger K-middelalgoritmen som en nøglekomponent i deres prædiktive analysepakker.

Implementeringen af ​​DBSCAN (Density-Based Spatial Clustering of Applications with Noise) i scikit-learning kræver ikke nogen brugerdefinerede initialiseringsparametre for at oprette en forekomst. Du kan tilsidesætte standardparametrene under initialisering, hvis du vil. Desværre, hvis du bruger standardparametrene, kan algoritmen ikke give en tæt match til det ønskede resultat.

DBSCAN passer bedre til datasæt, der har disproportionelle klyngestørrelser, og hvis data kan adskilles på en ikke-lineær måde.Som K-betyder, er DBSCAN skalerbar, men brug af det på meget store datasæt kræver mere hukommelse og databehandlingskraft.

Basics af K-Means og DBSCAN Clustering Models for Predictive Analytics - dummies <[SET:descriptionda]Uovervåget læring

Valg af editor

Test din kode med Dreamweavers webstedrapporteringsfunktioner - dummies

Test din kode med Dreamweavers webstedrapporteringsfunktioner - dummies

Hvis du har brugt Dreamweaver til bygg din mobilwebsite, du kan tjekke dit arbejde ved hjælp af Dreamweaver Site Reporting funktionerne. Det lader dig oprette en række rapporter og endda tilpasse dem til at identificere problemer med eksterne links, overflødige og tomme tags, untitled dokumenter og manglende alternativ tekst. Du kan nemt gå glip af problemer - især ...

Sådan bruger du dit eget domæne til dit Squarespace-websted - dummier

Sådan bruger du dit eget domæne til dit Squarespace-websted - dummier

Når du underskriver op for din Squarespace-konto, får du en unik Squarespace-URL, der ser sådan ud: http: // dit kontonavn. Squarespace. com. Hvis du vil have fuldstændig kontrol over branding af dit websted eller blot ønsker en unik webadresse, kan du kortlægge eller pege på et brugerdefineret domæne på din Squarespace-konto. Du har tre muligheder for indstilling ...

Fordelene ved at bruge Markdown på din Squarespace Website - dummies

Fordelene ved at bruge Markdown på din Squarespace Website - dummies

Markdown er en plain- tekst skriftformat, der gør det muligt hurtigt at anvende tekst styling baseret på hvordan du formaterer din Squarespace 6 websteds tekst. Markdown er en af ​​Du bruger to typer blokke, du kan bruge til at tilføje tekst. Du tilføjer indhold til dine Squarespace-sidesider ved at bruge indholdsblokke i Site Manager → Indhold ...

Valg af editor

Wicca og Witchcraft For Dummies Cheat Sheet - dummies

Wicca og Witchcraft For Dummies Cheat Sheet - dummies

Wicca, en heksekunst, er centreret i rituelle Wiccans udfører til specifikke formål, såsom at kommunikere med eller ære guddom. Sabbats er wiccan sol helligdage fokuseret på jordens sti omkring solen, nogle gange omtalt som Årets hjul. Esbats er wiccan månens ferie, der fokuserer på månens cyklus. ...

Sammenhængende trosretninger: almindelige erfaringer i skrifterne - dummies

Sammenhængende trosretninger: almindelige erfaringer i skrifterne - dummies

Interessant de tre Abrahams trosretninger - jødedom, kristendom , og islam - deler meget til fælles, herunder en række af ædle profeter sendt af Gud. På grund af commonality ligger en dyb forbindelse til arv fra profeten Abraham og en tro på en Gud. Koranen finder fælles sted med kristne og jøder (kendt ...

Charmerende din vej til effektiv magi - dummies

Charmerende din vej til effektiv magi - dummies

En firkløver for held. Den jakkesæt, som du altid bærer til jobsamtaler for succes. Ringen du tager aldrig af, fordi den repræsenterer din kærlighed til en anden person. Den hængende du bærer rundt om halsen hver dag for beskyttelse. Den lille statue hængende fra bilens bagspejl til sikker rejse. ...

Valg af editor

Vælger skråninger, kanter og ansigter i blender - dummies

Vælger skråninger, kanter og ansigter i blender - dummies

I Blender's Edit-tilstand, kuben ændrer farve og prikker danner i hver af kubens hjørner. Hver prik er et vertex. Linjen der dannes mellem to hjørner er en kant. Et ansigt i Blender er en polygon, der er dannet af tre eller flere forbindelseskanter. Tidligere er ansigter i Blender ...