Hjem Personlig finansiering Basics af K-Means og DBSCAN Clustering Models for Predictive Analytics - dummies <[SET:descriptionda]Uovervåget læring

Basics af K-Means og DBSCAN Clustering Models for Predictive Analytics - dummies <[SET:descriptionda]Uovervåget læring

Video: Auburn Coach Wife Kristi Malzahn Agrees with Match & eHarmony: Men are Jerks 2025

Video: Auburn Coach Wife Kristi Malzahn Agrees with Match & eHarmony: Men are Jerks 2025
Anonim

Uovervåget læring har mange udfordringer for prædiktiv analyse - herunder ikke at vide, hvad man kan forvente, når man kører en algoritme. Hver algoritme vil producere forskellige resultater; du vil aldrig være sikker på, om et resultat er bedre end det andet - eller om resultatet er af nogen værdi.

Når du ved, hvad resultaterne skal være, kan du tilpasse algoritmerne til at producere de ønskede resultater. I rigtige datasæt vil du ikke have denne luksus. Du skal afhænge af nogle forudgående kendskab til dataene - eller intuitionen - for at bestemme hvilke initialiseringsparametre og algoritmer der skal bruges, når du opretter din model.

I reelle uovervågede læringsopgaver er denne forudgående viden imidlertid utilgængelig, og det ønskede resultat er svært at finde. At vælge det rigtige antal klynger er nøgleproblemet. Hvis du tilfældigvis snuble over det rigtige antal klynger, vil dine data give indsigt, som du kan lave meget præcise forudsigelser. På forsiden kan gætte det forkerte antal klynger muligvis give resultater.

K-middel algoritmen er et godt valg til datasæt, der har et lille antal klynger med proportionalstørrelser og lineært adskilelige data - og du kan skala det op for at bruge algoritmen på meget store datasæt.

Tænk på lineært adskilelig data som en flok punkter i en graf, der kan adskilles ved hjælp af en lige linje. Hvis dataene ikke er lineært adskilt, skal der bruges mere avancerede versioner af K-midler - hvilket vil blive dyrere beregningsmæssigt og muligvis ikke egnet til meget store datasæt. I sin standard implementering er kompleksiteten til at beregne klyngesentre og afstande lav.

K-midler er i vid udstrækning ansat til at løse problemer med store data, fordi det er nemt at bruge, effektivt og meget skalerbart. Ikke underligt, at de fleste kommercielle leverandører bruger K-middelalgoritmen som en nøglekomponent i deres prædiktive analysepakker.

Implementeringen af ​​DBSCAN (Density-Based Spatial Clustering of Applications with Noise) i scikit-learning kræver ikke nogen brugerdefinerede initialiseringsparametre for at oprette en forekomst. Du kan tilsidesætte standardparametrene under initialisering, hvis du vil. Desværre, hvis du bruger standardparametrene, kan algoritmen ikke give en tæt match til det ønskede resultat.

DBSCAN passer bedre til datasæt, der har disproportionelle klyngestørrelser, og hvis data kan adskilles på en ikke-lineær måde.Som K-betyder, er DBSCAN skalerbar, men brug af det på meget store datasæt kræver mere hukommelse og databehandlingskraft.

Basics af K-Means og DBSCAN Clustering Models for Predictive Analytics - dummies <[SET:descriptionda]Uovervåget læring

Valg af editor

Bygg dit eget sociale fællesskab for handel - dummies

Bygg dit eget sociale fællesskab for handel - dummies

På et velproduceret forretningswebsted, du Se ofte et link til et socialt samfundsområde, hvilket også kan føre offsite til sociale medier. Dette område er hvor kundeservice og FAQs sider lever. Du kan også finde et kunde-til-kunde-fællesskab, der tilskynder deltagelse fra dem, der besøger forretningssiden. Uanset om du vælger ...

Bedste praksis til e-mailmarkedsføring - dummies

Bedste praksis til e-mailmarkedsføring - dummies

Emnet for din sociale medievirksomhed e -mails skal være om at opfylde dine kunders interesser. Du kender dine kunder bedre end nogen. Hvis de vil have opskrifter, skal du f.eks. Have en opskrift i din e-mail. Har indhold, der vedrører din virksomhed og kundens behov. Bygg på loyalitetsforslaget og lav ...

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Sælger gennem billeder og indhold, du deler på populære sociale medier, er en fantastisk måde at nå ud til kunderne. Du kan gøre mere end blot at linke til produkter - find ud af hvordan du kan tjene penge på dit oprindelige indhold, du udgiver. Du genererer indtægter på din hjemmeside og sociale medier via annoncer og links. Hvis du producerer ...

Valg af editor

Hvordan man bruger f-distributioner i Excel - dummies

Hvordan man bruger f-distributioner i Excel - dummies

F-distributioner er sandsynlighedsfordelinger i Excel, der sammenligner forholdet i variationer af prøver trukket fra forskellige populationer. Denne sammenligning giver en konklusion om, hvorvidt afvigelserne i de underliggende populationer ligner hinanden. F. DIST: Left-tailed f-distribution sandsynlighed F. DIST-funktionen returnerer den venstre-tailed sandsynlighed for at observere et forhold på to samples 'variationer så store ...

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Logaritmer og logaritmisk skalering er værktøjer, som du vil bruge i dine Excel-diagrammer, fordi de gør det muligt for dig at gøre noget meget kraftfuldt. Ved logaritmisk skalering af din værdi-akse kan du sammenligne den relative ændring (ikke den absolutte ændring) i datareserværdier. For eksempel, sig at du vil sammenligne salget ...

Sådan bruges Flash Fill in Excel 2016 - dummies

Sådan bruges Flash Fill in Excel 2016 - dummies

Excel 2016s handy Flash Fill-funktion giver dig evnen at tage en del af de data, der er indtastet i en kolonne i et regnearktabell, og indtast bare disse data i en ny tabelkolonne ved kun at bruge et par tastetryk. Serien af ​​indgange vises i den nye kolonne, bogstaveligt talt i en flash (således ...

Valg af editor

ØGe din blog med bedre indhold - dummier

ØGe din blog med bedre indhold - dummier

Som du tænker på måder at generere buzz på din blog, du kan også forbedre kvaliteten af ​​din blog ved at fokusere på dine bogføringsteknikker. Disse tip kan give dig nogle gode promoveringsideer: Skriv om aktuelle eller kontroversielle problemer. Denne ide virker som en no-brainer, men det er nemt at glemme. Betal ...

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Søgemaskineoptimering ) handler om at øge din blogs synlighed i søgemaskiner som Google. Forbedre din WordPress blogs SEO gennem smarte design valg. Antag for eksempel at du skriver et indlæg om planlægning af en superhelt fødselsdagsfest. Du vil gerne have, at posten vises i søgeresultater, når nogen skriver "superheltefødselsdagsfest" i ...

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mest WordPress mobile plug- ins for din blogs design kan tilpasses. Du tilpasser en mobil plugin til din blog ved at ændre farver og temaer, tilføje et brugerdefineret logoikon og indstille en brugerdefineret hjemmeside. Med WPtouch mobile plug-in kan du tilføje branding som supplerer din blogs design og gør det nemmere at navigere. Før du ...