Video: Basic Machine Learning Algorithms Overview - Data Science Crash Course Mini-series 2025
Ved Meta S. Brown
Data mining er den måde, almindelige forretningsfolk bruger en række dataanalyse teknikker til at afdække nyttige oplysninger fra data og sætte disse oplysninger i praktisk brug. Data minearbejdere er ikke bange over teori og antagelser. De validerer deres opdagelser ved test. Og de forstår, at tingene ændres, så da opdagelsen, der fungerede som en charme i går, ikke holder op i dag, tilpasser de sig.
De 9 lovgivninger om data minedrift: En referencevejledning
Banebrydende data minearbejder Thomas Khabaza udviklede sin "Ni Data Data Mining" til at guide nye data minearbejdere, som de kommer ned til arbejde. Denne referencevejledning viser dig, hvad hver af disse love betyder for dit daglige arbejde.
-
1. lov om data mining eller "forretningsmål": Forretningsmål er oprindelsen af enhver data minedrift løsning.
En data minearbejder er en person, der opdager nyttige oplysninger fra data til støtte for specifikke forretningsmål. Data mining er ikke defineret af det værktøj, du bruger.
-
2. Lov om dataminning eller "Business Knowledge Law": Forretningskendskab er centralt for alle trin i data mining processen .
Du behøver ikke være en fancy statistiker til at gøre data minedrift, men du skal vide noget om, hvad dataene betyder og hvordan virksomheden fungerer.
-
3. lov om data mining eller "databehandling lov": Data forberedelse er mere end halvdelen af hver data mining proces .
Næsten meget, vil alle data minearbejdere bruge mere tid på databehandling end på analyse.
-
4. databrugsloven, eller "Ingen gratis frokost til data minearbejderen": Den rigtige model til en given applikation kan kun opdages ved eksperiment .
I data mining vælges modeller gennem forsøg og fejl.
-
5. Lov om dataminning: Der er altid mønstre i dataene .
Som data minearbejder undersøger du data for at finde nyttige mønstre. Forståelse af mønstre i dataene giver dig mulighed for at påvirke, hvad der sker i fremtiden.
-
6. Lov om dataminning eller "Insight Law": Data mining forstærker opfattelsen i virksomhedsdomænet .
Dataudvindingsmetoder gør det muligt for dig at forstå din virksomhed bedre, end du kunne have gjort uden dem.
-
7: e Data Mining eller "Prediction Law": Prediction øger information lokalt ved generalisering.
Data mining hjælper os med at bruge det, vi ved, for at få bedre forudsigelser (eller estimater) af ting, vi ikke kender.
-
8. lov om data mining eller "værdi lov": Værdien af data mining resultater er ikke bestemt af nøjagtigheden eller stabiliteten af prædiktive modeller .
Din model skal producere gode forudsigelser konsekvent. Det er det.
-
9. lov om data mining, eller "lov om forandring": Alle mønstre kan ændres.
Enhver model, der giver dig gode forudsigelser i dag, kan være ubrugelig i morgen.
Dataudvindingsfasens faser
Den Cross-Industry Standard Process til Data Mining ( CRISP-DM ) er den dominerende data mining proces ramme. Det er en åben standard; enhver kan bruge den. Den følgende liste beskriver de forskellige faser af processen.
-
Forretningsforståelse: Få en klar forståelse af problemet, du er ude af at løse, hvordan det påvirker din organisation og dine mål for at løse det. Opgaver i denne fase omfatter:
-
Identificering af dine forretningsmål
-
Vurdering af din situation
-
Definere dine data mining mål
-
Produktion af din projektplan
-
-
Dataforståelse: Gennemgå de data, du har, dokumentere det, identificere datahåndtering og datakvalitetsproblemer. Opgaver til denne fase omfatter:
-
Gathering data
-
Beskriv
-
Udforskning
-
Verificering af kvalitet
-
-
Data forberedelse: Få dine data klar til brug til modellering. Opgaver til denne fase omfatter:
-
Valg af data
-
Rengøringsdata
-
Konstruktion
-
Integration
-
Formatering
-
-
Modellering: Brug matematiske teknikker til at identificere mønstre i dine data. Opgaver til denne fase omfatter:
-
Valg af teknikker
-
Udformning af tests
-
Byggemodeller
-
Vurdering af modeller
-
-
Evaluering: Gennemgå de mønstre, du har opdaget, og vurder deres potentiale til erhvervsmæssig brug. Opgaver til denne fase omfatter:
-
Evaluering af resultater
-
Gennemgang af processen
-
Bestemmelse af de næste trin
-
-
Implementering: Sæt dine opdagelser til arbejde i hverdagen. Opgaver til denne fase omfatter:
-
Planlægningsudvikling (dine metoder til integration af dataudvindingsopdagelser i brug)
-
Rapportering af endelige resultater
-
Gennemgang af endelige resultater
-