Indholdsfortegnelse:
- 1. lov: Forretningsmål
- 2. lov: Virksomhedskendskab
- 3. lov: Dataforberedelse
- 4. lov: Højre model
- 5. lov: Mønster
- 6. lov: Forstærkning
- 7. lov: Forudsigelse
- 8. lov: Værdi
- 9. lov: Skift
Video: Data Science vs Machine Learning – What’s The Difference? | Data Science Course | Edureka 2024
Hvert erhverv har sine vejledende principper, ideer, der giver struktur og vejledning i det daglige arbejde. Data minedrift er ingen undtagelse. Følgende er ni grundlæggende ideer til at guide dig som du kommer ned til arbejde og bliver en data minearbejder. Disse er de 9 lovgivninger om data minedrift, som de oprindeligt blev angivet af den banebrydende data minearbejder, Thomas Khabaza.
1. lov: Forretningsmål
Her er den 1. lov om dataminning eller "Forretningsmål": Forretningsmål er oprindelsen af enhver data-minedrift løsning.
Du udforsker data for at finde oplysninger, der hjælper dig med at drive virksomheden bedre. Skal dette ikke være mantraet af alle forretningsdataanalyser? Selvfølgelig bør det! Men nybegyndere data minearbejdere fokuserer ofte på teknologi og andre detaljer, som kan være interessante, men ikke i overensstemmelse med de behov og mål, som de øverste beslutningstagere har.
Du skal udvikle en vane med at identificere forretningsmål, inden du gør noget andet, og fokusere på disse mål i hvert trin i data minedriftsprocessen. Det er vigtigt, at denne lov kommer først. Alle bør forstå, at data minedrift er en proces med et formål.
2. lov: Virksomhedskendskab
Her er 2. lov om dataminning eller "Business Knowledge Law": Forretningskendskab er centralt for alle trin i data minedrift.
Data mining giver magten til folket - forretningsfolk - der bruger deres forretningskendskab, erfaring og indsigt sammen med data-mining metoder til at finde mening i data.
Du behøver ikke være en fancy statistiker til at gøre data minedrift, men du skal vide noget om, hvad dataene betyder og hvordan virksomheden fungerer. Først når du forstår de data og det problem, du skal løse, kan data-mining-processer hjælpe dig med at finde nyttige oplysninger og sætte den i brug.
3. lov: Dataforberedelse
Her er den tredje lov om data mining, eller "Data Preparation Law": Data forberedelse er mere end halvdelen af hver data minedrift proces.
Traditionelle statistikere har ofte mulighed for at indsamle nye data til at løse specifikke forskningsspørgsmål. De kan anvende strenge processer til at planlægge forsøg, udforme undersøgelsesundersøgelser eller på anden måde samle data af høj kvalitet, der er målrettet mod specifikke forskningsmål. Alligevel bruger de stadig meget tid på at rense og forberede data til analyse.
Data minearbejdere skal derimod næsten altid arbejde med, uanset hvilke data der er tilgængelige. De bruger eksisterende forretningsdokumenter, offentlige data eller de data, de kan købe.Chancerne er, at alle data blev samlet til noget andet formål end data mining, og uden nogen streng plan eller omhyggelig dataindsamlingsproces. Så data minearbejdere bruger meget tid på databehandling.
4. lov: Højre model
Her er den fjerde lov om data mining, eller "NFL-DM": Den rigtige model for en given applikation kan kun opdages ved eksperiment.
Denne lov er også kendt af stenografi NFL-DM, hvilket betyder, at der ikke er gratis frokost til data minearbejderen.
For det første, hvad er en model? Det er en ligning, der repræsenterer et mønster observeret i data. I det mindste repræsenterer det mønsteret på en grov måde. Matematiske modeller af ægte ting er aldrig perfekte! Dette er en kendsgerning i livet, og det er lige så sandt for kernefysikere som for minearbejdere.
I data mining vælges modeller gennem forsøg og fejl. Du vil eksperimentere med forskellige modeltyper.
5. lov: Mønster
Her er den 5. lov om data mining: Der er altid mønstre.
Som data minearbejder undersøger du data for at finde nyttige mønstre. Med andre ord vil du være på udkig efter meningsfulde relationer mellem variablerne i dataene. Forståelse af disse relationer giver bedre forståelse for virksomheden og bedre forudsigelser af, hvad der vil ske i fremtiden. Vigtigst er det, at forståelsesmønstre i dataene giver dig mulighed for at påvirke, hvad der vil ske i fremtiden.
Du finder altid mønstre. Dataene har altid noget at fortælle dig. Nogle gange bekræfter det, at det du har lavet er rigtigt. Det kan ikke virke spændende, men det fortæller i hvert fald dig, at du har været på rette spor. Andre dage, dataene kan fortælle dig, at din nuværende forretningspraksis ikke virker. Det er spændende, og selvom det måske ikke er behageligt på kort sigt, er det at kende sandheden et vigtigt skridt hen imod forbedring.
6. lov: Forstærkning
Her er den 6. lov om data mining eller "Insight Law": Data mining forstærker opfattelsen i virksomhedsdomænet.
Data-mining metoder gør det muligt for dig at forstå din virksomhed bedre, end du kunne have gjort uden dem. Data-mining metoder hjælper dig som en forstørrelse eller et mikroskop, hvilket gør det muligt at opdage effekter, der ville være vanskelige eller umulige at registrere gennem almindelig rapportering.
Data minedrift er ikke øjeblikkelig.
Opdagelse og læring gennem data mining er en interaktiv proces. Du vil lave opdagelser, finde ud af lidt af hver af dem og bruge det, du har opdaget, til at handle. Resultaterne af hver handling, du forsøger, vil producere flere data, og at data giver dig mulighed for at forstå noget mere. Det er en cyklus med opdagelse, og cyklussen fortsætter, så længe du fortsætter med at udforske og eksperimentere.
7. lov: Forudsigelse
Her er den 7. lov om data mining eller "Prediction Law": Prediction øger information lokalt ved generalisering.
Data mining hjælper dig med at bruge det, du ved, for at få bedre forudsigelser (eller estimater) af ting, du ikke kender. Data mining bruger data og modelleringsmetoder til at erstatte dine uformelle forventninger med datastyrede, konsekvente og mere præcise estimater.
8. lov: Værdi
Her er den 8. lov om data mining eller "Value Law": Værdien af data-mining resultater er ikke bestemt af nøjagtigheden eller stabiliteten af prædiktive modeller.
Data minearbejdere sætter ikke øje med teorien. Som data minearbejder kan du aldrig engang kende teorien bag de statistiske modeller, du bruger. Måske er det lige så godt, for i data minedrift vil du bruge disse modeller på måder der ikke nødvendigvis stemmer overens med teorien bag dem.
Du vil lede efter modeller, der producerer korrekte forudsigelser (og du vil bruge test, snarere end statistisk teori, til at bedømme det). Men du kan være mere bekymret over andre problemer, som om modellen gør forretningssans, oplyser dig om uventede forudsigelsesfaktorer eller er praktisk at bruge på din arbejdsplads.
9. lov: Skift
Her er den 9. lov om dataminning eller "lov om forandring": Alle mønstre kan ændres.
Verden ændrer sig altid. Modellen, der giver dig gode forudsigelser i dag, kan være ubrugelig i morgen. Dette er et faktum for alle dataanalytikere, ikke kun data minearbejdere.