Hjem Personlig finansiering 9 Love of data mining - dummies

9 Love of data mining - dummies

Indholdsfortegnelse:

Video: Data Science vs Machine Learning – What’s The Difference? | Data Science Course | Edureka 2024

Video: Data Science vs Machine Learning – What’s The Difference? | Data Science Course | Edureka 2024
Anonim

Hvert erhverv har sine vejledende principper, ideer, der giver struktur og vejledning i det daglige arbejde. Data minedrift er ingen undtagelse. Følgende er ni grundlæggende ideer til at guide dig som du kommer ned til arbejde og bliver en data minearbejder. Disse er de 9 lovgivninger om data minedrift, som de oprindeligt blev angivet af den banebrydende data minearbejder, Thomas Khabaza.

1. lov: Forretningsmål

Her er den 1. lov om dataminning eller "Forretningsmål": Forretningsmål er oprindelsen af ​​enhver data-minedrift løsning.

Du udforsker data for at finde oplysninger, der hjælper dig med at drive virksomheden bedre. Skal dette ikke være mantraet af alle forretningsdataanalyser? Selvfølgelig bør det! Men nybegyndere data minearbejdere fokuserer ofte på teknologi og andre detaljer, som kan være interessante, men ikke i overensstemmelse med de behov og mål, som de øverste beslutningstagere har.

Du skal udvikle en vane med at identificere forretningsmål, inden du gør noget andet, og fokusere på disse mål i hvert trin i data minedriftsprocessen. Det er vigtigt, at denne lov kommer først. Alle bør forstå, at data minedrift er en proces med et formål.

2. lov: Virksomhedskendskab

Her er 2. lov om dataminning eller "Business Knowledge Law": Forretningskendskab er centralt for alle trin i data minedrift.

Data mining giver magten til folket - forretningsfolk - der bruger deres forretningskendskab, erfaring og indsigt sammen med data-mining metoder til at finde mening i data.

Du behøver ikke være en fancy statistiker til at gøre data minedrift, men du skal vide noget om, hvad dataene betyder og hvordan virksomheden fungerer. Først når du forstår de data og det problem, du skal løse, kan data-mining-processer hjælpe dig med at finde nyttige oplysninger og sætte den i brug.

3. lov: Dataforberedelse

Her er den tredje lov om data mining, eller "Data Preparation Law": Data forberedelse er mere end halvdelen af ​​hver data minedrift proces.

Traditionelle statistikere har ofte mulighed for at indsamle nye data til at løse specifikke forskningsspørgsmål. De kan anvende strenge processer til at planlægge forsøg, udforme undersøgelsesundersøgelser eller på anden måde samle data af høj kvalitet, der er målrettet mod specifikke forskningsmål. Alligevel bruger de stadig meget tid på at rense og forberede data til analyse.

Data minearbejdere skal derimod næsten altid arbejde med, uanset hvilke data der er tilgængelige. De bruger eksisterende forretningsdokumenter, offentlige data eller de data, de kan købe.Chancerne er, at alle data blev samlet til noget andet formål end data mining, og uden nogen streng plan eller omhyggelig dataindsamlingsproces. Så data minearbejdere bruger meget tid på databehandling.

4. lov: Højre model

Her er den fjerde lov om data mining, eller "NFL-DM": Den rigtige model for en given applikation kan kun opdages ved eksperiment.

Denne lov er også kendt af stenografi NFL-DM, hvilket betyder, at der ikke er gratis frokost til data minearbejderen.

For det første, hvad er en model? Det er en ligning, der repræsenterer et mønster observeret i data. I det mindste repræsenterer det mønsteret på en grov måde. Matematiske modeller af ægte ting er aldrig perfekte! Dette er en kendsgerning i livet, og det er lige så sandt for kernefysikere som for minearbejdere.

I data mining vælges modeller gennem forsøg og fejl. Du vil eksperimentere med forskellige modeltyper.

5. lov: Mønster

Her er den 5. lov om data mining: Der er altid mønstre.

Som data minearbejder undersøger du data for at finde nyttige mønstre. Med andre ord vil du være på udkig efter meningsfulde relationer mellem variablerne i dataene. Forståelse af disse relationer giver bedre forståelse for virksomheden og bedre forudsigelser af, hvad der vil ske i fremtiden. Vigtigst er det, at forståelsesmønstre i dataene giver dig mulighed for at påvirke, hvad der vil ske i fremtiden.

Du finder altid mønstre. Dataene har altid noget at fortælle dig. Nogle gange bekræfter det, at det du har lavet er rigtigt. Det kan ikke virke spændende, men det fortæller i hvert fald dig, at du har været på rette spor. Andre dage, dataene kan fortælle dig, at din nuværende forretningspraksis ikke virker. Det er spændende, og selvom det måske ikke er behageligt på kort sigt, er det at kende sandheden et vigtigt skridt hen imod forbedring.

6. lov: Forstærkning

Her er den 6. lov om data mining eller "Insight Law": Data mining forstærker opfattelsen i virksomhedsdomænet.

Data-mining metoder gør det muligt for dig at forstå din virksomhed bedre, end du kunne have gjort uden dem. Data-mining metoder hjælper dig som en forstørrelse eller et mikroskop, hvilket gør det muligt at opdage effekter, der ville være vanskelige eller umulige at registrere gennem almindelig rapportering.

Data minedrift er ikke øjeblikkelig.

Opdagelse og læring gennem data mining er en interaktiv proces. Du vil lave opdagelser, finde ud af lidt af hver af dem og bruge det, du har opdaget, til at handle. Resultaterne af hver handling, du forsøger, vil producere flere data, og at data giver dig mulighed for at forstå noget mere. Det er en cyklus med opdagelse, og cyklussen fortsætter, så længe du fortsætter med at udforske og eksperimentere.

7. lov: Forudsigelse

Her er den 7. lov om data mining eller "Prediction Law": Prediction øger information lokalt ved generalisering.

Data mining hjælper dig med at bruge det, du ved, for at få bedre forudsigelser (eller estimater) af ting, du ikke kender. Data mining bruger data og modelleringsmetoder til at erstatte dine uformelle forventninger med datastyrede, konsekvente og mere præcise estimater.

8. lov: Værdi

Her er den 8. lov om data mining eller "Value Law": Værdien af ​​data-mining resultater er ikke bestemt af nøjagtigheden eller stabiliteten af ​​prædiktive modeller.

Data minearbejdere sætter ikke øje med teorien. Som data minearbejder kan du aldrig engang kende teorien bag de statistiske modeller, du bruger. Måske er det lige så godt, for i data minedrift vil du bruge disse modeller på måder der ikke nødvendigvis stemmer overens med teorien bag dem.

Du vil lede efter modeller, der producerer korrekte forudsigelser (og du vil bruge test, snarere end statistisk teori, til at bedømme det). Men du kan være mere bekymret over andre problemer, som om modellen gør forretningssans, oplyser dig om uventede forudsigelsesfaktorer eller er praktisk at bruge på din arbejdsplads.

9. lov: Skift

Her er den 9. lov om dataminning eller "lov om forandring": Alle mønstre kan ændres.

Verden ændrer sig altid. Modellen, der giver dig gode forudsigelser i dag, kan være ubrugelig i morgen. Dette er et faktum for alle dataanalytikere, ikke kun data minearbejdere.

9 Love of data mining - dummies

Valg af editor

Test din kode med Dreamweavers webstedrapporteringsfunktioner - dummies

Test din kode med Dreamweavers webstedrapporteringsfunktioner - dummies

Hvis du har brugt Dreamweaver til bygg din mobilwebsite, du kan tjekke dit arbejde ved hjælp af Dreamweaver Site Reporting funktionerne. Det lader dig oprette en række rapporter og endda tilpasse dem til at identificere problemer med eksterne links, overflødige og tomme tags, untitled dokumenter og manglende alternativ tekst. Du kan nemt gå glip af problemer - især ...

Sådan bruger du dit eget domæne til dit Squarespace-websted - dummier

Sådan bruger du dit eget domæne til dit Squarespace-websted - dummier

Når du underskriver op for din Squarespace-konto, får du en unik Squarespace-URL, der ser sådan ud: http: // dit kontonavn. Squarespace. com. Hvis du vil have fuldstændig kontrol over branding af dit websted eller blot ønsker en unik webadresse, kan du kortlægge eller pege på et brugerdefineret domæne på din Squarespace-konto. Du har tre muligheder for indstilling ...

Fordelene ved at bruge Markdown på din Squarespace Website - dummies

Fordelene ved at bruge Markdown på din Squarespace Website - dummies

Markdown er en plain- tekst skriftformat, der gør det muligt hurtigt at anvende tekst styling baseret på hvordan du formaterer din Squarespace 6 websteds tekst. Markdown er en af ​​Du bruger to typer blokke, du kan bruge til at tilføje tekst. Du tilføjer indhold til dine Squarespace-sidesider ved at bruge indholdsblokke i Site Manager → Indhold ...

Valg af editor

Wicca og Witchcraft For Dummies Cheat Sheet - dummies

Wicca og Witchcraft For Dummies Cheat Sheet - dummies

Wicca, en heksekunst, er centreret i rituelle Wiccans udfører til specifikke formål, såsom at kommunikere med eller ære guddom. Sabbats er wiccan sol helligdage fokuseret på jordens sti omkring solen, nogle gange omtalt som Årets hjul. Esbats er wiccan månens ferie, der fokuserer på månens cyklus. ...

Sammenhængende trosretninger: almindelige erfaringer i skrifterne - dummies

Sammenhængende trosretninger: almindelige erfaringer i skrifterne - dummies

Interessant de tre Abrahams trosretninger - jødedom, kristendom , og islam - deler meget til fælles, herunder en række af ædle profeter sendt af Gud. På grund af commonality ligger en dyb forbindelse til arv fra profeten Abraham og en tro på en Gud. Koranen finder fælles sted med kristne og jøder (kendt ...

Charmerende din vej til effektiv magi - dummies

Charmerende din vej til effektiv magi - dummies

En firkløver for held. Den jakkesæt, som du altid bærer til jobsamtaler for succes. Ringen du tager aldrig af, fordi den repræsenterer din kærlighed til en anden person. Den hængende du bærer rundt om halsen hver dag for beskyttelse. Den lille statue hængende fra bilens bagspejl til sikker rejse. ...

Valg af editor

Vælger skråninger, kanter og ansigter i blender - dummies

Vælger skråninger, kanter og ansigter i blender - dummies

I Blender's Edit-tilstand, kuben ændrer farve og prikker danner i hver af kubens hjørner. Hver prik er et vertex. Linjen der dannes mellem to hjørner er en kant. Et ansigt i Blender er en polygon, der er dannet af tre eller flere forbindelseskanter. Tidligere er ansigter i Blender ...