Hjem Personlig finansiering 9 Love of data mining - dummies

9 Love of data mining - dummies

Indholdsfortegnelse:

Video: Data Science vs Machine Learning – What’s The Difference? | Data Science Course | Edureka 2024

Video: Data Science vs Machine Learning – What’s The Difference? | Data Science Course | Edureka 2024
Anonim

Hvert erhverv har sine vejledende principper, ideer, der giver struktur og vejledning i det daglige arbejde. Data minedrift er ingen undtagelse. Følgende er ni grundlæggende ideer til at guide dig som du kommer ned til arbejde og bliver en data minearbejder. Disse er de 9 lovgivninger om data minedrift, som de oprindeligt blev angivet af den banebrydende data minearbejder, Thomas Khabaza.

1. lov: Forretningsmål

Her er den 1. lov om dataminning eller "Forretningsmål": Forretningsmål er oprindelsen af ​​enhver data-minedrift løsning.

Du udforsker data for at finde oplysninger, der hjælper dig med at drive virksomheden bedre. Skal dette ikke være mantraet af alle forretningsdataanalyser? Selvfølgelig bør det! Men nybegyndere data minearbejdere fokuserer ofte på teknologi og andre detaljer, som kan være interessante, men ikke i overensstemmelse med de behov og mål, som de øverste beslutningstagere har.

Du skal udvikle en vane med at identificere forretningsmål, inden du gør noget andet, og fokusere på disse mål i hvert trin i data minedriftsprocessen. Det er vigtigt, at denne lov kommer først. Alle bør forstå, at data minedrift er en proces med et formål.

2. lov: Virksomhedskendskab

Her er 2. lov om dataminning eller "Business Knowledge Law": Forretningskendskab er centralt for alle trin i data minedrift.

Data mining giver magten til folket - forretningsfolk - der bruger deres forretningskendskab, erfaring og indsigt sammen med data-mining metoder til at finde mening i data.

Du behøver ikke være en fancy statistiker til at gøre data minedrift, men du skal vide noget om, hvad dataene betyder og hvordan virksomheden fungerer. Først når du forstår de data og det problem, du skal løse, kan data-mining-processer hjælpe dig med at finde nyttige oplysninger og sætte den i brug.

3. lov: Dataforberedelse

Her er den tredje lov om data mining, eller "Data Preparation Law": Data forberedelse er mere end halvdelen af ​​hver data minedrift proces.

Traditionelle statistikere har ofte mulighed for at indsamle nye data til at løse specifikke forskningsspørgsmål. De kan anvende strenge processer til at planlægge forsøg, udforme undersøgelsesundersøgelser eller på anden måde samle data af høj kvalitet, der er målrettet mod specifikke forskningsmål. Alligevel bruger de stadig meget tid på at rense og forberede data til analyse.

Data minearbejdere skal derimod næsten altid arbejde med, uanset hvilke data der er tilgængelige. De bruger eksisterende forretningsdokumenter, offentlige data eller de data, de kan købe.Chancerne er, at alle data blev samlet til noget andet formål end data mining, og uden nogen streng plan eller omhyggelig dataindsamlingsproces. Så data minearbejdere bruger meget tid på databehandling.

4. lov: Højre model

Her er den fjerde lov om data mining, eller "NFL-DM": Den rigtige model for en given applikation kan kun opdages ved eksperiment.

Denne lov er også kendt af stenografi NFL-DM, hvilket betyder, at der ikke er gratis frokost til data minearbejderen.

For det første, hvad er en model? Det er en ligning, der repræsenterer et mønster observeret i data. I det mindste repræsenterer det mønsteret på en grov måde. Matematiske modeller af ægte ting er aldrig perfekte! Dette er en kendsgerning i livet, og det er lige så sandt for kernefysikere som for minearbejdere.

I data mining vælges modeller gennem forsøg og fejl. Du vil eksperimentere med forskellige modeltyper.

5. lov: Mønster

Her er den 5. lov om data mining: Der er altid mønstre.

Som data minearbejder undersøger du data for at finde nyttige mønstre. Med andre ord vil du være på udkig efter meningsfulde relationer mellem variablerne i dataene. Forståelse af disse relationer giver bedre forståelse for virksomheden og bedre forudsigelser af, hvad der vil ske i fremtiden. Vigtigst er det, at forståelsesmønstre i dataene giver dig mulighed for at påvirke, hvad der vil ske i fremtiden.

Du finder altid mønstre. Dataene har altid noget at fortælle dig. Nogle gange bekræfter det, at det du har lavet er rigtigt. Det kan ikke virke spændende, men det fortæller i hvert fald dig, at du har været på rette spor. Andre dage, dataene kan fortælle dig, at din nuværende forretningspraksis ikke virker. Det er spændende, og selvom det måske ikke er behageligt på kort sigt, er det at kende sandheden et vigtigt skridt hen imod forbedring.

6. lov: Forstærkning

Her er den 6. lov om data mining eller "Insight Law": Data mining forstærker opfattelsen i virksomhedsdomænet.

Data-mining metoder gør det muligt for dig at forstå din virksomhed bedre, end du kunne have gjort uden dem. Data-mining metoder hjælper dig som en forstørrelse eller et mikroskop, hvilket gør det muligt at opdage effekter, der ville være vanskelige eller umulige at registrere gennem almindelig rapportering.

Data minedrift er ikke øjeblikkelig.

Opdagelse og læring gennem data mining er en interaktiv proces. Du vil lave opdagelser, finde ud af lidt af hver af dem og bruge det, du har opdaget, til at handle. Resultaterne af hver handling, du forsøger, vil producere flere data, og at data giver dig mulighed for at forstå noget mere. Det er en cyklus med opdagelse, og cyklussen fortsætter, så længe du fortsætter med at udforske og eksperimentere.

7. lov: Forudsigelse

Her er den 7. lov om data mining eller "Prediction Law": Prediction øger information lokalt ved generalisering.

Data mining hjælper dig med at bruge det, du ved, for at få bedre forudsigelser (eller estimater) af ting, du ikke kender. Data mining bruger data og modelleringsmetoder til at erstatte dine uformelle forventninger med datastyrede, konsekvente og mere præcise estimater.

8. lov: Værdi

Her er den 8. lov om data mining eller "Value Law": Værdien af ​​data-mining resultater er ikke bestemt af nøjagtigheden eller stabiliteten af ​​prædiktive modeller.

Data minearbejdere sætter ikke øje med teorien. Som data minearbejder kan du aldrig engang kende teorien bag de statistiske modeller, du bruger. Måske er det lige så godt, for i data minedrift vil du bruge disse modeller på måder der ikke nødvendigvis stemmer overens med teorien bag dem.

Du vil lede efter modeller, der producerer korrekte forudsigelser (og du vil bruge test, snarere end statistisk teori, til at bedømme det). Men du kan være mere bekymret over andre problemer, som om modellen gør forretningssans, oplyser dig om uventede forudsigelsesfaktorer eller er praktisk at bruge på din arbejdsplads.

9. lov: Skift

Her er den 9. lov om dataminning eller "lov om forandring": Alle mønstre kan ændres.

Verden ændrer sig altid. Modellen, der giver dig gode forudsigelser i dag, kan være ubrugelig i morgen. Dette er et faktum for alle dataanalytikere, ikke kun data minearbejdere.

9 Love of data mining - dummies

Valg af editor

Opret en Photomerge Scene Cleaner Composite i Photoshop Elements 11 - dummies

Opret en Photomerge Scene Cleaner Composite i Photoshop Elements 11 - dummies

Photoshop Elements 11's Photomerge Scene Cleaner Det lyder som et skjult job hos CIA, hvor du bruger dine dage til at bevise på forbrydelsesscener, men det er ikke helt så spændende. Dette Photomerge-kommandoværktøj sætter dig i stand til at skabe det optimale billede ved at tillade dig at fjerne irriterende distraktioner, såsom biler, forbipasserende og så ...

Opret et online fotoalbum i Photoshop Elements 10 - dummies

Opret et online fotoalbum i Photoshop Elements 10 - dummies

, Når du klikker på Del i enten Organizer eller Fuld fotoredigeringstilstand for Photoshop Elements 10, og åbn panelet Del, finder du Online Album øverst på listen. Betegnelsen Online er en smule vildledende her, fordi du kan bruge denne delingsfunktion til både online og lokale filskabelser. Eksporter ...

Opret et smart album i Photoshop Elements 10 - dummies

Opret et smart album i Photoshop Elements 10 - dummies

Du kan udføre en søgning baseret på et antal forskellige kriterier. Funktionen Smart Album gør det muligt at gemme søgeresultaterne i et album. Når du har alle de filer, der vises i organisatoren, baseret på de søgninger, du udfører, kan du oprette et smart album som følger:

Valg af editor

Enterprise Mobile Devices and Exchange ActiveSync - dummies

Enterprise Mobile Devices and Exchange ActiveSync - dummies

Microsoft udviklede Exchange ActiveSync (EAS) som en synkroniseringsprotokol til Microsoft Exchange , men det er blevet tilpasset til at omfatte mere mobil enhedens sikkerhed og ledelsesfunktionalitet. EAS er en proprietær protokol, der er udviklet af Microsoft, og som er blevet licenseret og godkendt af leverandørerne af enhedsoperativsystemer, og er blevet en de facto-standard over ...

Enterprise Mobile Device Protection med applikationspolitikker - dummies

Enterprise Mobile Device Protection med applikationspolitikker - dummies

Applikationspolitikker beskriver, hvilke applikationer brugere har lov til at bruge, mens de får adgang virksomhedens netværk med en mobil enhed. Ansøgningspolitikker er særligt afgørende, fordi de mange applikationer, som brugere kan downloade, vokser eksponentielt. Dette øger risikoen for, at dine brugere sandsynligvis uskyldigt downloader en ondsindet program, der forårsager kaos ...

Enterprise Mobile Device Security: Carrier-Provided Voice Encryption - dummies

Enterprise Mobile Device Security: Carrier-Provided Voice Encryption - dummies

Med den udbredte adoption af mobil enheder kommer en tendens til at bruge dem til at drive missionskritisk forretning og åbne talekommunikation som en sikkerhedsvektor. Det gør de mobile enheder til et meget saftigt mål for alle vandaler derude. Og selvom der ikke har været udbredt udnyttelse af talekommunikation hidtil, kan dagen ikke ...

Valg af editor

Hvordan man skyder natportrætter på din Canon EOS 6D - dummies

Hvordan man skyder natportrætter på din Canon EOS 6D - dummies

, Når du vil oprette portrætter af emner om natten på din EOS 6D med denne tilstand, forbliver lukkeren åben lang nok til at fange detaljer i baggrunden også. Det betyder, at du skal montere dit kamera på et stativ for at kompensere for langsom lukkertid. Du skal også bruge en Canon ...

Sådan optager du billeder med HDR Backlight Control SCN-tilstand på din Canon EOS 6D - dummies

Sådan optager du billeder med HDR Backlight Control SCN-tilstand på din Canon EOS 6D - dummies

Nogle gange vil du fotografere en scene med en bred varians i toneområdet. Din EOS 6D tilbyder en løsning med HDR Backlight Control SCN-tilstand. Ellers er din Canon nødt til at gå på kompromis, og du ender med et billede, der har detaljer i mellemklassen, men mangler detaljer i skyggeområdet. Når du ...