Hjem Personlig finansiering 10 Almindelige data mining fejl (som du ikke vil gøre) - dummies <[SET:descriptionda]

10 Almindelige data mining fejl (som du ikke vil gøre) - dummies <[SET:descriptionda]

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2025

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2025
Anonim

Dataudvinding sker ved forsøg og fejl, og for data minearbejdere er det kun naturligt at lave fejl. Fejl kan være værdifulde, med andre ord, i hvert fald under visse betingelser. Ikke alle fejl er skabt lige, dog. Nogle er bare bedre undgås. Den følgende liste indeholder ti sådanne fejl. Hvis du læser dem omhyggeligt og forpligter dem til hukommelse, kan du bare undgå nogle få slag på læringskurven:

  • Overvågning af datakvalitetskontrol: De fleste data minearbejdere tror at udvikle prædiktive modeller er mere sjov end at gennemgå data for kvalitetsproblemer. Men hvis du ikke opdager og korrigerer datakvalitetsproblemer, kan du ende med værdiløse forudsigelser.

  • Mangler punktet: Du har opdaget noget fascinerende! Det er rart, men hvis det ikke også er relevant for det forretningsproblemer, du sætter op for at løse, så er det slet ikke relevant. Kom tilbage på sporet.

  • At tro på, at et mønster i dataene viser et årsagssammenhæng: Du udforsker et datasæt og bemærker, at når Variabel A stiger, øges variabel B også. Dette kan forekomme, fordi Variabel A påvirker variabel B, eller fordi variabel B påvirker variabel A. På den anden side kan det være, at begge er påvirket af en anden variabel, som du ikke har overvejet. Eller det kunne være et engangssamfund. Hvem kan sige?

  • Strækninger til for langt: Antag ikke, at de forhold, du observerer i data, vil gentage sig under forskellige omstændigheder. Hvis dine data blev indsamlet i et køligt miljø, må du ikke gå ud fra, at tingene vil fungere på samme måde i en varm fabriksindstilling.

  • Væddemål på resultater, der ikke giver mening: Dataudvindingsmetoder er uformelle og er normalt ikke sikkerhedskopieret af videnskabelig metode og teori, så dine resultater har i hvert fald været bedre til at gøre forretningssans. Hvis der ikke er nogen fornuft forklaring på de resultater, du præsenterer, vil din ledelse sandsynligvis ikke tage det alvorligt, og de burde ikke.

  • At blive forelsket i en bestemt modelleringsmetode: Der findes ingen enkelt type data minedrift model, der passer til enhver situation.

  • Sæt en model i produktion uden tilstrækkelig testning: Forsæt ikke din virksomhed på en prædiktiv model, før du har testet det med holdout data og i en mindre skala i feltet.

  • Ignorerer resultater, som du ikke kan lide: Hvis du ignorerer dine data nu, kommer den tilbage en dag og siger, "Jeg fortalte dig det.

  • Dataudvinding har stor værdi, men nogle applikationer kræver stadig stringente dataindsamlingsmetoder, formel statistisk analyse og videnskabelig metode. Forudsat at traditionelle dataanalyseteknikker ikke længere betyder noget:

  • Se forrige punktum.

10 Almindelige data mining fejl (som du ikke vil gøre) - dummies <[SET:descriptionda]

Valg af editor

Bygg dit eget sociale fællesskab for handel - dummies

Bygg dit eget sociale fællesskab for handel - dummies

På et velproduceret forretningswebsted, du Se ofte et link til et socialt samfundsområde, hvilket også kan føre offsite til sociale medier. Dette område er hvor kundeservice og FAQs sider lever. Du kan også finde et kunde-til-kunde-fællesskab, der tilskynder deltagelse fra dem, der besøger forretningssiden. Uanset om du vælger ...

Bedste praksis til e-mailmarkedsføring - dummies

Bedste praksis til e-mailmarkedsføring - dummies

Emnet for din sociale medievirksomhed e -mails skal være om at opfylde dine kunders interesser. Du kender dine kunder bedre end nogen. Hvis de vil have opskrifter, skal du f.eks. Have en opskrift i din e-mail. Har indhold, der vedrører din virksomhed og kundens behov. Bygg på loyalitetsforslaget og lav ...

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Sælger gennem billeder og indhold, du deler på populære sociale medier, er en fantastisk måde at nå ud til kunderne. Du kan gøre mere end blot at linke til produkter - find ud af hvordan du kan tjene penge på dit oprindelige indhold, du udgiver. Du genererer indtægter på din hjemmeside og sociale medier via annoncer og links. Hvis du producerer ...

Valg af editor

Hvordan man bruger f-distributioner i Excel - dummies

Hvordan man bruger f-distributioner i Excel - dummies

F-distributioner er sandsynlighedsfordelinger i Excel, der sammenligner forholdet i variationer af prøver trukket fra forskellige populationer. Denne sammenligning giver en konklusion om, hvorvidt afvigelserne i de underliggende populationer ligner hinanden. F. DIST: Left-tailed f-distribution sandsynlighed F. DIST-funktionen returnerer den venstre-tailed sandsynlighed for at observere et forhold på to samples 'variationer så store ...

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Logaritmer og logaritmisk skalering er værktøjer, som du vil bruge i dine Excel-diagrammer, fordi de gør det muligt for dig at gøre noget meget kraftfuldt. Ved logaritmisk skalering af din værdi-akse kan du sammenligne den relative ændring (ikke den absolutte ændring) i datareserværdier. For eksempel, sig at du vil sammenligne salget ...

Sådan bruges Flash Fill in Excel 2016 - dummies

Sådan bruges Flash Fill in Excel 2016 - dummies

Excel 2016s handy Flash Fill-funktion giver dig evnen at tage en del af de data, der er indtastet i en kolonne i et regnearktabell, og indtast bare disse data i en ny tabelkolonne ved kun at bruge et par tastetryk. Serien af ​​indgange vises i den nye kolonne, bogstaveligt talt i en flash (således ...

Valg af editor

ØGe din blog med bedre indhold - dummier

ØGe din blog med bedre indhold - dummier

Som du tænker på måder at generere buzz på din blog, du kan også forbedre kvaliteten af ​​din blog ved at fokusere på dine bogføringsteknikker. Disse tip kan give dig nogle gode promoveringsideer: Skriv om aktuelle eller kontroversielle problemer. Denne ide virker som en no-brainer, men det er nemt at glemme. Betal ...

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Søgemaskineoptimering ) handler om at øge din blogs synlighed i søgemaskiner som Google. Forbedre din WordPress blogs SEO gennem smarte design valg. Antag for eksempel at du skriver et indlæg om planlægning af en superhelt fødselsdagsfest. Du vil gerne have, at posten vises i søgeresultater, når nogen skriver "superheltefødselsdagsfest" i ...

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mest WordPress mobile plug- ins for din blogs design kan tilpasses. Du tilpasser en mobil plugin til din blog ved at ændre farver og temaer, tilføje et brugerdefineret logoikon og indstille en brugerdefineret hjemmeside. Med WPtouch mobile plug-in kan du tilføje branding som supplerer din blogs design og gør det nemmere at navigere. Før du ...