Hjem Personlig finansiering Data mining - dummies

Data mining - dummies

Indholdsfortegnelse:

Video: Data Mining: How You're Revealing More Than You Think 2025

Video: Data Mining: How You're Revealing More Than You Think 2025
Anonim

Kendetegnende for data mining, sammenlignet med forespørgsel, rapportering eller endog OLAP, er det, at du kan få oplysninger uden at skulle stille bestemte spørgsmål.

Data minedrift tjener to primære roller i din business intelligence mission:

  • "Fortæl mig hvad der kan ske" rolle: Data minedriftens første rolle er forudsigende, hvor du grundlæggende siger "Fortæl mig hvad kan ske. "Ved hjælp af skjult viden, der er låst væk i dit datalager, bliver sandsynlighederne og sandsynligheden for fremtidige tendenser og hændelser frarådet og præsenteret for dig.

  • Den "Fortæl mig noget interessant" rolle: Ud over mulige fremtidige begivenheder og begivenheder forsøger data mining også at udtrække interessante oplysninger, som du sikkert bør vide om, som f.eks. En særlig usædvanligt forhold mellem salg af to forskellige produkter og hvordan forholdet varierer alt efter placering i dine butikker.

    Selvom mange af disse interessante snesider sandsynligvis vil eksistere, hvilke spørgsmål vil du spørge, hvis du bruger et forespørgsels- eller OLAP-værktøj, og hvordan vil du fortolke resultaterne? Data mining hjælper dig i denne vanskelige opgave at finde ud af, hvilke spørgsmål der skal stilles ved at gøre meget af det grunne arbejde for dig.

Registrering af svig

Bestemmelse af effektiviteten af ​​marketingprogrammet

  • Valg af hvem, fra en stor kundebase eller den generelle befolkning, skal du målrette dig som en del af et marketingprogram

  • Administrere kundens livscyklus, herunder kundens tilbageholdelsesmission

  • Udførelse af avanceret forretningsmodellering og what-if-scenarier

    Tænk på, hvad der ligger bag hver af forretningsmissionerne i den foregående liste:
  • En stor mængde data

En endnu større antal kombinationer af forskellige datatyper

  • Analyser af intensive resultater, der normalt involverer komplekse algoritmer og avancerede statistiske teknikker

  • Tænk nu på, hvad du skal gøre, hvis du bruger et rapporterings- eller OLAP-værktøj til at udføre disse missioner. Du ville finde det næsten umuligt at udføre nogen af ​​de foregående missioner grundigt, hvis du skulle stille et spørgsmål og få et resultat, stille et andet spørgsmål og få et andet resultat, og gentag derefter disse trin.

  • Dataudvinding og kunstig intelligens

Hvis du har været i IT-feltet i mindst et årti, kan nogle af de foregående udtryk lyde svagt bekendt.Låse op for skjult viden? Prediktiv funktionalitet? Vent et øjeblik - det er kunstig intelligens!

Fra de tidligste dage af kommerciel beregning har der været en stor interesse i at udvikle "tænkningsmaskiner", som kan behandle store mængder data og træffe beslutninger baseret på denne analyse.

Interessen for kunstig intelligens (AI) ramte sin genialitet i midten af ​​1980'erne. På det tidspunkt arbejdede databaseleverandører med at producere Knowledge Base Management Systems (KBMS'er); Andre leverandører kom ud med

ekspertsystemskaller, eller AI-baserede applikationsudviklingsrammer, der anvendte teknikker som forward-chaining og back-chaining til at rådgive brugerne om beslutninger; og neurale netværk blev placeret som den næste store AI-udvikling. Interesse i AI faldt i begyndelsen af ​​1990'erne, da forventningerne oversteg tilgængelige kapaciteter og andre frenzier, som f.eks. Klient / server migration og (selvfølgelig) datalagring, tog det centrale stadium. Nu er AI tilbage!

Den højest profilerede AI-teknik, der anvendes til data mining, er neurale netværk. Neurale net blev oprindeligt forestillet som en behandlingsmodel, som ville efterligne den måde, den menneskelige hjerne løser problemer ved hjælp af neuroner og meget parallel behandling for at gøre mønsterløsning.

Anvendelse af neurale netværksalgoritmer til de områder af business intelligence, som data mining håndterer (igen, forudsigende og "fortæl mig noget interessant" missioner) synes at være en naturlig kamp.

Selvom data mining / neurale netværk spil er absolut værd at checke ind, bør du gøre det omhyggeligt. Du kan finde en masse interessante og spændende teknologier, der i hænderne på dem, som ikke forstår algoritmerne, sandsynligvis vil mislykkes.

Med den rette viden og uddannelse kan du dog gøre en stor forpligtelse til at bringe denne type forarbejdning til din business intelligence-ramme som den tekniske analyse parring til OLAP-fokuseret forretningsanalyse.

Data minedrift og statistikker

Det mere modne område med data mining er anvendelsen af ​​avancerede statistiske teknikker mod de store datamængder i dit datalager. Forskellige værktøjer bruger forskellige typer af statistiske teknikker, der er skræddersyet til de specifikke områder, de forsøger at adressere.

Uden en statistisk baggrund kan du finde meget af datagruber forvirrende. Du skal gøre en masse arbejde for at træne algoritmerne og opbygge reglerne for at sikre korrekte resultater med større datasæt. Men hvis du antager at du er komfortabel med dette koncept eller har en kollega der kan hjælpe, her er nogle af de mere udbredte algoritmer:

Klassifikationsalgoritmer:

Forudsig en eller flere diskrete variabler baseret på den anden attributter i datasættet. Ved at bruge klassifikationsalgoritmer kan dataudvindingsværktøjet se på store mængder data og informere dig om, at for eksempel "kunder, der bevares gennem mindst to generationer af produktkøb, har tendens til at have disse egenskaber: de har en indkomst på mindst $ 75, 000, og de ejer deres eget hjem."

  • Regressionsalgoritmer: Forudsig en eller flere kontinuerlige variabler, såsom fortjeneste eller tab baseret på andre attributter i datasættet. Regressionsalgoritmer drives af historiske oplysninger, der præsenteres for data minedeværktøjet "over tid", bedre kendt som

  • tidsserier information. Segmenteringsalgoritmer: Delt data i grupper eller klynger af elementer, der har lignende egenskaber.

  • Associeringsalgoritmer: Find korrelationer mellem forskellige attributter i et datasæt. Den mest almindelige anvendelse af denne slags algoritme skaber associeringsregler, som du kan bruge i en markedskurvanalyse. Bemærk, at hvis en kunde køber en bestemt softwarepakke, har han eller hun 65 procent chance for at købe mindst to produktspecifikke add-on-pakker inden for to uger.

  • Sekvensanalysalgoritmer: Sammendrag hyppige sekvenser eller episoder i data, såsom en web-path-strøm.

  • Der findes mange flere metoder. Støv den gamle statistikbog ud og begynd at læse.

Data mining - dummies

Valg af editor

Sådan tager du et portræt ved brug af kort belysning - dummier

Sådan tager du et portræt ved brug af kort belysning - dummier

Når du bruger kort belysning, skal du dreje dit motivs hoved, så hans eller hendes ansigt ikke stirrer direkte ind i kameraet. Den vigtigste lyskilde i kort belysning kommer fra den side af ansigtet rettet væk fra kameraet. Nogle gange betegnes smal belysning, er kort belysning en værdifuld belysning ...

Sådan får du bedre feriebilleder - dummies

Sådan får du bedre feriebilleder - dummies

Et par enkle tricks og retningslinjer kan forbedre dine feriebilleder eller lave dine rejsebilleder er mere unikke. Når du rejser med dit digitalkamera, vil du jo tage billeder, der fortæller historien om din rejse, enten at dele dine oplevelser med andre eller at bringe dine egne minder tilbage fra ...

Hvordan man tager digitale billeder i tidlig morgen eller sent på eftermiddagen - dummies

Hvordan man tager digitale billeder i tidlig morgen eller sent på eftermiddagen - dummies

Tiden af dagen påvirker, hvordan du kan tage billeder med dit digitalkamera. Den tidlige morgen og den sene eftermiddags sol kræver en vis tilgang til billedoptagelse. Morgen og eftermiddagssol er nær horisonten og skaber fotografiske skygger, du kan drage fordel af.

Valg af editor

Elektronik: 555 Timer som en Astable Multivibrator - Dummies

Elektronik: 555 Timer som en Astable Multivibrator - Dummies

555 Kan opføre sig som en astabil multivibrator eller oscillator. Ved at forbinde komponenter til chippen i din elektronik, kan du konfigurere 555 til at producere en kontinuerlig serie af spændingsimpulser, som automatisk veksler mellem lavt (0 volt) og højt (den positive forsyningsspænding, VCC). Du kan beregne de lave og høje tidsintervaller ...

Elektronisk projektplan Trin 3: Prototype dine kredsløbsdummier

Elektronisk projektplan Trin 3: Prototype dine kredsløbsdummier

Inden du forpligter dit elektroniske kredsløb til en permanent printkort, vil du gerne sørge for at det virker. Den nemmeste måde at gøre det på er at opbygge kredsløbet på et loddefrit brødbræt. Det loddefrie brødbræt giver dig mulighed for hurtigt at samle komponenterne i dit kredsløb uden at lodde noget. I stedet skubber du bare baren ...

Elektronisk projektplan Trin 2: Design kretsdummierne

Elektronisk projektplan Trin 2: Design kretsdummierne

, Når du har en ide om en elektronisk projekt, det næste skridt er at designe et kredsløb, som opfylder projektets behov. I første omgang finder du det meget svært at designe dine egne kredsløb, så du kan vende dig til bøger eller til internettet for at finde andres kredsløbsdesign. Med en smule Google ...

Valg af editor

Læge assistent eksamen praksis sundhed vedligeholdelse og medicinsk etik spørgsmål - dummies

Læge assistent eksamen praksis sundhed vedligeholdelse og medicinsk etik spørgsmål - dummies

Disse praksis spørgsmål er ens til de egentlige spørgsmål, du måtte se på den lægeassistenteksamen (PANCE) eksamen, der har at gøre med forebyggende medicin, epidemiologi, vold i hjemmet og etik. Eksempel PANCE Spørgsmål Du ser en 19-årig kvinde, der har været seksuelt aktiv i de sidste to år. Du bruger meget af kontoret ...

Lægeassistenteksamen Øvelsesspørgsmål om fordøjelsessystemet - dummies

Lægeassistenteksamen Øvelsesspørgsmål om fordøjelsessystemet - dummies

En masse patologi vedrører fordøjelseskanalen system og du kan satse der vil være spørgsmål om dem på Lægeassistenteksamen (kendt som PANCE). Her er nogle livlige spørgsmål om GI-systemet. Eksempel PANCE Spørgsmål Hvilket af følgende udsagn angående tyktarmscancer screening er korrekt? ? (A) Efter alderen af ​​...

Lægeassistenteksamen: skulderfrakturer - dummies

Lægeassistenteksamen: skulderfrakturer - dummies

Stort set alle ved, hvordan det er at gøre ondt i skulderen eller overdelen arm, så det er vigtigt at kende til lægeassistenteksamen (PANCE). At gøre meget af noget kan være svært, især hvis smerten eller skaden påvirker den dominerende arm. Du bør vide om forskellige forskydninger af skulder og overarm, nemlig ...