Hjem Personlig finansiering Hvad Data Miners Do dummies

Hvad Data Miners Do dummies

Indholdsfortegnelse:

Video: What is Big Data and how does it work? 2024

Video: What is Big Data and how does it work? 2024
Anonim

Hvis du tænker på data som råmateriale, og de oplysninger, du kan få fra data som noget værdifuldt og relativt raffineret, kan processen med uddragning af information være sammenlignet med udvinding af metal fra malm eller ædelstene fra snavs. Sådan opstod udtrykket data mining .

Fokus på data minedrift

Data minearbejdere overvejer ikke bare data, men også håber at finde noget interessant. Hvert data-mining projekt begynder med et specifikt forretningsproblem og et mål at matche.

Som data minearbejder har du sandsynligvis ikke autoritet til at træffe endelige forretningsbeslutninger, så det er vigtigt, at du tilpasser dit arbejde til beslutningstagernes behov. Du skal forstå deres problemer, behov og præferencer, og fokusere din indsats på at give oplysninger, som understøtter gode forretningsbeslutninger.

Din egen erhvervskundskab er meget vigtig. Ledere vil ikke sidde ved siden af ​​dig, mens du arbejder, og giver feedback om relevansen af ​​dine opdagelser til deres bekymringer. Du skal bruge din egen erfaring og skat til at bedømme det for dig selv, mens du arbejder.

Forstå, hvordan data minearbejdere bruger deres tid

Det ville være dejligt, hvis data minearbejdere kunne bruge hele dagen til at lave livsforandrende opdagelser, bygge værdifulde modeller og integrere dem i hverdagens forretning. Men det er som at sige, at det ville være fantastisk, hvis sportsfolk kunne tilbringe hele dagen vinder turneringer. Det kræver en masse forberedelser at bygge op til de øjeblikkelige triumfer. Så som atleter bruger data minearbejdere meget tid på forberedelsen.

Lære at kende data-minedriftsprocessen

En god arbejdsproces hjælper dig med at få mest muligt ud af din tid, dine data og alle dine andre ressourcer. I denne bog finder du den mest populære data-mining proces, CRISP-DM. Det er en seks-fase cyklus med opdagelse og handling skabt af et konsortium af data minearbejdere fra mange brancher og en åben standard, som alle kan bruge.

Faser i CRISP-DM-processen er

  1. Forretningsforståelse

  2. Dataforståelse

  3. Dataforberedelse

  4. Modellering

  5. Evaluering

  6. Implementering (ved hjælp af modeller i dagligdags forretninger)

Hver fase har lige stor vægt på kvaliteten af ​​resultaterne og værdien til virksomheden. Men med hensyn til den nødvendige tid dominerer data forberedelsen. Databehandling tager rutinemæssigt mere tid end alle andre faser af data minedriftsprocessen kombineret.

Making models

Når målene er forstået, og dataene er ryddet op og klar til brug, kan du gøre opmærksom på at bygge prædiktive modeller.Modeller gør hvad rapporter ikke kan; de giver dig oplysninger, der understøtter handling.

En rapport kan fortælle dig, at salget er nede. Det kan ødelægge salget efter region, produkt og kanal, så du ved, hvor salget faldt, og om disse afvigelser var udbredt eller kun påvirket af bestemte områder. Men de giver dig ingen spor om hvorfor salg faldt, eller hvilke handlinger der kan hjælpe med at genoplive virksomheden.

Modeller hjælper dig med at forstå de faktorer, der påvirker salget, de handlinger, der har tendens til at øge eller formindske salget, samt de strategier og taktikker, der holder din virksomhed i gang. Det er spændende, er det ikke? Måske er det derfor, at de fleste data mindere overvejer modellering til at være den sjove del af jobbet.

Forståelse af matematiske modeller

Matematiske modeller er centrale for data mining, men hvad er de? Hvad gør de, hvordan virker de, og hvordan skabes de?

En matematisk model er ren og simpel, en ligning eller et sæt ligninger, der beskriver et forhold mellem to eller flere ting. Sådanne ligninger er stenografi for teorier om naturens og samfundets arbejde. Teorien kan understøttes af et betydeligt bevismateriale, eller det kan bare være et vildt gæt. Matematikens sprog er det samme i begge tilfælde.

Vilkår som predictive model, statistisk model, eller lineær model henviser til specifikke typer matematiske modeller, navnene afspejler den påtænkte anvendelse, formularen eller metoden til udledning en bestemt model. Disse tre eksempler er blot nogle få af mange sådanne udtryk.

Når en model er nævnt i en forretningsindstilling, er det højst sandsynligt, at en model bruges til at foretage forudsigelser. Modeller bruges til at forudsige aktiekurser, produktsalg og ledighed blandt mange andre ting.

Disse forudsigelser kan eller ikke være korrekte, men for et givet sæt værdier (kendte faktorer som disse kaldes uafhængige variabler eller indgange ) inkluderet i modellen, vil du find en veldefineret forudsigelse (også kaldet en afhængig variabel, output, eller resultat ). Matematiske modeller bruges også til andre formål i erhvervslivet, så som at beskrive de arbejdsmekanismer, der driver en bestemt proces.

I data mining skaber du modeller ved at finde mønstre i data ved hjælp af maskinindlæring eller statistiske metoder. Data minearbejdere følger ikke den samme strenge tilgang, som klassiske statistikere gør, men alle modeller er afledt af faktiske data og konsistente matematiske modelleringsteknikker. Alle data-mining modeller understøttes af et krop af beviser.

Hvorfor bruge matematiske modeller? Kunne ikke de samme forhold beskrives ved hjælp af ord? Det er muligt, men du finder visse fordele ved brug af ligninger. Disse omfatter

  • Convenience: Sammenlignet med tilsvarende beskrivelser skrevet i sætninger, er ligninger korte. Matematisk symbolik har udviklet sig specifikt med det formål at repræsentere matematiske relationer; sprog som engelsk har ikke.

  • Klarhed: Ligninger overfører ideer kort og er entydige.De er ikke underlagt forskellige fortolkninger baseret på kultur, og matematikens symbolik er et slags fælles sprog, der anvendes bredt over hele kloden.

  • Konsistens: Fordi matematiske repræsentationer er entydige, er konsekvenserne af en bestemt situation klart defineret af en matematisk model.

Sæt information til handling

En model giver kun værdi, når du bruger den i virksomheden. En model forudsigelser kan understøtte beslutningstagning på en række måder. Du kan muligvis

  • inkorporere forudsigelser i en rapport eller præsentation, der skal bruges til at træffe en bestemt beslutning.

  • Integrér modellen i et operationelt system (f.eks. Et kundeservice system) for at give real-time forudsigelser til daglig brug. (For eksempel kan du markere forsikringsanmodninger om øjeblikkelig betaling, øjeblikkelig benægtelse eller yderligere undersøgelse.)

  • Brug modellen til batch forudsigelser. (Du kan f.eks. Score den interne kundeliste for at afgøre, hvilke kunder der skal modtage et bestemt tilbud.)

Hvad Data Miners Do dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...