Hjem Personlig finansiering Hvad Data Miners Do dummies

Hvad Data Miners Do dummies

Indholdsfortegnelse:

Video: What is Big Data and how does it work? 2025

Video: What is Big Data and how does it work? 2025
Anonim

Hvis du tænker på data som råmateriale, og de oplysninger, du kan få fra data som noget værdifuldt og relativt raffineret, kan processen med uddragning af information være sammenlignet med udvinding af metal fra malm eller ædelstene fra snavs. Sådan opstod udtrykket data mining .

Fokus på data minedrift

Data minearbejdere overvejer ikke bare data, men også håber at finde noget interessant. Hvert data-mining projekt begynder med et specifikt forretningsproblem og et mål at matche.

Som data minearbejder har du sandsynligvis ikke autoritet til at træffe endelige forretningsbeslutninger, så det er vigtigt, at du tilpasser dit arbejde til beslutningstagernes behov. Du skal forstå deres problemer, behov og præferencer, og fokusere din indsats på at give oplysninger, som understøtter gode forretningsbeslutninger.

Din egen erhvervskundskab er meget vigtig. Ledere vil ikke sidde ved siden af ​​dig, mens du arbejder, og giver feedback om relevansen af ​​dine opdagelser til deres bekymringer. Du skal bruge din egen erfaring og skat til at bedømme det for dig selv, mens du arbejder.

Forstå, hvordan data minearbejdere bruger deres tid

Det ville være dejligt, hvis data minearbejdere kunne bruge hele dagen til at lave livsforandrende opdagelser, bygge værdifulde modeller og integrere dem i hverdagens forretning. Men det er som at sige, at det ville være fantastisk, hvis sportsfolk kunne tilbringe hele dagen vinder turneringer. Det kræver en masse forberedelser at bygge op til de øjeblikkelige triumfer. Så som atleter bruger data minearbejdere meget tid på forberedelsen.

Lære at kende data-minedriftsprocessen

En god arbejdsproces hjælper dig med at få mest muligt ud af din tid, dine data og alle dine andre ressourcer. I denne bog finder du den mest populære data-mining proces, CRISP-DM. Det er en seks-fase cyklus med opdagelse og handling skabt af et konsortium af data minearbejdere fra mange brancher og en åben standard, som alle kan bruge.

Faser i CRISP-DM-processen er

  1. Forretningsforståelse

  2. Dataforståelse

  3. Dataforberedelse

  4. Modellering

  5. Evaluering

  6. Implementering (ved hjælp af modeller i dagligdags forretninger)

Hver fase har lige stor vægt på kvaliteten af ​​resultaterne og værdien til virksomheden. Men med hensyn til den nødvendige tid dominerer data forberedelsen. Databehandling tager rutinemæssigt mere tid end alle andre faser af data minedriftsprocessen kombineret.

Making models

Når målene er forstået, og dataene er ryddet op og klar til brug, kan du gøre opmærksom på at bygge prædiktive modeller.Modeller gør hvad rapporter ikke kan; de giver dig oplysninger, der understøtter handling.

En rapport kan fortælle dig, at salget er nede. Det kan ødelægge salget efter region, produkt og kanal, så du ved, hvor salget faldt, og om disse afvigelser var udbredt eller kun påvirket af bestemte områder. Men de giver dig ingen spor om hvorfor salg faldt, eller hvilke handlinger der kan hjælpe med at genoplive virksomheden.

Modeller hjælper dig med at forstå de faktorer, der påvirker salget, de handlinger, der har tendens til at øge eller formindske salget, samt de strategier og taktikker, der holder din virksomhed i gang. Det er spændende, er det ikke? Måske er det derfor, at de fleste data mindere overvejer modellering til at være den sjove del af jobbet.

Forståelse af matematiske modeller

Matematiske modeller er centrale for data mining, men hvad er de? Hvad gør de, hvordan virker de, og hvordan skabes de?

En matematisk model er ren og simpel, en ligning eller et sæt ligninger, der beskriver et forhold mellem to eller flere ting. Sådanne ligninger er stenografi for teorier om naturens og samfundets arbejde. Teorien kan understøttes af et betydeligt bevismateriale, eller det kan bare være et vildt gæt. Matematikens sprog er det samme i begge tilfælde.

Vilkår som predictive model, statistisk model, eller lineær model henviser til specifikke typer matematiske modeller, navnene afspejler den påtænkte anvendelse, formularen eller metoden til udledning en bestemt model. Disse tre eksempler er blot nogle få af mange sådanne udtryk.

Når en model er nævnt i en forretningsindstilling, er det højst sandsynligt, at en model bruges til at foretage forudsigelser. Modeller bruges til at forudsige aktiekurser, produktsalg og ledighed blandt mange andre ting.

Disse forudsigelser kan eller ikke være korrekte, men for et givet sæt værdier (kendte faktorer som disse kaldes uafhængige variabler eller indgange ) inkluderet i modellen, vil du find en veldefineret forudsigelse (også kaldet en afhængig variabel, output, eller resultat ). Matematiske modeller bruges også til andre formål i erhvervslivet, så som at beskrive de arbejdsmekanismer, der driver en bestemt proces.

I data mining skaber du modeller ved at finde mønstre i data ved hjælp af maskinindlæring eller statistiske metoder. Data minearbejdere følger ikke den samme strenge tilgang, som klassiske statistikere gør, men alle modeller er afledt af faktiske data og konsistente matematiske modelleringsteknikker. Alle data-mining modeller understøttes af et krop af beviser.

Hvorfor bruge matematiske modeller? Kunne ikke de samme forhold beskrives ved hjælp af ord? Det er muligt, men du finder visse fordele ved brug af ligninger. Disse omfatter

  • Convenience: Sammenlignet med tilsvarende beskrivelser skrevet i sætninger, er ligninger korte. Matematisk symbolik har udviklet sig specifikt med det formål at repræsentere matematiske relationer; sprog som engelsk har ikke.

  • Klarhed: Ligninger overfører ideer kort og er entydige.De er ikke underlagt forskellige fortolkninger baseret på kultur, og matematikens symbolik er et slags fælles sprog, der anvendes bredt over hele kloden.

  • Konsistens: Fordi matematiske repræsentationer er entydige, er konsekvenserne af en bestemt situation klart defineret af en matematisk model.

Sæt information til handling

En model giver kun værdi, når du bruger den i virksomheden. En model forudsigelser kan understøtte beslutningstagning på en række måder. Du kan muligvis

  • inkorporere forudsigelser i en rapport eller præsentation, der skal bruges til at træffe en bestemt beslutning.

  • Integrér modellen i et operationelt system (f.eks. Et kundeservice system) for at give real-time forudsigelser til daglig brug. (For eksempel kan du markere forsikringsanmodninger om øjeblikkelig betaling, øjeblikkelig benægtelse eller yderligere undersøgelse.)

  • Brug modellen til batch forudsigelser. (Du kan f.eks. Score den interne kundeliste for at afgøre, hvilke kunder der skal modtage et bestemt tilbud.)

Hvad Data Miners Do dummies

Valg af editor

Hvordan man behandler PHR / SPHR eksamensspørgsmål, du ikke ved - dummier

Hvordan man behandler PHR / SPHR eksamensspørgsmål, du ikke ved - dummier

Vil du uundgåeligt komme ind på et spørgsmål (eller et par) på PHR eller SPHR eksamen, hvor du simpelthen ikke vil vide svaret. Vær ikke overrasket, når du støder på en. Bliv rolig og tag ikke panik. Her er nogle strategier til at håndtere det ukendte: Stol på dit første instinkt. Prøv ikke at overtale spørgsmålet. Hvis du ...

Sammenligner PHR og SPHR-eksamenerne - dummier

Sammenligner PHR og SPHR-eksamenerne - dummier

Med den rette eksamen, enten PHR eller SPHR, har en effekt på mere end blot at gøre forberedelsesprocessen mindre stressende. Valg af den relevante test kan også påvirke dit fremtidige job og indtjeningspotentiale. Tænk på at ansøge om et HR-job på højt niveau, der kræver eksponering, erfaring og problemløsning i forretningsadministration og ...

Hvordan man håndterer svardistraherende på PHR / SPHR-eksamenerne - dummier

Hvordan man håndterer svardistraherende på PHR / SPHR-eksamenerne - dummier

Ud over de to gode svar valg, har et spørgsmål om PHR eller SPHR eksamen normalt også distraktorer. Distraktorer kan dukke op på et par forskellige steder: I spørgsmålstammen: Denne fremmede information er ikke relevant for det korrekte svar. I et af de fire svar valg: Nogle distractorer er svar baseret på ...

Valg af editor

I nogle organisationer, de operationelt anerkendte måneder tilbage en skattemåned fra en dato i Excel - dummies

I nogle organisationer, de operationelt anerkendte måneder tilbage en skattemåned fra en dato i Excel - dummies

Start ikke den 1. og slut den 30. eller 31. december. I stedet har de bestemte dage, der markerer begyndelsen og slutningen af ​​en måned. For eksempel kan du arbejde i en organisation, hvor hver skattemåned begynder den 21. og slutter den 20. ..

Roterende celledata i Excel 2007 - dummies

Roterende celledata i Excel 2007 - dummies

Brug retningsknappen på fanen Startside i Excel 2007 for at rotere data i celler. Du kan rotere data med uret, mod uret eller lodret. Brug dialogboksen Formaterceller til at indstille en mere præcis retning ved at angive antallet af grader for at rotere teksten. For at rotere celledata skal du følge disse trin: Vælg ...

Række højde og kolonne bredde i Excel 2013 - dummies

Række højde og kolonne bredde i Excel 2013 - dummies

Hver kolonne i et regneark starter med samme bredde , som er 8. 43 tegn (baseret på standard skrifttype og skriftstørrelse), medmindre du har ændret standardindstillingen. Det er cirka syv cifre og enten et stort symbol (f.eks. $) Eller to små (som decimaler og kommaer). Du kan definere standard ...

Valg af editor

Opret din første MindManager-kort - dummies

Opret din første MindManager-kort - dummies

Oprettelse af kort er hvad MindManager handler om, men at oprette et nyttigt kort kan tage lidt indsats og kreativ energi. Du vil bruge kort, der allerede er startet, kaldet skabeloner, når det er muligt. Opret dit første kort - et øvelseskort - ved at åbne dit MindManager-program og følg disse trin: 1. Klik på Learning ...

Crystal Reports 10: Forståelse af objektforbindelse og indlejring (OLE) - dummies

Crystal Reports 10: Forståelse af objektforbindelse og indlejring (OLE) - dummies

Formålet med en rapport er at præsentere databasedata for brugere i en form, der er let at forstå. Crystal Reports giver dig alle de værktøjer, du har brug for til at gøre det. Nogle gange vil du dog have en rapport, der gør mere end bare til stede databasedata. Du kan muligvis inkludere tekst fra et ord ...

Dag Trading Bitcoin versus Fiat - dummies

Dag Trading Bitcoin versus Fiat - dummies

Dagens handel handler om at købe og sælge finansielle instrumenter - som bitcoin - inden for samme handelsdag. Fiat valuta refererer til en national regering lovligt betalingsmiddel. Ved hjælp af bitcoin kan du handle på flere forskellige måder. Den mest oplagte handelsform byder bitcoins til og fra en hvilken som helst af de lokale valutaer den ...