Hjem Personlig finansiering Visualisering af din prædiktive models analytiske resultater

Visualisering af din prædiktive models analytiske resultater

Indholdsfortegnelse:

Video: Leap Motion SDK 2025

Video: Leap Motion SDK 2025
Anonim

Ofte skal du kunne vise resultaterne af din prædiktive analyse til dem, der betyder noget. Her er nogle måder at bruge visualiseringsteknikker til at rapportere resultaterne af dine modeller til interessenterne.

Visualisering af skjulte grupperinger i dine data

Dataklyngning er processen med at opdage skjulte grupper af relaterede emner inden for dine data. I de fleste tilfælde består en klynge (gruppering) af dataobjekter af samme type som brugere af sociale netværk, tekstdokumenter eller e-mails. En måde at visualisere resultaterne af en dataklyngningsmodel på er vist nedenfor, hvor grafen repræsenterer samfund (klynger), der blev opdaget i data indsamlet fra brugere af sociale netværk.

Oplysningerne om kunder blev samlet i et tabelformat; så blev der anvendt en klyngalgoritme til dataene, og de tre klynger (grupper) blev opdaget: loyale kunder, vandrende kunder og rabatkunder. Antag at X- og Y-aksen repræsenterer de to hovedkomponenter, der genereres af de oprindelige data. Hovedkomponentanalyse (PCA) er en datareduktionsteknik.

Clustering kunder i tre grupper: loyale, vandrende og rabat.

Her viser det visuelle forhold mellem de tre grupper allerede, hvor forbedrede og målrettede marketingindsatser kan gøre det bedste.

Visualisering af dataklassifikationsresultater

En klassifikationsmodel tildeler en bestemt klasse til hvert nyt datapunkt, den undersøger. De specifikke klasser, i dette tilfælde, kan være de grupper, der er resultatet af dit klyngearbejde. Udgangen fremhævet i grafen kan definere dine målsæt. For en given ny kunde forsøger en prædiktiv klassifikationsmodel at forudsige, hvilken gruppe den nye kunde vil tilhøre.

Når du har anvendt en klyngningsalgoritme og opdagede grupperinger i kundedataene, kommer du et øjeblik af sandhed: Her kommer en ny kunde - du vil have modellen til at forudsige hvilken type kunde han eller hun vil være

Billedet viser, hvordan en ny kundes oplysninger bliver fodret til din forudsigelsesanalysemodel, hvilket igen forudsiger, hvilken gruppe kunder denne nye kunde tilhører. Nye kunder A, B og C skal tildeles til klynger efter klassificeringsmodellen. Anvendelse af klassifikationsmodellen resulterede i en forudsigelse af, at kunde A ville tilhøre de loyale kunder, kunde kunde b være en vandrer, og kunde c viste kun for rabatten.

Tildele kunderne A, B og C, til deres klassifikationer (klynger).

Visualisering af outliers i dine data

I løbet af gruppering eller klassificering af nye kunder løber du fra og til outliers (særlige tilfælde, der ikke passer til de eksisterende divisioner).

Nedenfor ser du et par outliers, der ikke passer godt ind i de foruddefinerede klynger. Seks outlier kunder er blevet opdaget og visualiseret. De opfører sig forskelligt nok, at modellen ikke kan se, om de tilhører nogen af ​​de definerede kategorier af kunder.

Seks outlier kunder taler kategorisering bare ved at vise.

Visualisering af beslutningstræer

Mange modeller bruger beslutningstræer som deres output: Disse diagrammer viser de mulige resultater fra alternative handlingskanaler, lagt ud som grene af et træ.

Billedet nedenfor viser et eksempel på et træ, der bruges som klassifikator: Det klassificerer baseballfans baseret på et par kriterier, hovedsageligt det beløb, der bruges på billetter og købsdatoer. Fra denne visualisering kan du forudsige den type fan, som en ny billetkøber vil være: casual, loyal, bandwagon, diehard eller en anden type.

Attributter for hver fan er nævnt på hvert niveau i træet (samlet antal deltagede spil, samlet brugt beløb, sæson); Du kan følge en sti fra en bestemt "rod" til et bestemt "blad" på træet, hvor du rammer en af ​​fanklasserne (c1, c2, c3, c4, c5).

Find den klasse, hvor en bestemt baseball fan tilhører.

Antag, at du vil bestemme hvilken type baseballfan en kunde er, så du kan bestemme, hvilken type marketingannoncer der skal sendes til kunden. Antag at du hypoteser, at baseball fanatikere og bandwagon fans kan overtales til at købe en ny bil, når deres hold gør det godt og leder efter playoffs.

Du vil muligvis sende marketingannoncer og rabatter for at overtale dem til at foretage købet. Lad os antage, at du hypoteser, at bandwagon fans kan overtales til at stemme til støtte for visse politiske spørgsmål. Du kan sende dem markedsføringsannoncer, der beder dem om den pågældende support. Hvis du ved, hvilken type fanebase du har, kan træning hjælpe dig med at beslutte, hvordan du nærmer dig den som en række kundetyper.

Visualisering af forudsigelser

Antag, at du har kørt en række prædiktive analysemodeller, herunder beslutningstræer, tilfældige skove og flockningsalgoritmer. Du kan kombinere alle disse resultater og præsentere en konsekvent fortælling, som de alle støtter. Her er tillid en numerisk procentdel, der kan beregnes ved hjælp af en matematisk funktion. Resultatet af beregningen indkapsler en score af, hvor sandsynlig en mulig forekomst er.

På x-aksen repræsenterer understøttende bevis indholdskilden, der blev analyseret med indholdsanalysemodeller, der identificerede de mulige resultater. I de fleste tilfælde ville din prædiktive model have behandlet et stort datasæt ved hjælp af data fra forskellige kilder for at udlede de mulige resultater. Således skal du kun vise de vigtigste understøttende beviser i din visualisering.

Viser kun de vigtigste understøttende beviser i visualiseringen.

Ovenstående er et resumé af resultaterne opnået ved anvendelse af predictive analytics præsenteret som en visualisering, der illustrerer mulige resultater sammen med en tillidscore og understøttende beviser for hver enkelt. Der vises tre mulige scenarier:

  • Opgørelsen over Konto A vil ikke holde op med efterspørgslen, hvis du ikke sender mindst 100 enheder ugentligt til Store S. (Confidence score: 98 procent.)
  • Antallet af salg vil stige med 40 procent, hvis du øger produktionen af ​​vare A med mindst 56 procent. (Tillid score: 83 procent.)
  • En marketingkampagne i Californien vil øge salget af poster A og D, men ikke Item K. (Confidence score: 72 procent.)

Tillidsscoren repræsenterer sandsynligheden for, at hvert scenario vil ske i henhold til din forudsigelige analysemodel. Bemærk, at de er angivet her i faldende rækkefølge af sandsynlighed.

Her består det vigtigste understøttende bevis på, hvordan uddrag fra flere indholdskilder præsenteres over x-aksen. Du kan henvise til dem, hvis du har brug for at forklare, hvordan du har fået et bestemt scenario - og fremdrive de beviser, der understøtter det.

Kraften bag denne visualisering er dens enkelhed. Forestil dig, efter måneder med at anvende predictive analytics til dine data, arbejder dig gennem flere iterationer, at du går ind i et møde med beslutningstageren. Du er bevæbnet med en diasvisualisering af tre mulige scenarier, der kan have stor indflydelse på virksomheden. En sådan visualisering skaber effektive diskussioner og kan føre ledelsen til "aha" øjeblikke.

Visualisering af din prædiktive models analytiske resultater

Valg af editor

Sammenligning af Hadoop-distributioner - dummier

Sammenligning af Hadoop-distributioner - dummier

Du vil opdage, at Hadoop-økosystemet har mange komponenter, som alle eksisterer som deres egne Apache projekter. Fordi Hadoop er vokset betydeligt og står over for nogle betydelige yderligere ændringer, er forskellige versioner af disse komponenter i open source-fællesskabet måske ikke fuldt kompatible med andre komponenter. Dette giver betydelige vanskeligheder for folk, der søger at få ...

Faktorer, der øger omfanget af statistisk analyse i Hadoop - dummies

Faktorer, der øger omfanget af statistisk analyse i Hadoop - dummies

Grunden til, at folk udprøver deres data før du kører statistisk analyse i Hadoop er, at denne form for analyse ofte kræver betydelige databehandlingsressourcer. Det handler ikke kun om datamængder: der er fem hovedfaktorer, der påvirker omfanget af statistisk analyse: Denne er let, men vi skal nævne det: mængden af ​​data på ...

Komprimering af data i Hadoop - dummies

Komprimering af data i Hadoop - dummies

Er de enorme datamængder, der er realiteter i en typisk Hadoop-implementering, en nødvendighed. Datakomprimering sparer helt sikkert en stor mængde lagerplads og er sikker på at fremskynde bevægelsen af ​​disse data i hele din klynge. Ikke overraskende er der en række tilgængelige komprimeringsordninger, kaldet codecs, derude for ...

Valg af editor

Hvordan man bruger Wordtracker Søgeordsværktøj - dummies

Hvordan man bruger Wordtracker Søgeordsværktøj - dummies

Wordracker er måske det mest populære kommercielle søgeordværktøj blandt seo fagfolk. Wordtracker har adgang til data fra et par store metakrawlere og en stor britisk internetudbyder. En metacrawler er et system, der søger flere søgemaskiner til dig. Skriv f.eks. Et ord i Dogpiles søgefelt, og systemet søger på Google, ...

Identificere mobile brugers søgemønstre for SEO - dummies

Identificere mobile brugers søgemønstre for SEO - dummies

I begyndelsen af ​​2014 Endelig skete: Internetbrug via mobile enheder oversteg faktisk desktop internetbrug i USA for første gang. Overveje det, alle har en smartphone i disse dage, og folk bruger i stigende grad disse handy-enheder, tabletter som iPad og det nye mellemstore sortiment af tabletter (overdimensionerede telefon-tablet-enheder) ...

Hvordan man bruger single page analyser til konkurrencedygtig seo forskning - dummies

Hvordan man bruger single page analyser til konkurrencedygtig seo forskning - dummies

Single Page Analyzer værktøj kan hjælpe dig med at forbedre dit websted til SEO. Det fortæller dig, hvad en websides søgeord er og beregner deres tæthed. Søgeordsdensitet er en procentdel, der angiver det antal gange søgeordet opstår i forhold til det samlede antal ord på siden. Når du kører en konkurrents side ...

Valg af editor

Sådan konstrueres en funktion i C Programmering - dummier

Sådan konstrueres en funktion i C Programmering - dummier

I C-programmering, alle funktioner kaldes med en navn, som skal være unikt ingen to funktioner kan have samme navn, og en funktion kan heller ikke have samme navn som et søgeord. Navnet efterfølges af parenteser, som derefter efterfølges af et sæt krøllede parenteser. Så i sin enkleste konstruktion, en ...

Sådan oprettes en ny kode:: Blokerer projekt i C-dummier

Sådan oprettes en ny kode:: Blokerer projekt i C-dummier

I C programmeringssprog, en konsol-applikation er en, der kører i tekst-tilstand i et terminalvindue. Selv om et integreret udviklingsmiljø er i stand til mere, er det den bedste måde at lære grundlæggende programmeringskoncepter på, uden at overvældende dig med et stort, komplekst grafisk dyr af et program. Sådan fungerer det: Start ...

Hvordan man viser tekst på skærmen i C med sætter () og printf () - Dummies

Hvordan man viser tekst på skærmen i C med sætter () og printf () - Dummies

De ting, som et C-program kan gøre, er ubegrænset, men når du først lærer sproget, skal du starte lille. En af de mest almindelige funktioner, du vil have dit C-program til at gøre, er at vise tekst på skærmen, og der er to måder at gøre: sætter () og printf (). sætter () Sætter sandsynligvis ...