Indholdsfortegnelse:
- Visualisering af skjulte grupperinger i dine data
- Visualisering af dataklassifikationsresultater
- Visualisering af outliers i dine data
- Visualisering af beslutningstræer
- Visualisering af forudsigelser
Video: Leap Motion SDK 2025
Ofte skal du kunne vise resultaterne af din prædiktive analyse til dem, der betyder noget. Her er nogle måder at bruge visualiseringsteknikker til at rapportere resultaterne af dine modeller til interessenterne.
Visualisering af skjulte grupperinger i dine data
Dataklyngning er processen med at opdage skjulte grupper af relaterede emner inden for dine data. I de fleste tilfælde består en klynge (gruppering) af dataobjekter af samme type som brugere af sociale netværk, tekstdokumenter eller e-mails. En måde at visualisere resultaterne af en dataklyngningsmodel på er vist nedenfor, hvor grafen repræsenterer samfund (klynger), der blev opdaget i data indsamlet fra brugere af sociale netværk.
Oplysningerne om kunder blev samlet i et tabelformat; så blev der anvendt en klyngalgoritme til dataene, og de tre klynger (grupper) blev opdaget: loyale kunder, vandrende kunder og rabatkunder. Antag at X- og Y-aksen repræsenterer de to hovedkomponenter, der genereres af de oprindelige data. Hovedkomponentanalyse (PCA) er en datareduktionsteknik.
Clustering kunder i tre grupper: loyale, vandrende og rabat.Her viser det visuelle forhold mellem de tre grupper allerede, hvor forbedrede og målrettede marketingindsatser kan gøre det bedste.
Visualisering af dataklassifikationsresultater
En klassifikationsmodel tildeler en bestemt klasse til hvert nyt datapunkt, den undersøger. De specifikke klasser, i dette tilfælde, kan være de grupper, der er resultatet af dit klyngearbejde. Udgangen fremhævet i grafen kan definere dine målsæt. For en given ny kunde forsøger en prædiktiv klassifikationsmodel at forudsige, hvilken gruppe den nye kunde vil tilhøre.
Når du har anvendt en klyngningsalgoritme og opdagede grupperinger i kundedataene, kommer du et øjeblik af sandhed: Her kommer en ny kunde - du vil have modellen til at forudsige hvilken type kunde han eller hun vil være
Billedet viser, hvordan en ny kundes oplysninger bliver fodret til din forudsigelsesanalysemodel, hvilket igen forudsiger, hvilken gruppe kunder denne nye kunde tilhører. Nye kunder A, B og C skal tildeles til klynger efter klassificeringsmodellen. Anvendelse af klassifikationsmodellen resulterede i en forudsigelse af, at kunde A ville tilhøre de loyale kunder, kunde kunde b være en vandrer, og kunde c viste kun for rabatten.
Tildele kunderne A, B og C, til deres klassifikationer (klynger).Visualisering af outliers i dine data
I løbet af gruppering eller klassificering af nye kunder løber du fra og til outliers (særlige tilfælde, der ikke passer til de eksisterende divisioner).
Nedenfor ser du et par outliers, der ikke passer godt ind i de foruddefinerede klynger. Seks outlier kunder er blevet opdaget og visualiseret. De opfører sig forskelligt nok, at modellen ikke kan se, om de tilhører nogen af de definerede kategorier af kunder.
Seks outlier kunder taler kategorisering bare ved at vise.Visualisering af beslutningstræer
Mange modeller bruger beslutningstræer som deres output: Disse diagrammer viser de mulige resultater fra alternative handlingskanaler, lagt ud som grene af et træ.
Billedet nedenfor viser et eksempel på et træ, der bruges som klassifikator: Det klassificerer baseballfans baseret på et par kriterier, hovedsageligt det beløb, der bruges på billetter og købsdatoer. Fra denne visualisering kan du forudsige den type fan, som en ny billetkøber vil være: casual, loyal, bandwagon, diehard eller en anden type.
Attributter for hver fan er nævnt på hvert niveau i træet (samlet antal deltagede spil, samlet brugt beløb, sæson); Du kan følge en sti fra en bestemt "rod" til et bestemt "blad" på træet, hvor du rammer en af fanklasserne (c1, c2, c3, c4, c5).
Find den klasse, hvor en bestemt baseball fan tilhører.Antag, at du vil bestemme hvilken type baseballfan en kunde er, så du kan bestemme, hvilken type marketingannoncer der skal sendes til kunden. Antag at du hypoteser, at baseball fanatikere og bandwagon fans kan overtales til at købe en ny bil, når deres hold gør det godt og leder efter playoffs.
Du vil muligvis sende marketingannoncer og rabatter for at overtale dem til at foretage købet. Lad os antage, at du hypoteser, at bandwagon fans kan overtales til at stemme til støtte for visse politiske spørgsmål. Du kan sende dem markedsføringsannoncer, der beder dem om den pågældende support. Hvis du ved, hvilken type fanebase du har, kan træning hjælpe dig med at beslutte, hvordan du nærmer dig den som en række kundetyper.
Visualisering af forudsigelser
Antag, at du har kørt en række prædiktive analysemodeller, herunder beslutningstræer, tilfældige skove og flockningsalgoritmer. Du kan kombinere alle disse resultater og præsentere en konsekvent fortælling, som de alle støtter. Her er tillid en numerisk procentdel, der kan beregnes ved hjælp af en matematisk funktion. Resultatet af beregningen indkapsler en score af, hvor sandsynlig en mulig forekomst er.
På x-aksen repræsenterer understøttende bevis indholdskilden, der blev analyseret med indholdsanalysemodeller, der identificerede de mulige resultater. I de fleste tilfælde ville din prædiktive model have behandlet et stort datasæt ved hjælp af data fra forskellige kilder for at udlede de mulige resultater. Således skal du kun vise de vigtigste understøttende beviser i din visualisering.
Viser kun de vigtigste understøttende beviser i visualiseringen.Ovenstående er et resumé af resultaterne opnået ved anvendelse af predictive analytics præsenteret som en visualisering, der illustrerer mulige resultater sammen med en tillidscore og understøttende beviser for hver enkelt. Der vises tre mulige scenarier:
- Opgørelsen over Konto A vil ikke holde op med efterspørgslen, hvis du ikke sender mindst 100 enheder ugentligt til Store S. (Confidence score: 98 procent.)
- Antallet af salg vil stige med 40 procent, hvis du øger produktionen af vare A med mindst 56 procent. (Tillid score: 83 procent.)
- En marketingkampagne i Californien vil øge salget af poster A og D, men ikke Item K. (Confidence score: 72 procent.)
Tillidsscoren repræsenterer sandsynligheden for, at hvert scenario vil ske i henhold til din forudsigelige analysemodel. Bemærk, at de er angivet her i faldende rækkefølge af sandsynlighed.
Her består det vigtigste understøttende bevis på, hvordan uddrag fra flere indholdskilder præsenteres over x-aksen. Du kan henvise til dem, hvis du har brug for at forklare, hvordan du har fået et bestemt scenario - og fremdrive de beviser, der understøtter det.
Kraften bag denne visualisering er dens enkelhed. Forestil dig, efter måneder med at anvende predictive analytics til dine data, arbejder dig gennem flere iterationer, at du går ind i et møde med beslutningstageren. Du er bevæbnet med en diasvisualisering af tre mulige scenarier, der kan have stor indflydelse på virksomheden. En sådan visualisering skaber effektive diskussioner og kan føre ledelsen til "aha" øjeblikke.