Indholdsfortegnelse:
- Boxplot (også kaldet boks og whiskers )
- Betinget boxplot
- Parallelle koordinater
- Gevinstdiagrammer (også kaldet kumulative gevinster)
- Løfteoversigter
Video: Volcanoids Review (German/Deutsch) Steampunk Survival im Early Access Test 2025
Boxplot (også kaldet boks og whiskers )
Histogrammer beskriver distributioner af kontinuerlige variabler, men har begrænset værdi til visning detaljer. En boxplot er et alternativ. Billedets hjerte er en boks; Dette repræsenterer halvdelen af dataene, der er taget midt i dens rækkevidde.
Bokens center er medianværdien af variablen, og boksens nedre og øverste ender repræsenterer henholdsvis henholdsvis 25 og 75 procent. Whiskers strækker sig under og over boksen, hvilket repræsenterer området for størstedelen af dataene. Punkter ud over whiskers anses for at være outliers, stærkt atypiske værdier (nogle diagrammer angiver også ekstremer, , som er uregelmæssigheder blandt outliers).
Betinget boxplot
Boksplotter for flere grupper (f.eks. Geografiske områder) kan placeres side om side på en enkelt graf for nem sammenligning.
3 5Parallelle koordinater
Tegningerne viser værdier for flere variabler alle sammen på et enkelt plot med værdierne for hvert tilfælde forbundet med linjesegmenter. Fælles kombinationer skiller sig ud fra resten. For eksempel viser figuren flere variabler relateret til biler og brændstofforbrug.
Mange tilfælde deler bestemte værdier, præcis eller ca., der danner mørke mønstre fra de mange linjer, der følger efter lignende stier på tværs af grafen. For eksempel udgør kasser til biler med fire cylindre, lav forskydning, højkilometer og senmodelår et meget mørkt og iøjnefaldende mønster.
4 5Gevinstdiagrammer (også kaldet kumulative gevinster)
Et gevinstdiagram viser dig, hvor meget en prædiktiv model forbedrer resultaterne over tilfældig prøveudtagning. Nogle mennesker er mere tilbøjelige til at handle (køb et produkt, stemmer for en kandidat, bryder loven …) end andre. Hvis du ikke ved noget om en gruppe mennesker, er det bedste du kan sige, at det at kontakte halvdelen af befolkningen vil komme op til halvdelen af dem, der vil handle.
Men en prædiktiv model kan fortælle, hvilke personer der er de bedste muligheder, så du kan bruge modellen til at vælge halvdelen (eller 10 procent eller 60 procent osv.) Og få mere handling. Hvor meget mere?
I diagrammet kan du se en diagonal linje, hvor værdierne x og y altid er de samme; Dette repræsenterer hvad du ville få ved at vælge prospekter tilfældigt. Den anden linje repræsenterer modellen. Forskellen i y -værdierne mellem modellen og det tilfældige valg viser, hvor meget modellen forbedrer dit resultat. Læs modellinjen plottet på diagrammet, og sammenlign det med linjen for tilfældig prøveudtagning.
Løfteoversigter
Løfteoversigter ligner meget på gevinster. Hovedforskellen er, at dataene er normaliseret, så stikprøveudtagning altid er repræsenteret som en værdi på 1, og modelresultaterne vises i forhold til tilfældig prøveudtagning.
Du kan se flere forskellige typer af diagrammer kaldet løfteskemaer. Nogle er kumulative, og andre er ikke. Nogle kan endda være gevinster diagrammer