Indholdsfortegnelse:
Video: Data Analysis in R by Dustin Tran 2024
Selvom du har mange diagramtyper at vælge imellem, når du præsenterer data, er det godt at starte med nogle af de enkleste og mest almindeligt anvendte diagrammer for flest chancer for succes: bar og kolonne diagrammer, linjediagrammer og cirkeldiagrammer.
Bar og kolonneoversigter
Nogle mennesker bruger udtrykket bardiagram , når man taler om et diagram, der viser dataene vandret eller lodret; andre kalder et diagram, der viser dataene lodret et kolonneoversigt. Uanset hvad du kalder dem, bruges disse diagrammer bedst til sammenligninger.
Figuren herunder viser et eksempel på et kolonneoversigt. Bemærk, at diagrammet er enkelt, med en titel, en mærket akse og klare etiketter for at vise, hvad kolonnerne repræsenterer.
Når du bruger et kolonnediagram, skal du sørge for at forkorte eller bruge mindre etiketter på din x-akse under hver enkelt bjælke for at sikre, at de vises vandret. Anvendelse af længere etiketter vil medføre, at titlen skal vises lodret (som vist på figuren), hvilket er svært for brugeren at læse.
Linjediagrammer
A linjediagram forbinder datapunkter over en periode, som vist i den følgende figur. Linjediagrammer bruges bedst til noget som en tendens til at vise bevægelse. Disse diagrammer er nemme at læse og ret nemt at oprette. Denne type diagram skal være en af dine hæfteklammer.
Cirkeldiagrammer
Brugen af cirkeldiagrammer er kontroversiel, og debatten er mere end et årti gammel. Skriv blot ordene undgå cirkeldiagram i en søgemaskine, og du vil bogstaveligt talt finde mere end 1 million poster. En af de mest kendte datadesign eksperter, Edward Tufte, refererer til pie diagrammer som "dumme" i sin bog Den visuelle visning af kvantitative Information (Graphics Press). Tufte hævder, at cirkeldiagrammer er dumme fordi de ikke viser sammenligninger og tendenser såvel som linjer eller linjediagrammer gør. Mange eksperter hævder, at øjnene ikke er gode til at estimere områder, som du skal gøre, når du ser et cirkeldiagram.
Du kan dog bruge cirkeldiagrammer som effektive datavisualiseringer, hvis - og kun hvis - du holder dig til det formål, de var ment til at tjene og følger retningslinjerne i dette afsnit.
Sædvanligvis er cirkeldiagrammer opdelt i skiver, hvor størrelsen af hver skive viser den relative værdi. Med andre ord skal det være let at se, hvilke skiver af tæren der bidrager mest og mindst til hele kagen. Nå, det er ikke helt så nemt som du måske tror.
Kig på de to mest almindelige måder, som cirkeldiagrammer misbruges:
-
Der vises for mange skiver. Du bør begrænse antallet af kageplader til fem. Viser yderligere skiver, der er for små til at blive sorteret, vil kun distrahere brugeren fra hovedpunktet. Nedenstående figur viser et cirkeldiagram, der viser, hvor meget (i procent) hver indtjeningsstrøm har bidraget til virksomhedens samlede omsætning i sidste kvartal.
Det er klart, at T-shirts, Capris og Baseball caps kombinerer 90% af selskabets salg. Hvad der ikke er så klart er de produkter, der udgør de resterende 10 procent af omsætningen.
Figuren nedenfor viser en bedre måde at vise de samme data på. Bemærk, at de øvrige produkter kombineres i en skive med overskriften Andet. Dette gør diagrammet nemmere at fordøje. Du fremhæver de bedste bidragydere og viser bidragene fra de ekstra skiver som en enkelt sektor.
-
Skiver med samme værdi vises. Dette er en anden almindelig fejltagelse. Cirkeldiagrammet i figuren ovenfor har færre end fem skiver, men fordi værdien af nogle af skiverne er forholdsvis ens, er det svært at sammenligne de faktiske bidrag af de enkelte skiver i forhold til hinanden.
Følgende figur viser de samme data fra det foregående billede i et kolonnediagram, der er indstillet til at sortere i stigende rækkefølge.
Bemærk, hvor meget lettere det er at se, hvilke produkter der har bidraget mest indkomst, selv om forskellene i nogle af værdierne er meget slanke?
Medmindre du udvikler statiske datavisualiseringer som infographics eller en årlig rapport, hvor dataene ikke opdateres dynamisk, skal du undgå at bruge cirkeldiagrammer. Virkeligheden er, at de fleste Big Data-visualiseringer opdateres dynamisk fra en real-time database, hvilket gør det næsten umuligt at styre dataudgangen. Risikoen for at bryde en, om ikke begge, reglerne for cirkeldiagrammer, der er angivet i dette afsnit, er meget høj; i sidste ende er risikoen ikke værd at gøre dataene svært at læse.