Indholdsfortegnelse:
Video: Ma1/MaC: Summa av geom. talföljd, kedjebrevstillämpning 2025
En ggplot2 geom fortæller plottet, hvordan du vil vise dine data i R. For eksempel bruger du geom_bar () til at lave et stregdiagram. I ggplot2 kan du bruge en række foruddefinerede geomer til at lave standardtyper af plot.
En geom definerer layoutet af et ggplot2-lag. Du kan f.eks. Bruge geoms til at oprette stregdiagrammer, scatterplots og linjediagrammer (samt en række andre plot), som du kan se nedenfor.
Hver geom har en standardstat, og hver stat har en standard geom. I praksis skal du kun angive en af disse.
Geom | Beskrivelse | Standardstat |
---|---|---|
geom_bar () | Stregdiagram | stat_bin () |
geom_point () | Scatterplot | stat_identity () |
geom_line () | Linjediagram, forbinder observationer i rækkefølge ved
x -value |
stat_identity () |
geom_boxplot | Boks-og-whisker plot | stat_boxplot () |
geom_path | Linjediagram, forbinder observationer i originalordre | stat_identity () |
geom_smooth | Tilføj et jævnt betinget middelværdi | stat_smooth () |
geom_histogram | Et alias for geom_bar stat_bin () | stat_bin () |
Oprettelse af et stregdiagram
For at lave et stregdiagram, bruger du geom_bar () -funktionen. Bemærk dog, at standardstatussen er stat_bin (), som bruges til at skære dine data i bakker. Således er standardbetjeningen for geom_bar () at oprette et histogram.
For eksempel at lave et histogram af jordskælvets dybde i jordskælvsdatabasen, prøv: >> ggplot (quakes, aes (x = dybde)) + geom_bar ()> ggplot (quakes, aes (x = dybde)) + geom_bar (binwidth = 50)
Bemærk, at din kortlægning definerer kun variablen
x -axis (i dette tilfælde quakes $ depth). Et nyttigt argument til geom_bar () er binwidth, som styrer størrelsen af de bakker, som dine data er skåret i. Dette skaber dette plot.
I det næste eksempel bruger du aggregat () til at beregne antallet af quakes i forskellige dybdestrata: >> quakes.og navne (quakes. agg) <- c ("dybde", "mag")
Nu kan du plotte objektets quakes. agg med geom_bar (stat = "identitet"): >> ggplot (quakes. agg, aes (x = dybde, y = mag)) + + geom_bar (stat = "identitet")
Sammenfattende kan du bruge geom_bar () til at oprette et histogram og lade ggplot2 opsummere dine data, eller du kan opsummere dine data og brug derefter stat = "identitet" for at plotte et stregdiagram.
Lav en scatterplot
For at oprette en scatterplot, bruger du geom_point () funktionen. En scatterplot skaber point (eller nogle gange bobler eller andre symboler) på dit diagram. Hvert punkt svarer til en observation i dine data.
Du har sikkert set eller skabt denne type grafik en million gange, så du ved allerede, at scatterplots bruger det kartesiske koordinatsystem, hvor en variabel er kortlagt til
x
-axis og en anden variabel er kortlagt til
y -axen. På nøjagtig samme måde skaber du i ggplot2 en kortlægning mellem x -axis og
y -axis-variabler. Så for at lave et plot af quakes-data, kortlægger du quakes $ long til x -axis og quakes $ lat til y -axis: >> ggplot (quakes, aes (x = lang, y = lat)) + geom_point () Dette skaber denne scatterplot. geom_point (). Oprettelse af en scatterplot med geom_point ().
Oprettelse af linjediagrammer
For at oprette et linjediagram bruger du funktionen geom_line (). Du bruger denne funktion på en meget lignende måde til geom_point (); forskellen er, at geom_line () tegner en linje mellem på hinanden følgende punkter i dine data.
Denne type diagram er nyttig til tidsseriedata i datarammer, såsom befolkningsdata i det indbyggede datasæt Longley, aes (x = År, y = Arbejdsløs)) + geom_line () Dette skaber denne linje.geom_line (). "width =" 535 ">
Tegning af linjediagram med geom_line ().
Du kan bruge enten geom_line () eller geom_path () til at oprette en linjetegning i ggplot2. Forskellen er, at geom_line () først ordrer observationerne i henhold til
x
-value, mens geom_path () trækker observationerne i den rækkefølge, der findes i dataene.