Indholdsfortegnelse:
- Sådan opretter du en densitetsplot
- Så i stedet for at plotte tællerne i histogrammet, kan du lige så godt plotte tæthederne. R gør alle beregningerne for dig - det eneste du skal gøre er at sætte freq-argumentet for hist () til FALSE, som dette: >> hist (biler $ mpg, col = "grå", freq = FALSE)
Video: Battlestar Galactica Deadlock Sin and Sacrifice DLC PREVIEW LIVE 2025
Ved at bryde dine data i intervaller i R taber du stadig nogle oplysninger. Alligevel er den mest komplette måde at beskrive dine data ved at estimere sandsynlighedsdensitetsfunktionen (PDF) eller densitet af din variabel.
Hvis dette koncept ikke er kendt for dig, skal du ikke bekymre dig. Husk bare, at densiteten er proportional med chancen for, at enhver værdi i dine data er omtrent lig med denne værdi. Faktisk for et histogram beregnes densiteten ud fra tællerne, så den eneste forskel mellem et histogram med frekvenser og et med densiteter er skalaen for y -axen. For resten ser de nøjagtigt ens ud.
Sådan opretter du en densitetsplot
Du kan estimere densitetsfunktionen for en variabel ved hjælp af density () -funktionen. Udgangen af denne funktion i sig fortæller dig ikke så meget, men du kan nemt bruge det i en plot. For eksempel kan du få tætheden af kilometertal variabel mpg som denne: >> mpgdens <- density (cars $ mpg)
Objektet du får denne vej er en liste med mange oplysninger, du ikke gør virkelig nødt til at se på. Men den liste gør plotting af densiteten så let som at sige "plot density":
x
-axen og densiteten på y -aksen. Objektet mpgdens indeholder blandt andet et element kaldet x og en kaldet y. Disse repræsenterer x
- og y -koordinaterne for at plotte densiteten. Når R beregner densiteten, opdeler densiteten () -funktionen dine data i en række små intervaller og beregner densiteten for midtpunktet for hvert interval. Disse midtpunkter er værdierne for x, og de beregnede densiteter er værdierne for y.
Så i stedet for at plotte tællerne i histogrammet, kan du lige så godt plotte tæthederne. R gør alle beregningerne for dig - det eneste du skal gøre er at sætte freq-argumentet for hist () til FALSE, som dette: >> hist (biler $ mpg, col = "grå", freq = FALSE)
Nu bliver plottet nøjagtigt det samme som før; kun værdierne på
y
-axerne er forskellige.Skalaen på
y -axis er indstillet på en sådan måde, at du kan føje densitetsplotten over histogrammet. Til det bruger du linjerne () -funktionen med densitetsobjektet som argumentet. Så kan du for eksempel fancy det forrige histogram lidt længere ved at tilføje den estimerede tæthed ved hjælp af følgende kode umiddelbart efter den foregående kommando: >> linjer (mpgdens) Du ser resultatet af disse to kommandoer på højre side. Husk at linjer () bruger x- og y-elementerne fra densitetsobjektet mpgdens til at plotte linjen.