Indholdsfortegnelse:
- Sådan sammenlignes to datasampler
- I de fleste tilfælde vil du ikke sammenligne to prøver med hinanden, men sammenligne en prøve med en teoretisk prøve, der kommer fra en bestemt fordeling (for eksempel den normale fordeling).
Video: Stem-and-leaf plots | Applying mathematical reasoning | Pre-Algebra | Khan Academy 2024
Histogrammer giver meget til seerenes fortolkning. En bedre grafisk måde i R for at fortælle om dine data distribueres normalt er at se på en såkaldt quantile-quantile (QQ) plot.
Med denne teknik plotter du kvantiler mod hinanden. Hvis du sammenligner to prøver, for eksempel, sammenligner du blot kvantikerne af begge prøver. Eller for at sige det lidt anderledes, gør R følgende for at konstruere et QQ-plot:
-
Det sorterer dataene fra begge prøver.
-
Det tegner disse sorterede værdier mod hinanden.
Hvis begge prøver ikke indeholder det samme antal værdier, beregner R ekstra værdier ved interpolering for den mindste stikprøve for at skabe to prøver af samme størrelse.
Sådan sammenlignes to datasampler
Selvfølgelig behøver du ikke selv at gøre det, du kan bare bruge funktionen qqplot () til det. Så for at tjekke, om temperaturerne under aktivitet og resten er fordelt lige, skal du blot gøre følgende:
Dette skaber et plot, hvor de ordnede værdier er tegnet mod hinanden.
Mellem de firkantede parenteser kan du bruge en logisk vektor til at vælge de tilfælde, du ønsker. Her vælger du alle tilfælde, hvor variabel-aktivet er lig med 1 for den første prøve, og alle tilfælde, hvor denne variabel er lig med 0 for den anden prøve.
I de fleste tilfælde vil du ikke sammenligne to prøver med hinanden, men sammenligne en prøve med en teoretisk prøve, der kommer fra en bestemt fordeling (for eksempel den normale fordeling).
For at lave en QQ-plot på denne måde har R den særlige qqnorm () -funktion. Som navnet antyder, tegner denne funktion din stikprøve mod en normal fordeling. Du giver blot den stikprøve, du vil plotte som et første argument, og tilføje eventuelle grafiske parametre, du kan lide.
R opretter derefter en prøve med værdier, der kommer fra
standard normalfordeling, eller en normalfordeling med et gennemsnit på nul og en standardafvigelse på en. Med denne anden prøve skaber R QQ-plottet som forklaret før. R har også en qqline () -funktion, som tilføjer en linje til din normale QQ-plot. Denne linje gør det meget nemmere at vurdere, om du ser en klar afvigelse fra normalitet. Jo tættere alle punkter ligger på linjen, jo tættere fordelingen af din prøve kommer til den normale fordeling. Funktionen qqline () tager også prøven som et argument.
Nu vil du gøre dette for temperaturerne under både den aktive og inaktive periode af bæveren. Du kan bruge funktionen qqnorm () to gange for at oprette begge punkter. I de inaktive perioder kan du bruge følgende kode: >> qqnorm (beaver2 $ temp [beaver2 $ aktiv == 0], main = "Inaktiv")> qqline (beaver2 $ temp [beaver2 $ aktiv == 0])
Du kan gøre det samme for den aktive periode ved at ændre værdien 0 til 1.