Indholdsfortegnelse:
- De mest anvendte kvantiler er faktisk 0 procent og 100 procent kvantiler. Du kan lige så nemt kalde dem minimum og maksimum, fordi det er hvad de er. Du kan få både min () og max () funktioner sammen med funktionen range (). Denne funktion giver dig bekvemt dataområdet. Så for at vide mellem hvilke to værdier alle kilometer er placeret, gør du simpelthen følgende:
- kvartil
- Alle disse funktioner har et argument. rm, der giver dig mulighed for at fjerne alle NA-værdier, før du beregner den respektive statistik. Hvis du ikke gør dette, vil enhver vektor, der indeholder NA, have NA som følge heraf. Dette fungerer identisk med na. rm argument for summen () funktionen.
Video: Genetic Engineering Will Change Everything Forever – CRISPR 2025
Et enkelt tal fortæller dig ikke meget om dine data. Ofte er det lige så vigtigt at kende spredningen af dine data. Du kan bruge R til at se på dette spread ved hjælp af en række forskellige tilgange.
For det første kan du beregne enten variansen eller standardafvigelsen for at opsummere spredningen i et enkelt nummer. For det har du de praktiske funktioner var () for variansen og sd () for standardafvigelsen. For eksempel beregner du standardafvigelsen for variablen mpg i datarammen biler som denne:
Ved siden af gennemsnittet og variationen kan du også se på kvantilerne. En
quantile, eller percentil fortæller dig, hvor meget af dine data ligger under en bestemt værdi. Den 50 procent kvantile er for eksempel ikke andet end medianen. Igen har R nogle praktiske funktioner til at hjælpe dig med at se på kvantikerne. Sådan beregnes dataregmentet i R
De mest anvendte kvantiler er faktisk 0 procent og 100 procent kvantiler. Du kan lige så nemt kalde dem minimum og maksimum, fordi det er hvad de er. Du kan få både min () og max () funktioner sammen med funktionen range (). Denne funktion giver dig bekvemt dataområdet. Så for at vide mellem hvilke to værdier alle kilometer er placeret, gør du simpelthen følgende:
Området giver dig stadig begrænset information. Ofte rapporterer statistikere det første og det tredje
kvartil
ud for rækken og medianen. Disse kvartiler er henholdsvis 25 procent og 75 procent kvantiler, som er tallene for hvilke en fjerdedel og tre fjerdedele af dataene er mindre. Du får disse tal ved hjælp af quantile () -funktionen, som denne:
Quantile () -funktionen kan give dig det ønskede kvantitet. For det bruger du probs-argumentet. Du giver probs (eller sandsynligheder) som et brøknummer. For 20 procent-kvantilen bruger du for eksempel 0. 20 som et argument for værdien.Dette argument tager også en vektor som en værdi, så du kan fx få 5 procent og 95 procent kvantiler som denne: >> quantile (biler $ mpg, probs = c (0, 05, 0.95)) 5% 95% 11. 995 31. 300
Standardværdien for probs-argumentet er en vektor, der repræsenterer minimumet (0), det første kvartil (0. 25), medianen (0. 5), den tredje kvartil (0,75) og maksimumet (1).