Indholdsfortegnelse:
- Sådan får du output
- Så du de underlige værdier for variablen cyl? Et hurtigt kig på resuméet kan fortælle dig, at der er noget fisket på, som for eksempel mindste og første kvartil har nøjagtig samme værdi. Faktisk har den variable cyl kun tre værdier og ville være bedre som en faktor. Så lad os sætte denne variabel ud af sin elendighed: >> biler $ cyl <- som. faktor (biler $ cyl)
Video: Data Analysis in R by Dustin Tran 2025
Hvis du har brug for et hurtigt overblik over dit datasæt, kan du selvfølgelig altid bruge kommandoen R str () og se på strukturen. Men dette fortæller dig kun noget om klasserne af dine variabler og antallet af observationer. Funktionshovedet () giver dig i bedste fald en ide om, hvordan dataene gemmes i datasættet.
Sådan får du output
For at få en bedre ide om fordelingen af dine variabler i datasættet, kan du bruge funktionen summary () som denne:
Funktionen summary () fungerer bedst, hvis du bare bruger R interaktivt på kommandolinjen for hurtigt at scanne dit datasæt. Du bør ikke forsøge at bruge det inden for en brugerdefineret funktion, du selv skrev.
Numeriske variabler:
-
resumé () giver dig intervallet, kvartiler, median og middelværdi. Faktorvariabler:
-
resumé () giver dig en tabel med frekvenser. Numeriske og faktorvariabler:
-
summary () giver dig antallet af manglende værdier, hvis der er nogen.
-
Sammendrag () giver dig ikke nogen oplysninger over alt bortset fra længden og klassen (som er 'karakter'). Sådan løser du et problem