Video: Jorden - Rummet og vores solsystem - Natur og teknologi på hovedet - NTPH 2025
For at finde ud af, hvilke data der kan tages i betragtning, når man arbejder i R, lad os se på datasættet mtcars. Dette indbyggede datasæt beskriver brændstofforbrug og ti forskellige designpunkter fra 32 biler fra 1970'erne. Den indeholder i alt 11 variabler, men alle er numeriske.
Selvom du kan arbejde med datarammen, kan nogle variable konverteres til en faktor, fordi de har en begrænset mængde værdier.
Hvis du ikke ved, hvor mange forskellige værdier en variabel har, kan du få disse oplysninger i to enkle trin:
-
Få de unikke værdier af variablen ved hjælp af unik () .
-
Få længden af den resulterende vektor ved at bruge længde () .
Med funktionen sapply () kan du gøre det for hele datarammen på én gang. Du anvender en anonym funktion, der kombinerer begge de nævnte trin på hele datarammen, som denne:
Du har 32 forskellige observationer i datasættet, så ingen af variablerne har kun unikke værdier.
Når man skal behandle en variabel som en faktor, afhænger en smule af situationen, men som hovedregel undgår man mere end ti forskellige niveauer i en faktor og forsøger at have mindst fem værdier pr. Niveau.