Video: Biblical Series I: Introduction to the Idea of God 2025
Du har datasættet, og du har formateret det for at passe til dine behov i R, så nu er du klar til det rigtige arbejde. Analysere dine data begynder altid med at beskrive den. På denne måde kan du registrere fejl i dataene, og du kan bestemme hvilke modeller der er relevante for at få de oplysninger, du har brug for fra de data, du har.
Hvilken beskrivende statistik du bruger afhænger naturligvis af dine data.
Nogle gange er du mere interesseret i det generelle billede af dine data, end du er i de enkelte værdier. Du kan være interesseret ikke i kilometertal for hver bil, men i den gennemsnitlige kilometertal for alle biler fra datasættet. Til dette beregner du middelværdien ved hjælp af den gennemsnitlige () funktion som denne: >> mean (cars $ mpg) [1] 20. 09062
Du kunne også beregne det gennemsnitlige antal cylindre, som disse biler har, men det giver ikke noget mening. Gennemsnittet ville være 6. 1875 cylindre, og ingen biler kører med en ufuldstændig cylinder. I dette tilfælde er
medianen - den mest centrale værdi i dine data - mere fornuftig. Du får medianen fra at bruge funktionen median (), som denne: