Video: IT Chapter Two 2025
Statistikere skal ofte tage stikprøver af data og derefter beregne statistikker. At tage en prøve er let med R, fordi en prøve egentlig ikke er mere end en delmængde af data. For at gøre det bruger du prøve (), som tager en vektor som input; så fortæller du det, hvor mange prøver der skal tegnes fra den pågældende liste.
Sig du ønskede at simulere ruller af en dør, og du vil have ti resultater. Fordi resultatet af en enkelt rulle af en dør er et tal mellem et og seks, ser din kode sådan ud:
Du fortæller prøve () for at returnere ti værdier, hver i intervallet 1: 6. Fordi hver rulle af dysen er uafhængig af hver anden rulle af dysen, er du prøveudtagning med udskiftning. Dette betyder at du tager en prøve fra listen og nulstiller listen til sin oprindelige tilstand (med andre ord, sætter du det element, du lige har trukket tilbage på listen).
Da returværdien af stikprøve () -funktionen er et tilfældigt bestemt nummer, vil du få forskellige resultater hver gang, hvis du forsøger denne funktion gentagne gange. Dette er den rigtige opførsel i de fleste tilfælde, men nogle gange kan du få repeterbare resultater hver gang du kører funktionen.
Dette sker normalt kun, når du udvikler og tester din kode, eller hvis du vil være sikker på, at en anden kan teste din kode og få de samme værdier du gjorde. I dette tilfælde er det sædvanligt at angive en såkaldt
frøværdi.
Men hvis du ikke indstiller frøet, trækker R fra den nuværende tilstand af tilfældig talgeneratoren (RNG). Ved opstart kan R indstille et tilfældigt frø til initialisering af RNG, men hver gang du kalder det starter R fra den næste værdi i RNG-strømmen. Du kan læse hjælpen til? RNG for at få flere detaljer.
I R bruger du sæt. frø () funktion til at angive din frø start værdi. Argumentet for at indstille. frø () er en heltalværdi. >> sæt. frø (1)> prøve (1: 6, 10, erstat = TRUE) [1] 2 3 4 6 2 6 6 4 4 1
Hvis du tegner en anden prøve uden at sætte et frø, får du et andet sæt resultater, som du ville forvente: >> prøve (1: 6, 10, erstat = TRUE) [1] 2 2 5 3 5 3 5 6 3 5
Nu for at demonstrere det sæt.frø () rent faktisk nulstiller RNG, prøv det igen. Men denne gang sæt frøet igen: >> sæt. frø (1)> prøve (1: 6, 10, erstat = TRUE) [1] 2 3 4 6 2 6 6 4 4 1
Du får nøjagtigt de samme resultater som den første gang du brugte. frø (1).
Du kan bruge prøve () til at tage prøver fra datarammen iris. I dette tilfælde kan du bruge argumentet erstat = FALSK. Fordi dette er standardværdien af erstatningsargumentet, behøver du ikke at skrive det eksplicit: >> sæt. frø (123)> indeksindeks [1] 44 119 62 133 142> iris [indeks,] Sepal. Længde Sepal. Bredde kronblad. Længde kronblad. Bredde Arter 44 5. 0 3. 5 1. 6 0. 6 Setosa 119 7. 7 2. 6 6. 9 2. 3 Virginica 62 5. 9 3. 0 4. 2 1. 5 Versicolor 133 6. 4 2. 8 5. 6 2. 2 virginica 142 6. 9 3. 1 5. 1 2. 3 virginica