Indholdsfortegnelse:
- Tilføjelse af en enkelt variabel
- Selv om rækkenavne på datarammerne er nye. df og kurve. df adskiller, vil R ignorere dette og bare bruge rækkenavnet på den første dataramme i cbind () -funktionen, som du kan se fra udgangen af følgende kode: >> hoved (cbind (kurve. df, nyt .df), 4) Granny Geraldine Gabrielle Gertrude Guinevere 1. 12 5 11 3 6 2. 4 4 5 5 9 3 5 2 6 2 7 4 6 4 7 1 3
Video: Data Analysis in R by Dustin Tran 2025
En dataramme kan udvides med nye variabler i R. Du kan f.eks. Få data fra en anden spiller på Granny's team. Eller måske vil du beregne en ny variabel fra de andre variabler i datasættet, som den samlede sum af kurve, der er lavet i hvert spil.
Tilføjelse af en enkelt variabel
Der er tre hovedmåder til at tilføje en variabel. Ligesom tilfældet med at tilføje observationer kan du bruge enten cbind () -funktionen eller indekserne.
Du kan også bruge dollartegnet til at tilføje en ekstra variabel. Forestil dig, at Granny bad dig om at tilføje antallet af kurve af hendes ven Gabrielle til datarammen. For det første ville du oprette en vektor med disse data som denne: >> kurve. af. Gabrielle <- c (11, 5, 6, 7, 3, 12, 4, 5, 9)
For at oprette en ekstra variabel navngivet Gabrielle med disse data, gør du simpelthen følgende: >> kurve. df $ Gabrielle <- kurve. af. Gabrielle
Hvis du vil kontrollere, om dette virker, men du ikke vil vise den komplette dataramme, kan du bruge hovedfunktionen (). Denne funktion tager to argumenter: Det objekt, du vil vise, og antallet af rækker, du vil se. For at se de første fire rækker af den nye dataramme, kurve. df, brug følgende kode:
>> hoved (kurve. Df, 4) Granny Geraldine Gabrielle 1. 12 5 11 2 4 4 5 3 5 2 6 4 6 4 7
Tilføjelse af flere variabler ved hjælp af bånd
Du kan foregive din dataramme er en matrix og brug funktionen cbind () til at gøre dette. I modsætning til når du bruger rbind () på datarammer, behøver du ikke engang at bekymre dig om rækken eller kolonnens navne. Lad os oprette en ny dataramme med målene for Gertrude og Guinevere. For at kombinere både i en dataramme, prøv:>> nyt. df <- data. ramme (+ Gertrude = c (3, 5, 2, 1, NA, 3, 1, 1, 4), + Guinevere = c (6, 9, 7, 3, 3, 6, 2, 10, 6) +)
Selv om rækkenavne på datarammerne er nye. df og kurve. df adskiller, vil R ignorere dette og bare bruge rækkenavnet på den første dataramme i cbind () -funktionen, som du kan se fra udgangen af følgende kode: >> hoved (cbind (kurve. df, nyt.df), 4) Granny Geraldine Gabrielle Gertrude Guinevere 1. 12 5 11 3 6 2. 4 4 5 5 9 3 5 2 6 2 7 4 6 4 7 1 3
Når du bruger en dataramme eller en matrix med kolonne navne, R vil bruge dem som navnene på variablerne. Hvis du bruger cbind () for at tilføje en vektor til en dataramme, vil R bruge vektorens navn som variabelnavn, medmindre du angiver en selv, som du gjorde med rbind ().
Hvis du binder en matrix uden kolonne navne til datarammen, bruger R automatisk kolonne numrene som navne.Det vil dog medføre problemer, fordi almindelige tal er ugyldige objektnavne og dermed vanskeligere at bruge som variable navne. I dette tilfælde vil du bedre bruge indekserne.Når du vil bruge en dataramme og ikke vil have vedvarende at skrive sit navn efterfulgt af $, kan du bruge funktionerne med () og indenfor (). Med funktionen inden () kan du også nemt tilføje variabler til en dataramme.