Video: Recommender Systems 2025
Du vil måske kombinere data fra forskellige kilder i din analyse. Generelt kan du bruge R til at kombinere forskellige datasæt på tre måder:
-
Ved at tilføje kolonner: Hvis de to sæt data har et lige sæt rækker, og rækkefølgen af rækkerne er identisk, så at tilføje kolonner giver mening. Dine muligheder for at gøre dette er data. ramme eller bånd ().
-
Ved at tilføje rækker: Hvis begge sæt data har de samme kolonner, og du vil tilføje rækker til bunden, skal du bruge rbind ().
-
Ved at kombinere data med forskellige former: Funktionen Merge () kombinerer data baseret på almindelige kolonner, såvel som fælles rækker. I databasens sprog kaldes dette normalt tilslutning af data.
Du bruger flette () for at finde skæringspunktet, såvel som foreningen, af forskellige datasæt. Du ser også på andre måder at arbejde med opslagstabeller ved hjælp af funktionerne match () og% i%.
Nogle gange vil du kombinere data, hvor det ikke er så ligetil at blot tilføje kolonner eller rækker. Det kan være, at du vil kombinere data baseret på værdierne af tidligere eksisterende nøgler i dataene. Det er her, hvor funktionen fusion () er nyttig. Du kan bruge flette () til kun at kombinere data, når visse matchende betingelser er opfyldt.
Sig, for eksempel, har du oplysninger om stater i et land. Hvis et datasæt indeholder oplysninger om befolkning og en anden indeholder oplysninger om regioner, og begge har oplysninger om statens navn, kan du bruge flette () til at kombinere dine resultater.