Video: Det politiske alfabet på 3 minutter 2025
En samling af kombinerede bogstaver og ord kaldes en streng. Når du arbejder med tekst, skal du kunne sammenkæde ord (streng dem sammen) og opdele dem fra hinanden. I R, bruger du funktionen pasta () til at sammenkæde og strsplit () -funktionen opdeles. I dette afsnit viser vi dig, hvordan du bruger begge funktioner.
Opret først en tegnvektor kaldet pangram, og tildel værdien "Den hurtige brune ræv hopper over den dovne hund" som følger:
For at opdele denne tekst i
ordgrænser (mellemrum) kan du bruge strsplit () som følger: >> strsplit (pangram, "" [[1]] [1] "Den" "hurtige" "brune" "ræv" "hopper" hund " Bemærk, at den usædvanlige første linje i strsplit () s output består af [[1]]. På samme måde som R viser vektorer, betyder [[1]] at R viser det første element i en liste. Lister er yderst vigtige begreber i R; de giver dig mulighed for at kombinere alle slags variabler.
I det foregående eksempel har denne liste kun et enkelt element. Ja, det er rigtigt: Listen har et element, men det element er en vektor.
For at udtrække et element fra en liste skal du bruge dobbelte firkantede parenteser. Split din pangram i ord og tildel det første element til en ny variabel kaldet ord, ved hjælp af dobbeltkvarts parenteser ([[]]), som følger:ordord [1] "" "Hurtig" " brun "" ræv "" hopper "" over "" den "" doven "" hund "
For at finde de unikke elementer i en vektor, herunder en vektor af tekst, bruger du den unikke () funktion. I de variable ord vises "the" to gange: en gang i små bogstaver og en gang med det første bogstav aktiveret. For at få en liste over de unikke ord, skal du først konvertere ord til små bogstaver og derefter bruge unikke:
999 >> unik (tolower (ord)) [1] "" "hurtig" "brun" "ræv" "hopper" "over" "doven" [8] "hund"