Video: How We Make Videos 2025
R understøtter begrebet regulære udtryk, som giver dig mulighed for at søge efter mønstre inde i tekst. Du har måske aldrig hørt om regulære udtryk, men du er nok bekendt med det brede koncept. Hvis du nogensinde har brugt en * eller en? at angive et hvilket som helst bogstav i et ord, så har du brugt en form for wildcard-søgning. Regelmæssige udtryk understøtter ideen om jokertegn og meget mere.
Regelmæssige udtryk tillader tre måder at gøre et søgemønster mere generelt end et enkelt, fast udtryk:
-
Alternativer: Du kan søge efter forekomster af et mønster eller en anden, angivet ved | symbol. For eksempel matcher strand | bøg både strand og bøg.
På engelsk og amerikansk engelsk tastaturer kan du normalt finde | på samme nøgle som backslash ().
-
Gruppering: Du grupperer mønstre sammen ved hjælp af parenteser (). For eksempel skriver du (a | e) ch for at finde både strand og bøg.
-
Kvantifikatorer: Du angiver, om et element i mønsteret skal gentages eller ikke ved at tilføje * (forekommer nul eller mange gange) eller + (forekommer en eller mange gange). Hvis du f.eks. Finder bach eller bøg (nul eller mere af a og e men ikke begge), bruger du b (e * | en *) lm.
Prøv følgende eksempler. Opret først en ny variabel med fem ord: >> rwords <- c ("bach", "back", "beech", "beach", "black")
Find enten
strand > eller bøg ved hjælp af alternativ matchning:
Endelig skal du bruge kvantifieringsmodifikationen til at udpakke
bach < og
bøg
men ikke
strand:
rwords [grep ("b (e * | a *) ch", rwords)] [1] "bach" "bøg" > For at finde mere hjælp i R om regulære udtryk, se på Hjælp-siden? regexp. Nogle andre gode ressourcer til at lære mere om regulære udtryk er Wikipedia, og hvor du kan finde en hurtigstartguide og vejledninger.