Video: Hvordan håndterer man en manglende forståelse fra omverdenen? 2025
Funktionen cor () i R kan håndtere manglende dataværdier på flere måder. Dertil sættes argumentet til en af de mulige tekstværdier. Værdien for brugen argumentet er især vigtigt, hvis du beregner korrelationerne af variablerne i en dataramme. Ved at indstille dette argument til forskellige værdier kan du
-
Brug alle observationer ved at indstille use = 'everything' . Dette betyder, at hvis der er nogen NA-værdi i en af variablerne, er den resulterende korrelation også NA. Dette er standard.
-
Ekskluder alle observationer, der har NA for mindst en variabel. Til dette sætter du brug = 'komplet. obs'. Bemærk, at dette kun efterlader dig nogle få observationer, hvis manglende værdier spredes gennem hele datasættet.
-
Ekskluder observationer med NA værdier for hvert par variabler, du undersøger. Til dette indstiller du argumentet use = 'pairwise'. Dette sikrer, at du kan beregne korrelationen for hvert par variabler uden at miste information på grund af manglende værdier i de andre variabler.
Faktisk kan du beregne forskellige mål for korrelation. Som standard beregner R standard Pearson korrelationskoefficienten. For data, der ikke normalt distribueres, kan du bruge funktionen cor () til at beregne Spearman rangkorrelationen eller Kendalls tau. Til dette skal du angive metode argumentet til den relevante værdi.