Video: The Constitution of the Spartans 2025
Sørg for, at du kontrollerer omhyggeligt for uregelmæssigheder før de påvirker din forudsigelsesanalyse. Outliers kan forvride både data og data analyse. For eksempel kan enhver statistisk analyse udført med data, der efterlader outliers på plads, ende med at skævme midlerne og afvigelserne.
Ukontrollerede eller fejlagtige afvigere kan føre til falske konklusioner. Sig dine data, der viser, at en aktie, der blev handlet i et helt år til en pris over $ 50 - men for kun få minutter ud af det hele år var børsen handlet til 20 dollar. Prisen på $ 20 - en åbenbar undtagelse - er outlier i dette datasæt.
Nu skal du beslutte, om du vil inkludere aktiekursen på $ 20 i din analyse; hvis du gør det, har det ramifications for den overordnede model. Men hvad mener du normalt? Var & ldquo; flash crash & rdquo; der overraskede aktiemarkedet den 6. maj 2010, en normal begivenhed eller en undtagelse?
På den korte tid oplevede aktiemarkedet et kraftigt fald i priserne på tværs af brættet - som slog prøvekursen ned fra $ 50 til $ 20, men havde mindre at gøre med bestanden end med større markedsforhold. Har din model brug for at tage højde for de store udsving i aktiemarkedet?
Enhver, der har mistet penge på korte øjeblikke på markedet for frit fald, betragter de få minutter ægte og normale (selvom de følte sig som en evighed at gå igennem). En portefølje, der formindskes i millisekunder på grund af et hurtigt fald, omend kortvarigt, er tydeligt reelt. Men flashcrash er en anomalie, en outlier, som udgør et problem for modellen.
Uanset hvad der anses for normalt (hvilket kan ændre sig alligevel) indeholder data nogle gange værdier, der ikke passer til de forventede værdier. Dette gælder især på aktiemarkedet, hvor stort set enhver begivenhed kan sende markedet, der flyver eller vælter. Du vil ikke have din model til at fejle, når virkeligheden ændres pludselig - men en model og en realitet er to forskellige ting.