Video: CS50 2016 Week 0 at Yale (pre-release) 2025
boksplot er designet til at vise flere vigtige statistikker for et datasæt i form af et lodret rektangel eller et felt. De statistikker, den kan vise, omfatter følgende: Minimumsværdi
-
Maksimumsværdi
-
Første kvartil (Q
-
1 ) Andet kvartil (Q
-
2 ) < Tredje kvartil (Q 3
-
) Interquartile-interval (IQR)
-
Et
første kvartil
af et datasæt er et numerisk mål, der deler dataene i to dele: den mindste 25 procent af observationerne og de største 75 procent af observationerne. Med andre ord er det første kvartil en numerisk værdi med følgende egenskaber: 25 procent af observationerne i datasættet er mindre end
-
det første kvartil. 75 procent af observationerne i datasættet er større end
-
det første kvartil. (også kendt som
median ) dataene i halvdelen, så 50 procent af elementerne er mindre end medianen, og 50 procent er større. tredje kvartil er værdien, som følgende er sandt:
75 procent af observationerne i datasættet er mindre end det tredje kvartil.
-
25 procent af observationerne i datasættet er større end det tredje kvartil.
-
interkvartileområdet (IQR) er forskellen mellem det tredje kvartil og det første kvartil: IQR = Q
3
- Q 1 >. Interkvartileområdet er et mål på dispersion; det viser, hvor meget spredning der er mellem elementerne i midten af 50 procent af et datasæt. En boksplot er tegnet således, at Bokens top repræsenterer
tredje kvartil (Q 3) af dataene.
-
Bunden af boksen repræsenterer dataene første kvartil (Q 1 ).
-
Midten af kassen (vist med en linje) repræsenterer andet kvartil (Q 2 ).
-
Derudover er der en linje over boksen for at angive værdien maksimum i de data, der ikke overstiger Q
3 + 1. 5 x IQR og en linje under boksen for at angive værdien minimum i de data, der ikke falder under Q 1 - 1. 5 x IQR. Værdier uden for dette interval er outliers og vises på boksplottet som individuelle punkter. Denne figur viser et boksplot af de daglige priser på Microsoft-lager fra 1. januar 2013 til 31. december 2013. Boksplot af daglige priser for Microsoft-lager. Der er ingen fejl i disse data.Derfor viser bundlinjen i boksplottet, at den laveste pris i denne periode var noget mindre end 26 dollar. 00, og øverste linje viser, at den højeste pris var lidt over $ 38. Bunden af boksen svarer til den første kvartil, som er $ 27. 43; Den faste linje i midten af boksen svarer til den anden kvartil (median), som er $ 31. 89. Bokens top svarer til det tredje kvartil, hvilket er 33 dollar. 78. Højden af kassen er lig med interkvartileområdet (IQR), som er $ 6. 35. Som et andet eksempel viser denne figur et boksplot af de daglige priser på Apple-lager fra 1. januar 2013 til 31. december 2013. Boksplot af daglige priser for Apple-lager fra 1. januar 2013 til 31. december 2013.
Den laveste pris i 2013 for Apple-lager var 53 dollar. 84, og den højeste pris var $ 80. 11. Der er ingen fejl i dataene, så disse værdier vises henholdsvis i bundlinjen og i den øverste linje.
Det første kvartil, der blev vist i bunden af kassen, var $ 60. 48. Det andet kvartil var 63 dollar. 65 (vist ved den solide sorte linje), og det tredje kvartil var $ 70. 32, vist øverst på kassen. Som følge heraf er interkvartileområdet (IQR) $ 9. 84.