Video: Entity Relationship Diagram (ERD) Tutorial - Part 1 2025
Du identificerer midten af et datasæt med flere forskellige sammendragsforanstaltninger. Disse omfatter de store tre: middel, median og mode. Du beregner middelværdien af et datasæt ved at tilføje værdierne for alle elementerne og dividere med det samlede antal elementer. Antag for eksempel, at et lille datasæt består af det antal dage, der kræves for at modtage en pakke af beboerne i et lejlighedskompleks:
1, 2, 2, 4, 7, 9, 10
Middelværdien af dette datasæt ville være følgende:
Den gennemsnitlige længde af tid for beboerne at modtage en pakke er 5 dage.
Den median af et datasæt er en værdi, der deler dataene i halvdelen. Den første halvdel indeholder de mindste elementer, og anden halvdel består af de største elementer. I det foregående eksempel, fordi dataene består af syv observationer, ville den fjerde mindste værdi være medianen:
1, 2, 2, 4, 7, 9, 10
Medianen er 4, fordi halvdelen af observationerne er mindre end 4 og halvdelen er større end 4.
mode af et datasæt er simpelthen den hyppigst forekommende værdi. Med pakkeafleveringseksemplet er tilstanden 2.
For et virkeligt eksempel viser dette tal et histogram for dagligt afkast til ExxonMobil lager i 2013.
Hver linje repræsenterer et interval af værdier; bredden af hvert interval er 0. 005. Højderne af stængerne angiver, hvor mange afkast der er faldet inden for hvert interval. Histogrammet gør det nemt at se, hvilke værdier der er mest forekommende, og som forekom mest sjældent.
Histogrammet viser, at de fleste afkast er tæt på gennemsnittet, hvilket er 0. 000632 (0. 0632 procent). Medianen er -0. 000118, og tilstanden kunne anses for at være værdien mellem -0. 005 og 0.