Hjem Social Media (Ca.) Simulering af Central Limit Theorem i Excel - dummier

(Ca.) Simulering af Central Limit Theorem i Excel - dummier

Video: William Kahan, 1989 ACM Turing Award Recipient 2024

Video: William Kahan, 1989 ACM Turing Award Recipient 2024
Anonim

For at hjælpe dig med at forstå statistisk analyse med Excel, hjælper det med at simulere den centrale grænsestudie. Det lyder næsten ikke rigtigt. Hvordan kan en befolkning, der ikke normalt distribueres, resultere i en normalt distribueret prøveudtagningsfordeling?

For at give dig en ide om, hvordan Central Limit Theorem fungerer, er der en simulering. Denne simulering skaber noget som en stikprøvefordeling af middelværket for en meget lille prøve, baseret på en befolkning, der normalt ikke distribueres. Som du vil se, selv om befolkningen ikke er en normal fordeling, og selvom prøven er lille, ser stikprøvefordelingen af ​​gennemsnittet lidt ligesom en normal fordeling.

Forestil dig en stor befolkning, der består af kun tre scoringer - 1, 2 og 3 - og hver enkelt er ligeså sandsynlig at blive vist i en prøve. Forestil dig også, at du tilfældigt kan vælge en prøve på tre scorer fra denne population.

Alle mulige prøver af tre scorer (og deres midler) fra en befolkning bestående af scorerne 1, 2 og 3
Sample Mean Sample Mean Sample Middel
1, 1, 1 1. 00 2, 1, 1 1. 33 3, 1, 1 1. 67
1, 1, 2 1. 33 2, 1, 2 1. 67 3, 1, 2 2. 00
1, 1, 3 1. 67 2, 1, 3 2. 00 3, 1, 3 2. 33
1, 2, 1 1. 33 2, 2, 1 1. 67 3, 2, 1 2. 00
1, 2, 2 1. 67 2, 2, 2 2. 00 3, 2, 2 2. 33
1, 2, 3 2. 00 2, 2, 3 2. 33 3, 2, 3 2. 67
1, 3, 1 1. 67 2, 3, 1 2. 00 3, 3, 1 2. 33
1, 3, 2 2. 00 2, 3, 2 2. 33 3, 3, 2 2. 67
1, 3, 3 2. 33 2, 3, 3 2. 67 3, 3, 3 3. 00

Hvis du ser tæt på bordet, kan du næsten se, hvad der sker i simuleringen. Prøven betyder, der forekommer hyppigst, er 2. 00. Prøveindretningen, der forekommer mindst hyppigt, er 1. 00 og 3. 00. Hmmm …

I simuleringen blev en score tilfældigt udvalgt fra befolkningen og derefter tilfældigt valgt to mere. Den gruppe af tre point er en prøve. Så beregner du gennemsnittet af denne prøve. Denne proces blev gentaget for i alt 60 prøver, hvilket resulterede i 60 prøveorganer. Endelig chartrer du fordelingen af ​​prøveorganerne.

Hvad ser den simulerede prøveudtagning af det gennemsnitlige ud? Billedet nedenfor viser et regneark, der svarer til dette spørgsmål.

I regnearket er hver række en prøve.Kolonnerne mærket x1, x2 og x3 viser de tre resultater for hver prøve. Kolonne E viser gennemsnittet for prøven i hver række. Kolonne G viser alle mulige værdier for prøveværdien, og kolonne H viser, hvor ofte hver middel ses i de 60 prøver. Kolonner G og H og grafen viser, at fordelingen har sin maksimale frekvens, når prøven betyder, er 2. 00. Frekvenserne haler ud, når prøveorganerne kommer længere og længere væk fra 2. 00.

Pointen med alt dette er, at befolkningen ikke ser noget ud som en normal fordeling, og stikprøvestørrelsen er meget lille. Selv under disse begrænsninger begynder prøveudtagningen af ​​middelværdien baseret på 60 prøver at se meget ud som en normal fordeling.

Hvad med parametrene forudsiger Central Limit Theorem for prøveudtagningsfordelingen? Start med befolkningen. Befolkningens gennemsnit er 2. 00 og befolkningsstandardafvigelsen er. 67. (Denne type befolkning kræver nogle lidt fancy matematik til at finde ud af parametrene.)

Til prøveudtagningsfordelingen. Middelværdien af ​​de 60 midler er 1. 98, og deres standardafvigelse (et estimat af standard fejlen i middelværdien) er. 48. Disse tal nærmer sig de centrale grænsestruktur-forudsagte parametre for prøveudtagningsfordelingen af ​​middelværdien, 2,00 (lig med populationens middelværdi) og. 47 (standardafvigelsen, 67, divideret med kvadratroten på 3, prøvestørrelsen).

Hvis du er interesseret i at gøre denne simulering, er der følgende trin:

  1. Vælg en celle til dit første tilfældigt valgte nummer.

    Vælg celle B2.

  2. Brug regnearkfunktionen RANDBETWEEN til at vælge 1, 2 eller 3.

    Dette simulerer tegning af et tal fra en befolkning bestående af tallene 1, 2 og 3, hvor du har lige chance at vælge hvert nummer. Du kan enten vælge FORMULAS | Math & Trig | RANDBETWEEN og brug dialogboksen Funktionsargumenter eller skriv kun = RANDBETWEEN (1, 3) i B2, og tryk på Enter. Det første argument er det mindste antal RANDBETWEEN returnerer, og det andet argument er det største antal.

  3. Vælg cellen til højre for den oprindelige celle og vælg et andet tilfældigt tal mellem 1 og 3. Gør dette igen for et tredje tilfældigt tal i cellen til højre for den anden.

    Den nemmeste måde at gøre dette på er at autofyldre de to celler til højre for den oprindelige celle. I dette regneark er disse to celler C2 og D2.

  4. Overvej disse tre celler for at være en prøve og beregne deres gennemsnit i cellen til højre for den tredje celle.

    Den nemmeste måde at gøre dette på er blot at skrive = AVERAGE (B2: D2) i celle E2 og tryk på Enter.

  5. Gentag denne proces for så mange prøver, som du vil medtage i simuleringen. Har hver række svarer til en prøve.

60 prøver blev brugt her. Den hurtige og nemme måde at få dette på er at vælge den første række af tre tilfældigt valgte tal og deres gennemsnit og derefter autofyld de resterende rækker. Sættet af prøveorganer i kolonne E er den simulerede prøveudtagningsfordeling af middelværdien.Brug MIDDEL og STDAFV. P for at finde sin gennemsnitlige og standardafvigelse.

For at se, hvordan denne simulerede prøveudtagningsdistribution ser ud, skal du bruge arrayfunktionen FREQUENCY på prøveindretningen i kolonne E. Følg disse trin:

  1. Indtast de mulige værdier for prøveværdien i en matrix.

    Du kan bruge kolonne G til dette. Du kan udtrykke de mulige værdier af prøveværdien i fraktionsform (3/3, 4/3, 5/3, 6/3, 7/3, 8/3 og 9/3) som dem, der trådte ind i cellerne G2 til og med G8. Excel konverterer dem til decimalformular. Sørg for, at disse celler er i nummerformat.

  2. Vælg et array for frekvenserne af de mulige værdier af sample mean.

    Du kan bruge kolonne H til at holde frekvenserne og vælge cellerne H2 til H8.

  3. Vælg FREQUENCY i menuen Statistiske funktioner for at åbne dialogboksen Funktionsargumenter for FREQUENCY
  4. Indtast de relevante værdier for argumenterne i dialogboksen Funktionsargumenter.

    I feltet Data_array skal du indtaste de celler, der holder prøveemnet. I dette eksempel er det E2: E61.

  5. Identificer det array, der indeholder de mulige værdier af stikprøveværdien.

    FREQUENCY holder dette array i boksen Bins_array. For dette regneark går G2: G8 ind i feltet Bins_array. Når du har identificeret begge arrays, viser dialogboksen Funktionsargumenter frekvenserne inden for et par krøllede parenteser.

  6. Tryk på Ctrl + Skift + Enter for at lukke dialogboksen Funktionsargumenter og vise frekvenserne.

    Brug denne tastetryk kombination, fordi FREQUENCY er en array funktion.

  7. Endelig, med H2: H8 fremhævet, vælg Indsæt | Anbefalede diagrammer og vælg layoutet Clustered Column for at producere grafen for frekvenserne. Din graf vil nok se lidt anderledes ud end min, fordi du sandsynligvis vil komme op med et andet tilfældigt tal.

Eksempelvis gentager Excel den tilfældige udvælgelsesproces, når du gør noget, der forårsager, at Excel genberegner regnearket. Effekten er, at tallene kan ændre sig, mens du arbejder igennem dette. (Det betyder, at du genopretter simuleringen.) Hvis du for eksempel går tilbage og autofyld en af ​​rækkerne igen, ændres tallene, og grafen ændres.

(Ca.) Simulering af Central Limit Theorem i Excel - dummier

Valg af editor

Fuld redigeringsfunktion i Photoshop Elements 10 - dummies

Fuld redigeringsfunktion i Photoshop Elements 10 - dummies

Fuld fotoredigeringsfunktion tilbyder bundter af værktøjer, som du kan bruge at redigere dine billeder, fra korrektionsværktøjer til fastsættelse af farve og klarhed til filtre, lag og meget mere for at ændre eksisterende fotos eller skabe helt originale billeder fra bunden. Men alle disse værktøjer gør også Komplet fotoredigeringstilstand kompleks. Du kan flytte ind i ...

Generelle blandingsformer i Photoshop Elements - dummies

Generelle blandingsformer i Photoshop Elements - dummies

Elementer spænder over 25 blandingstilstande. Blend modes påvirker hvordan farver interagerer mellem lag og også hvordan farver interagerer, når du anvender maling på et lag. Ikke alene gør blandingstilstande interessante effekter, men du kan også nemt anvende, redigere eller fjerne blandingsfunktioner uden at røre dine billedpixel. De forskellige blandingstilstande ...

Geometriske formindstillinger i Photoshop Elements - dummies

Geometriske formindstillinger i Photoshop Elements - dummies

Geometriindstillinger hjælpe med at definere, hvordan dine figurer ser ud. Klik på nedpegepilen i værktøjsindstillingerne i Elements for at få adgang til de geometriske indstillinger, der beskrives i det følgende. Rektangulære og afrundede rektangel geometriske indstillinger Her er geometriske indstillinger for rektangel og afrundede rektangelformer: Ubegrænset: Giver dig mulighed for at få fri tøj til at tegne en ...

Valg af editor

Sådan bygger du tabeller i HTML5 - dummies

Sådan bygger du tabeller i HTML5 - dummies

Sommetider indeholder din webside data bedst fremlagt i et bord . Du kan bruge HTML5's komplette bordsystem til at oprette tabeller som den i dette eksempel: Den grundlæggende struktur i et bord i HTML-format er rimeligt let at forstå; Tjek koden, der oprettede tabellen i eksemplet:

Hvordan man ændrer gentagne baggrunde på CSS3-steder - dummier

Hvordan man ændrer gentagne baggrunde på CSS3-steder - dummier

Der er situationer, hvor man kun vil en enkelt kopi af et baggrundsbillede på dit CSS3-websted. Det kan være, at billedet du har brugt er noget, der ikke gentager sig godt eller er stort nok til, at du virkelig ikke vil have det gentaget. Følgende procedure viser en teknik, du kan bruge til at fortælle ...

Hvordan man opbygger en webside skabelon fra scratch-dummies

Hvordan man opbygger en webside skabelon fra scratch-dummies

Standardværktøjet på tværs af digitalt agenturer og interne afdelinger til opbygning af website grafik er Adobe Photoshop. Selvom fyrværkeri er optimeret og målrettet til at producere web-grafiske kildefiler, er det bare ikke fanget, sandsynligvis på grund af den massive genoplæringsindsats ville det medføre, at hele afdelinger gør omskifteren. At oprette et nyt ...

Valg af editor

Sådan godkendes medlemmer til din LinkedIn Group - dummier

Sådan godkendes medlemmer til din LinkedIn Group - dummier

Som flere og flere mennesker finder ud af din ny LinkedIn-gruppe, og som medlemmer begynder at deltage, kan du opleve, at nogle af de personer, der har klikket på linket for at deltage, ikke er på din forhåndsgodkendte liste. Måske er de mennesker, du ikke har forstået var på LinkedIn, eller du var ikke klar over, at de var gyldige grupper ...

Hvordan man tilføjer billeder til kroppen i din LinkedIn-profil til Visual Social Marketing - dummies

Hvordan man tilføjer billeder til kroppen i din LinkedIn-profil til Visual Social Marketing - dummies

Ud over et profilbillede giver LinkedIn brugere mulighed for at forbedre de visuelle sociale markedsføringselementer i deres profiler ved at tilføje billeder til deres profilprofil. Du kan tilføje billeder til ethvert afsnit i din LinkedIn-profil. Tilføjelse af billeder til din profil kan hjælpe dig med at fortælle din historie visuelt og ...

Sådan tilføjer du en virksomhedsside til LinkedIn - dummies

Sådan tilføjer du en virksomhedsside til LinkedIn - dummies

, Når du har opfyldt kravene til oprettelse en virksomhedsside på LinkedIn, er det tid til at komme i gang ved at tilføje selskabets side til Linkedins system. For at oprette din virksomhedsside skal du blot følge disse trin: