Video: Free to Play: The Movie (US) 2024
Lineær regression er et godt værktøj til at lave forudsigelser med Excel. Når du kender hældningen og afsnittet af linjen, der vedrører to variabler, kan du tage en ny x- værdi og forudsige en ny y- værdi. I det eksempel, du har arbejdet igennem, tager du en SAT-score og forudsiger en GPA for en Sahutsket-universitetsstuderende.
Hvad hvis du vidste mere end blot SAT score for hver elev? Hvad hvis du havde den studerendes højskole gennemsnit (på 100 skala), og du kunne også bruge disse oplysninger? Hvis du kunne kombinere SAT score med HS gennemsnit, kan du have en mere præcis forudsigelse end SAT score alene.
Når du arbejder med mere end en uafhængig variabel, er du i området med multiple regression. Som i lineær regression finder du regressionskoefficienter for den bedst tilpassede linje gennem en scatterplot. Endnu betyder bedst at summen af de kvadrerede afstande fra datapunkterne til linjen er et minimum.
Med to uafhængige variabler kan du dog ikke vise en scatterplot i to dimensioner. Du har brug for tre dimensioner, og det bliver svært at tegne.
For SAT-GPA-eksemplet oversætter regressionsligningen til
Forudsat GPA = a + b 1 (SAT) + b 2 (High School Average)
Du kan teste hypoteser om den overordnede pasform og om alle tre regressionskoefficienterne.
Lad os tjekke Excel-mulighederne for at finde koefficienter.
Nogle ting at huske på:
- Du kan have et hvilket som helst antal x- variabler.
- Forvent koefficienten for SAT at skifte fra lineær regression til multipel regression. Forvent at aflytte at ændre sig også.
- Forvent at estimatets standardfejl falder fra lineær regression til multipel regression. Fordi flere regressioner bruger mere information end lineær regression, reduceres fejlen.