Video: Måling af massefylde vha. lineær regression 2025
Lineær regression er en statistisk metode, der analyserer og finder relationer mellem to variabler. I predictive analytics kan den bruges til at forudsige en fremtidig numerisk værdi af en variabel.
Overvej et eksempel på data, der indeholder to variabler: Tidligere data bestående af ankomsttider for et tog og dets tilsvarende forsinkelsestid. Antag at du vil forudsige, hvad forsinkelsen ville være for det næste tog. Hvis du anvender lineær regression til disse to variabler - ankomst- og forsinkelsestiderne - kan du generere en lineær ligning som
Forsinkelse = a + (b * Ankomsttid) + d
Denne ligning udtrykker forholdet mellem forsinkelsestid og ankomsttidspunkt. Konstanterne a og b er modelens parametre. Variablen d er -fejlperioden (også kendt som resten ) - en numerisk værdi, der repræsenterer fejlparametre mellem de to variabler forsinkelse > og ankomsttid . Hvis fejlen ikke er lig med nul, kan det tyde på, at der er kriterier, der påvirker variablen forsinkelse .
a, b, og d . Linjær regression er (som du måske forestiller dig) mest egnet til lineære data. Men det er meget følsomt over for outliers i datapunkterne. Outliers i dine data kan have en væsentlig indflydelse på modellen. Det anbefales at fjerne disse outliers fra træningssættet, hvis du planlægger at bruge lineær regression til din prædiktive model.