Hjem Personlig finansiering Hvordan man opretter en prædiktiv Analytics-model med R Regression - dummies

Hvordan man opretter en prædiktiv Analytics-model med R Regression - dummies

Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2025

Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2025
Anonim

Du vil oprette en prædiktiv analysemodel, som du kan evaluere ved hjælp af kendte resultater. For at gøre det skal vi opdele vores datasæt i to sæt: en til træning af modellen og en til test af modellen. En 70/30 opdeling mellem træning og testning af datasæt er tilstrækkelig. De næste to kodelinjer beregner og gemmer størrelserne på hvert sæt: >> trainSize testSize <- nrow (autos) - trainSize

For at udlæse værdierne skal du indtaste navnet på variablen, der bruges til at gemme værdien og tryk på Enter. Her er output:

>> trainSize [1] 279> testSize [1] 119

Denne kode bestemmer størrelsen af ​​de datasæt, som du har til hensigt at lave vores trænings- og testdatasæt. Du har stadig ikke faktisk oprettet disse sæt. Desuden ønsker du ikke blot at kalde de første 279 observationer, træningssættet og ringe til de sidste 119 observationer, testen indstillede. Det ville skabe en dårlig model, fordi datasættet vises bestilt. Specifikt er model Year kolonnen bestilt fra mindste til største.

Fra undersøgelsen af ​​dataene kan du se, at de fleste af de tungere, ottecylindrede, større forskydning, større hestekræfter er placeret øverst på datasættet. Fra denne observation, uden at skulle køre nogen algoritmer på dataene, kan du allerede fortælle (i almindelighed for dette datasæt) ældre biler i forhold til nyere biler som følger:

Er tungere

Har otte cylindre

  • Har større forskydning

  • Har større hestekræfter

    Okay, selvfølgelig ved mange mennesker noget om biler, så et gæt om, hvad korrelationerne er, vil ikke være for farvede efter at du har set dataene. En person med en masse bilkundskaber kan allerede have kendt dette uden at se på dataene.
  • Dette er blot et simpelt eksempel på et domæne (biler), som mange mennesker kan forholde sig til. Hvis dette var data om kræft, ville de fleste ikke umiddelbart forstå, hvad hver attribut betyder.

Her er en domæneekspert og en datamodeller afgørende for modelleringsprocessen. Domæneeksperter kan have den bedste viden om hvilke egenskaber der er mest (eller mindst) vigtige - og hvordan attributter korrelerer med hinanden.

De kan foreslå datamodellen, hvilke variabler der skal eksperimentere med. De kan give større vægt til vigtige attributter og / eller mindre vægte til attributter af mindst betydning (eller fjern dem helt).

Så du skal lave et træningsdatasæt og et testdatasæt, der er virkelig repræsentativt for hele sættet. En måde at gøre det på er at oprette træningssættet fra et tilfældigt udvalg af hele datasættet.Derudover vil du gøre denne test reproducerbar, så du kan lære af det samme eksempel.

Sæt så frøet for tilfældiggeneratoren, så vi får det samme "tilfældige" træningssæt. Følgende kode gør denne opgave: >> sæt. frø (123)> training_indices <- sample (seq_len (nrow (autos)), size = trainSize)> trainSet testSæt <- autos [-training_indices,]

Træningssættet indeholder 279 observationer sammen med resultatet (mpg) for hver observation. Regressionsalgoritmen bruger resultatet til at træne modellen ved at se på relationerne mellem forudsigelsesvariablerne (hvilket som helst af de syv attributter) og responsvariablen (mpg).

Testsættet indeholder resten af ​​dataene (det vil sige den del, der ikke er inkluderet i træningssættet). Du bør bemærke, at testsætet også indeholder variablen svar (mpg). 

Når du bruger forudsigelsesfunktionen (fra modellen) med testsættet, ignorerer du svarsvariablen og bruger kun forudsigelsesvariablerne, så længe kolonne navne er de samme som i træningssættet.

Hvis du vil oprette en lineær regressionsmodel, der bruger mpg-attributten som svarvariabel og alle de andre variabler som forudsigelsesvariabler, skal du skrive følgende linie kode: >> model

Hvordan man opretter en prædiktiv Analytics-model med R Regression - dummies

Valg af editor

Fotografering af fugle Brug af dine digitale spejlreflekskameraer

Fotografering af fugle Brug af dine digitale spejlreflekskameraer

Du kan optage interessante billeder af fugle store og små med din digitale spejlreflekskamera . Du behøver bare lidt tålmodighed og lidt viden om den fugl, du vil fotografere. En fuglefoder er et ideelt sted at fotografere små fugle. Du kan rejse til et område med en sø eller flod eller til ...

Fotografering af byer med dine digitale spejlreflekskameraer

Fotografering af byer med dine digitale spejlreflekskameraer

Om du bor i en søvnig lille by eller en storby, der overfylder menneskeheden kan din digitale spejlreflekskamera fange hjertet og sjælen i din hjemby. Du kan eksperimentere med at tage billeder om natten, når byen er dramatisk eller øde eller om dagen, når beboerne og deres aktiviteter gør byen ...

Fotografering af objekter i bevægelse - dummier

Fotografering af objekter i bevægelse - dummier

Der er et par tankeskoler om fotografering af objekter i bevægelse. Opskriften på en perfekt eksponering kan opnås på mange måder. Du kan vælge en lille blænde (stort f-stopnummer) for at få en stor dybdeskarphed, eller du kan vælge en hurtig lukkerhastighed, hvilket betyder en stor blænde (lille ...

Valg af editor

Hvordan man fortjener mor fra blogging uden at sælge - dummier

Hvordan man fortjener mor fra blogging uden at sælge - dummier

Sælger er et udtryk, der anvendes til kompromittere din integritet, principper eller moral for at vinde penge eller succes. Problemet er, at hvis alle havde de samme principper og definition af integritet, ville der ikke være meget behov for forskellige politiske partier eller religioner. Folk kan anklaget for at sælge ud, hvis de simpelthen gør ting som ...

Hvordan man korrekt bruger nøgleord til din online community - dummies

Hvordan man korrekt bruger nøgleord til din online community - dummies

Når du har en god ide om hvilke typer søgeord der skal bruges i dit online-fællesskab, er det tid til at skrive indholdet, så det ser naturligt ud. For mange mennesker peber søgeord liberalt omkring deres blogindlæg, web artikler, Om sider og andet indhold, som ser dumt og forkert ud. Selvom du bruger nøgleord, er det godt ...

Sådan sættes annoncer på din blog - dummies

Sådan sættes annoncer på din blog - dummies

For at få annoncer på din blogwebsite, de programmer du tilmelde dig normalt give dig en smule kode, som du indsætter i din hjemmeside skabeloner. Nogle programmer har trinvise instruktioner til populære blogsoftwarepakker, men vær opmærksom på at du måske også har brug for at konsultere dokumentation til blogsoftware til hjælp med ...

Valg af editor

Ompirrende Signaler og hvad de betyder i Cricket - Dummies

Ompirrende Signaler og hvad de betyder i Cricket - Dummies

Embedsmændene med ansvar for et cricketpil er kaldet umpires, og de har en lang række signaler til at angive de beslutninger, de træffer i løbet af et spil. Disse er de vigtigste. Højre arm udstrakte. No-bold. Dette signal indikerer, at bowlerens fod har landet over frontlinjen af ​​...

Vælg en Tennis Racquet - Dummies

Vælg en Tennis Racquet - Dummies

Ja, du kan støv af den racquet, du spillede for fem år siden og give det en strålende tilbagevenden til retten - hvis det føles godt i din hånd og det får dine skud hvor (og hvordan) vil du have dem til at gå. Hvis du er på markedet for et nyt våben, vil du dog ...

Skæring og dicing, tennis stil - dummies

Skæring og dicing, tennis stil - dummies

Skive eller backspin, får tennisbolden til at vende tilbage mod effektkilde (dig). Når et stykke skud springer, forbliver bolden lavt, hvilket tvinger din modstander til virkelig at strække for at komme til bolden. Hvis spillere gerne angriber nettet og volley, skar de meget. Skiven kan være en nyttig ...