Hjem Personlig finansiering Hvordan man opretter en prædiktiv Analytics-model med R Regression - dummies

Hvordan man opretter en prædiktiv Analytics-model med R Regression - dummies

Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2024

Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2024
Anonim

Du vil oprette en prædiktiv analysemodel, som du kan evaluere ved hjælp af kendte resultater. For at gøre det skal vi opdele vores datasæt i to sæt: en til træning af modellen og en til test af modellen. En 70/30 opdeling mellem træning og testning af datasæt er tilstrækkelig. De næste to kodelinjer beregner og gemmer størrelserne på hvert sæt: >> trainSize testSize <- nrow (autos) - trainSize

For at udlæse værdierne skal du indtaste navnet på variablen, der bruges til at gemme værdien og tryk på Enter. Her er output:

>> trainSize [1] 279> testSize [1] 119

Denne kode bestemmer størrelsen af ​​de datasæt, som du har til hensigt at lave vores trænings- og testdatasæt. Du har stadig ikke faktisk oprettet disse sæt. Desuden ønsker du ikke blot at kalde de første 279 observationer, træningssættet og ringe til de sidste 119 observationer, testen indstillede. Det ville skabe en dårlig model, fordi datasættet vises bestilt. Specifikt er model Year kolonnen bestilt fra mindste til største.

Fra undersøgelsen af ​​dataene kan du se, at de fleste af de tungere, ottecylindrede, større forskydning, større hestekræfter er placeret øverst på datasættet. Fra denne observation, uden at skulle køre nogen algoritmer på dataene, kan du allerede fortælle (i almindelighed for dette datasæt) ældre biler i forhold til nyere biler som følger:

Er tungere

Har otte cylindre

  • Har større forskydning

  • Har større hestekræfter

    Okay, selvfølgelig ved mange mennesker noget om biler, så et gæt om, hvad korrelationerne er, vil ikke være for farvede efter at du har set dataene. En person med en masse bilkundskaber kan allerede have kendt dette uden at se på dataene.
  • Dette er blot et simpelt eksempel på et domæne (biler), som mange mennesker kan forholde sig til. Hvis dette var data om kræft, ville de fleste ikke umiddelbart forstå, hvad hver attribut betyder.

Her er en domæneekspert og en datamodeller afgørende for modelleringsprocessen. Domæneeksperter kan have den bedste viden om hvilke egenskaber der er mest (eller mindst) vigtige - og hvordan attributter korrelerer med hinanden.

De kan foreslå datamodellen, hvilke variabler der skal eksperimentere med. De kan give større vægt til vigtige attributter og / eller mindre vægte til attributter af mindst betydning (eller fjern dem helt).

Så du skal lave et træningsdatasæt og et testdatasæt, der er virkelig repræsentativt for hele sættet. En måde at gøre det på er at oprette træningssættet fra et tilfældigt udvalg af hele datasættet.Derudover vil du gøre denne test reproducerbar, så du kan lære af det samme eksempel.

Sæt så frøet for tilfældiggeneratoren, så vi får det samme "tilfældige" træningssæt. Følgende kode gør denne opgave: >> sæt. frø (123)> training_indices <- sample (seq_len (nrow (autos)), size = trainSize)> trainSet testSæt <- autos [-training_indices,]

Træningssættet indeholder 279 observationer sammen med resultatet (mpg) for hver observation. Regressionsalgoritmen bruger resultatet til at træne modellen ved at se på relationerne mellem forudsigelsesvariablerne (hvilket som helst af de syv attributter) og responsvariablen (mpg).

Testsættet indeholder resten af ​​dataene (det vil sige den del, der ikke er inkluderet i træningssættet). Du bør bemærke, at testsætet også indeholder variablen svar (mpg). 

Når du bruger forudsigelsesfunktionen (fra modellen) med testsættet, ignorerer du svarsvariablen og bruger kun forudsigelsesvariablerne, så længe kolonne navne er de samme som i træningssættet.

Hvis du vil oprette en lineær regressionsmodel, der bruger mpg-attributten som svarvariabel og alle de andre variabler som forudsigelsesvariabler, skal du skrive følgende linie kode: >> model

Hvordan man opretter en prædiktiv Analytics-model med R Regression - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...