Hjem Personlig finansiering Sådan bruges kurve montering i Predictive Analytics - dummies

Sådan bruges kurve montering i Predictive Analytics - dummies

Indholdsfortegnelse:

Video: 3000+ Common English Words with British Pronunciation 2024

Video: 3000+ Common English Words with British Pronunciation 2024
Anonim

Kurvefitting er en proces, der anvendes i prædiktiv analyse, hvor målet er at skabe en kurve, der viser den matematiske funktion, som bedst passer til de faktiske (originale) datapunkter i en dataserie.

Kurven kan enten passere gennem hvert datapunkt eller forblive inden for størstedelen af ​​dataene, idet man ignorerer nogle datapunkter i håb om at tegne tendenser fra dataene. I begge tilfælde er en enkelt matematisk funktion tildelt hele datalaget med det formål at montere alle datapunkter i en kurve, der afgrænser trends og hjælpemidler forudsigelse.

Kurvepasning kan opnås på en af ​​tre måder:

  • Ved at finde en nøjagtig pasform for hvert datapunkt (en proces kaldet interpolation )

  • Ved at holde sig indenfor Størstedelen af ​​dataene, mens du ignorerer nogle datapunkter i håb om at tegne tendenser ud af dataene.

  • Ved at anvende dataudjævning for at komme op med en funktion, der repræsenterer den glatte graf

Kurvmontering kan bruges til at udfylde mulige datapunkter til at erstatte manglende værdier eller hjælpe analytikere med at visualisere dataene.

Når du arbejder på at generere en prædiktiv analysemodel, skal du undgå at skræddersy din model, så den passer perfekt til din datasample. En sådan model vil fejlagtigt - forudsige lignende, men varierende datasæt uden for dataprøven. Tilpasning af en model for tæt på en bestemt dataprøve er en klassisk fejl kaldet overfitting .

Overdrivelsen af ​​overfitting

I det væsentlige er overfitting af en model, hvad der sker, når du træner over modellen for kun at repræsentere dine prøvedata - hvilket ikke er en god fremstilling af dataene som helhed. Uden et mere realistisk datasæt fortsætter modellen med fejl og risici, når den går i drift - og konsekvenserne for din virksomhed kan være alvorlige.

Overfitting af en model er en almindelig fælde, fordi folk ønsker at skabe modeller, der virker - og så er fristet til at holde tilpasningsvariabler og parametre, indtil modellen udfører perfekt - for lidt data. At fejle er menneske. Heldigvis er det også menneskeligt at skabe realistiske løsninger.

For at undgå overfitting af din model til dit stikprøvesæt, skal du sørge for at have en masse testdata tilgængelige, der adskiller sig fra dine prøvedata. Derefter kan du måle udførelsen af ​​din model uafhængigt, før modellen bliver operationel.

Således er en generel beskyttelse mod overfitting at dele dine data i to dele: Træningsdata og testdata. Modelens præstationer mod testdataene fortæller meget om modellen er klar til den virkelige verden.

En anden bedste praksis er at sikre, at dine data repræsenterer den større befolkning i det domæne, du modellerer for. Alle en overtrained model ved, er de specifikke træk ved stikprøvedatasættet, den er uddannet til. Hvis du træner modellen kun på (siger) snesko salg om vinteren, skal du ikke blive overrasket, hvis det fejler, når det kører igen på data fra en anden sæson.

Sådan undgår du overfitting

Det er værd at gentage: For meget tweaking af modellen er tilbøjelig til at resultere i overfitting. En sådan tweak indebærer for mange variabler i analysen. Hold disse variabler til et minimum. Indsæt kun variabler, som du ser som absolut nødvendige - dem, du tror, ​​vil gøre en væsentlig forskel for resultatet.

Denne indsigt kommer kun fra intim viden om det forretningsområde, du er i. Det er her, hvor ekspertisen fra domæneeksperter kan hjælpe dig med at falde i fælden med overfitting.

Her er en tjekliste over bedste praksis, der hjælper dig med at undgå overfitting af din model:

  • Vælg et datasæt til at arbejde med det, der er repræsentativt for befolkningen som helhed.

  • Opdel dit datasæt til to dele: Træningsdata og testdata.

  • Hold variablerne analyseret til et sundt minimum for opgaven ved hånden.

  • Få hjælp fra domæneeksperteksperter.

På aktiemarkedet er for eksempel en klassisk analytisk teknik back-testing - kører en model mod historiske data for at finde den bedste handelsstrategi.

Antag, at analytikeren, efter at have kørt sin nye model mod data, der er genereret af et nyligt tyremarked, og justerer antallet af variabler, der anvendes i sin analyse, skaber det, der ligner en optimal handelsstrategi - en, som ville give det højeste afkast < hvis han kunne gå tilbage og handle kun i løbet af året, der producerede testdataene. Desværre kan han ikke. Hvis han forsøger at anvende denne model på et nuværende bjørnemarked, skal du se nedenfor: Han vil pådrage sig tab ved at anvende en model for optimeret i en snæver periode og sæt af forhold, som ikke passer til de nuværende realiteter. (Så meget for hypotetisk fortjeneste.)

Modellen arbejdede kun for det forsvundet tyremarked, fordi det var overtrained, med øremærkning af konteksten, der frembragte stikprøvedataene - komplet med dets specifikationer, outliers og mangler. Alle omstændighederne omkring datasættet vil sandsynligvis ikke blive gentaget i fremtiden eller i en sand repræsentation af hele befolkningen - men de alle viste sig i den overbygede model.

Hvis en modelens output er for præcis, overvej det et hint for at se nærmere på. Få hjælp fra domæneteknikeksperter til at se, om dine resultater virkelig er for gode til at være sandt, og kør den model på flere testdata for yderligere sammenligninger.

Sådan bruges kurve montering i Predictive Analytics - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...