Hjem Personlig finansiering Sådan bruges kurve montering i Predictive Analytics - dummies

Sådan bruges kurve montering i Predictive Analytics - dummies

Indholdsfortegnelse:

Video: 3000+ Common English Words with British Pronunciation 2025

Video: 3000+ Common English Words with British Pronunciation 2025
Anonim

Kurvefitting er en proces, der anvendes i prædiktiv analyse, hvor målet er at skabe en kurve, der viser den matematiske funktion, som bedst passer til de faktiske (originale) datapunkter i en dataserie.

Kurven kan enten passere gennem hvert datapunkt eller forblive inden for størstedelen af ​​dataene, idet man ignorerer nogle datapunkter i håb om at tegne tendenser fra dataene. I begge tilfælde er en enkelt matematisk funktion tildelt hele datalaget med det formål at montere alle datapunkter i en kurve, der afgrænser trends og hjælpemidler forudsigelse.

Kurvepasning kan opnås på en af ​​tre måder:

  • Ved at finde en nøjagtig pasform for hvert datapunkt (en proces kaldet interpolation )

  • Ved at holde sig indenfor Størstedelen af ​​dataene, mens du ignorerer nogle datapunkter i håb om at tegne tendenser ud af dataene.

  • Ved at anvende dataudjævning for at komme op med en funktion, der repræsenterer den glatte graf

Kurvmontering kan bruges til at udfylde mulige datapunkter til at erstatte manglende værdier eller hjælpe analytikere med at visualisere dataene.

Når du arbejder på at generere en prædiktiv analysemodel, skal du undgå at skræddersy din model, så den passer perfekt til din datasample. En sådan model vil fejlagtigt - forudsige lignende, men varierende datasæt uden for dataprøven. Tilpasning af en model for tæt på en bestemt dataprøve er en klassisk fejl kaldet overfitting .

Overdrivelsen af ​​overfitting

I det væsentlige er overfitting af en model, hvad der sker, når du træner over modellen for kun at repræsentere dine prøvedata - hvilket ikke er en god fremstilling af dataene som helhed. Uden et mere realistisk datasæt fortsætter modellen med fejl og risici, når den går i drift - og konsekvenserne for din virksomhed kan være alvorlige.

Overfitting af en model er en almindelig fælde, fordi folk ønsker at skabe modeller, der virker - og så er fristet til at holde tilpasningsvariabler og parametre, indtil modellen udfører perfekt - for lidt data. At fejle er menneske. Heldigvis er det også menneskeligt at skabe realistiske løsninger.

For at undgå overfitting af din model til dit stikprøvesæt, skal du sørge for at have en masse testdata tilgængelige, der adskiller sig fra dine prøvedata. Derefter kan du måle udførelsen af ​​din model uafhængigt, før modellen bliver operationel.

Således er en generel beskyttelse mod overfitting at dele dine data i to dele: Træningsdata og testdata. Modelens præstationer mod testdataene fortæller meget om modellen er klar til den virkelige verden.

En anden bedste praksis er at sikre, at dine data repræsenterer den større befolkning i det domæne, du modellerer for. Alle en overtrained model ved, er de specifikke træk ved stikprøvedatasættet, den er uddannet til. Hvis du træner modellen kun på (siger) snesko salg om vinteren, skal du ikke blive overrasket, hvis det fejler, når det kører igen på data fra en anden sæson.

Sådan undgår du overfitting

Det er værd at gentage: For meget tweaking af modellen er tilbøjelig til at resultere i overfitting. En sådan tweak indebærer for mange variabler i analysen. Hold disse variabler til et minimum. Indsæt kun variabler, som du ser som absolut nødvendige - dem, du tror, ​​vil gøre en væsentlig forskel for resultatet.

Denne indsigt kommer kun fra intim viden om det forretningsområde, du er i. Det er her, hvor ekspertisen fra domæneeksperter kan hjælpe dig med at falde i fælden med overfitting.

Her er en tjekliste over bedste praksis, der hjælper dig med at undgå overfitting af din model:

  • Vælg et datasæt til at arbejde med det, der er repræsentativt for befolkningen som helhed.

  • Opdel dit datasæt til to dele: Træningsdata og testdata.

  • Hold variablerne analyseret til et sundt minimum for opgaven ved hånden.

  • Få hjælp fra domæneeksperteksperter.

På aktiemarkedet er for eksempel en klassisk analytisk teknik back-testing - kører en model mod historiske data for at finde den bedste handelsstrategi.

Antag, at analytikeren, efter at have kørt sin nye model mod data, der er genereret af et nyligt tyremarked, og justerer antallet af variabler, der anvendes i sin analyse, skaber det, der ligner en optimal handelsstrategi - en, som ville give det højeste afkast < hvis han kunne gå tilbage og handle kun i løbet af året, der producerede testdataene. Desværre kan han ikke. Hvis han forsøger at anvende denne model på et nuværende bjørnemarked, skal du se nedenfor: Han vil pådrage sig tab ved at anvende en model for optimeret i en snæver periode og sæt af forhold, som ikke passer til de nuværende realiteter. (Så meget for hypotetisk fortjeneste.)

Modellen arbejdede kun for det forsvundet tyremarked, fordi det var overtrained, med øremærkning af konteksten, der frembragte stikprøvedataene - komplet med dets specifikationer, outliers og mangler. Alle omstændighederne omkring datasættet vil sandsynligvis ikke blive gentaget i fremtiden eller i en sand repræsentation af hele befolkningen - men de alle viste sig i den overbygede model.

Hvis en modelens output er for præcis, overvej det et hint for at se nærmere på. Få hjælp fra domæneteknikeksperter til at se, om dine resultater virkelig er for gode til at være sandt, og kør den model på flere testdata for yderligere sammenligninger.

Sådan bruges kurve montering i Predictive Analytics - dummies

Valg af editor

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvis du arbejder i Microsoft Excel 2010 og vil begynde at arbejde i en ny Excel-workbook-fil, kan du nemt oprette en ny projektmappe. For at gøre det kan du bruge en kommando på fanen Filer eller en tastaturgenvej. Klik på fanen Filer. Excel viser Backstage-visning, hvor du kan få adgang til filrelaterede kommandoer. ...

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

I Excel 2010 Opret brugerdefinerede ordbøger, der skal bruges, når du stavekontrollerer dine regneark. Du bruger knappen Tilføj til ordbog i dialogboksen Staveord til at tilføje ukendte ord til en brugerdefineret ordbog. Som standard tilføjer Excel disse ord til en brugerdefineret ordbog fil med navnet CUSTOM. DIC, men du kan oprette en ny brugerdefineret ...

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

, Når du opretter en pivottabel i Excel 2010, kan du oprette et pivotdiagram for at vise sine sammendragsværdier grafisk. Du kan også formatere et pivotdiagram for at forbedre udseendet. Du kan bruge en af ​​de diagramtyper, der er tilgængelige med Excel, når du opretter et pivotdiagram. Opret et pivotdiagram Følg disse ...

Valg af editor

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Du kan flytte funktioner rundt på hovedsiden på dit Ning-netværk via siden Tilføj funktioner til dit netværk, ændrer layoutet, indtil det bare er det, du vil have. For at komme til denne side skal du klikke på linket Administrer i din navigation og derefter klikke på Funktioner under Dit netværk. Tilføj funktioner til dit netværk ...

Sådan vælger du et sprog med Ning Language Editor - dummies

Sådan vælger du et sprog med Ning Language Editor - dummies

Ning Language Editor er et af de mest kraftfulde værktøjer til din rådighed for at tilpasse dit netværk til det maksimale. Ning Language Editor hjælper dig med at lave din netværksgrænseflade (menuer, knapper, overskrifter, legender osv.), Og læs præcis som du vil have det til. Sprogeditoren giver dig mulighed for at vælge et bestemt sprog:

Hvordan man vælger et tema til dit Ning-netværk - dummies

Hvordan man vælger et tema til dit Ning-netværk - dummies

Du kan køre dit netværk på Ning uden at være en meget vellykket designer - og Ning's temaer lader dig få det til at ligne en million dollars! Folkene i Ning har taget godt af det og tilbyder dig mere end 50 flotte skabeloner (de kalder dem temaer), som du kan bruge med minimal indsats:

Valg af editor

Forstå kamphandlinger i rutefilter - dummier

Forstå kamphandlinger i rutefilter - dummier

De kamphandlinger, der er tilgængelige for rutefiltre, er identiske med dem, der er tilgængelige for andre routing politikker i Junos. Du kan acceptere ruter, afvise ruter, ændre attributter, der tilhører en rute, eller udføre flow kontrol type funktioner. Langt de mest almindelige handlinger, der skal bruges med rutefiltre, accepteres og afvises. Normalt vil du ...

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Vigtigheden af ​​at følge sikkerhedsprotokoller kan ikke være overvurderet. Hvis der ikke træffes passende forholdsregler, kan der opstå alvorlig skade for personale eller apparatet. Følg disse retningslinjer for at sikre din sikkerhed og beskytte enheden mod skade. Vær altid opmærksom og udøv god dømmekraft. Bemærk: Kun uddannet og kvalificeret personale skal installere enheden. Brug ...

Forstå matchtyper i rutefilter - dummies

Forstå matchtyper i rutefilter - dummies

Rutefilter matcher bestemte IP-adresser eller præfiksintervaller. I lighed med andre routingpolitikker indeholder de nogle matchkriterier og tilsvarende kamphandlinger. En vigtig forskel mellem rutefiltre og andre politiske matchforhold er, hvordan flere filtre håndteres. Hvis du har mere end en matchtilstand, behandles betingelserne som ...