Hjem Personlig finansiering Sådan bruges dataudjævning i Predictive Analytics - dummies

Sådan bruges dataudjævning i Predictive Analytics - dummies

Indholdsfortegnelse:

Video: Brug hjertestarter - sådan bruges en hjertestarter. 2025

Video: Brug hjertestarter - sådan bruges en hjertestarter. 2025
Anonim

Dataudjævning i prediktiv analyse forsøger i det væsentlige at finde "signalet" i "støj" ved kassere datapunkter, der betragtes som "støjende". Tanken er at skærpe mønstre i dataene og fremhæve tendenser dataene peger på.

Implikationen bag dataudjævning er, at dataene består af to dele: en del (bestående af kernedatapunkter ), der angiver overordnede tendenser eller reelle tendenser, og en anden del, der hovedsagelig består af afvigelser ( støj ) - nogle svingende punkter, der skyldes en vis volatilitet i dataene. Dataudjævning søger at fjerne den anden del.

Sådan slår du af støj

Dataudjævning virker på flere forudsætninger:

  • Denne udsving i data er sandsynligvis støj.

  • At den støjende del af dataene er kortvarig.

  • At dataens udsving, uanset hvor varieret det måtte være, vil ikke påvirke de underliggende tendenser repræsenteret ved de centrale datapunkter.

Støj i data har tendens til at være tilfældigt; dets udsving bør ikke påvirke de overordnede tendenser trukket fra at undersøge resten af ​​dataene. Således reducerer eller eliminerer støjende datapunkter klargør virkelige tendenser og mønstre i dataene - i virkeligheden forbedrer dataens "signal-til-støj-forhold. ”

Hvis du har identificeret støj korrekt og derefter reduceret, kan dataudjævning hjælpe dig med at forudsige det næste observerede datapunkt ved blot at følge de store trends, du har registreret inden for dataene.

Dataudjævning vedrører selve flertallet af datapunkterne, deres positioner i en graf, og hvad de resulterende mønstre forudser om den generelle tendens af (sig) en aktiekurs, om dens generelle retning er op, ned eller sidelæns.

Denne teknik vil ikke nøjagtigt forudsige den nøjagtige pris for den næste handel for et givet lager - men forudsigelse af en generel tendens kan give mere magtfulde indsigter end at kende den faktiske pris eller dens udsving.

En prognose baseret på en generel tendens afledt af glatte data forudsætter, at hvilken retning dataene har fulgt hidtil, vil fortsætte ind i fremtiden på en måde, som er i overensstemmelse med udviklingen. På aktiemarkedet er for eksempel præstationsresultater ikke nogen konkret indikation af fremtidige resultater, men det kan helt sikkert være en generel vejledning til fremtidig bevægelse af aktiekursen.

Metoder, fordele og ulemper ved dataudjævning

Dataudjævning er ikke forveksles med montering af en model, , som er en del af dataanalysen bestående af to trin:

  1. Find en passende model, der repræsenterer dataene.

  2. Sørg for, at modellen passer til dataene effektivt.

Dataudjævning fokuserer på at etablere en grundlæggende retning for kernedatapunkterne ved at (1) ignorere eventuelle støjende datapunkter og (2) tegne en glattere kurve gennem de datapunkter, der hopper over de vridende og understreger primære mønstre - tendenser - i dataene, uanset hvor langsom deres fremkomst. Følgelig tjener dataudjævning i en numerisk tidsserie som en form for filtrering.

Dataudjævning kan bruge en af ​​følgende metoder:

  • Tilfældig gåtur er baseret på ideen om, at det næste resultat eller fremtidige datapunkt er en tilfældig afvigelse fra den sidst kendte eller nuværende datapunkt.

  • Flytende gennemsnit er et løbende gennemsnit af på hinanden følgende, lige adskilte perioder. Et eksempel var beregningen af ​​et 200-dages glidende gennemsnit af en aktiekurs.

  • Eksponentiel udjævning tildeler eksponentielt større vægt eller betydning til nyere datapunkter end til ældre datapunkter.

    • Simple: Denne metode skal bruges, når tidsseriedataene ikke har nogen tendens og ingen årstid.

    • Lineær: Denne metode skal bruges, når tidsseriedataene har en trendlinie.

    • Sæsonbestemt: Denne metode skal bruges, når tidsseriedataene ikke har nogen tendens, men sæsonbestemt.

Hvad disse udjævningsmetoder alle har til fælles er, at de udfører en form for gennemsnitsproces på flere datapunkter. Sådan gennemsnittet af tilstødende datapunkter er den væsentlige måde at nulle på underliggende tendenser eller mønstre.

Fordelene ved dataudjævning er

  • Det er nemt at implementere.

  • Det hjælper med at identificere tendenser.

  • Det hjælper med at afsløre mønstre i dataene.

  • Det eliminerer datapunkter, som du har valgt, ikke er af interesse.

  • Det hjælper med at forudsige den generelle retning af de næste observerede datapunkter.

  • Det genererer flot glatte grafer.

Men alt har en ulempe. Ulemperne ved dataudjævning er

  • Det kan fjerne gyldige datapunkter, der skyldes ekstreme begivenheder.

  • Det kan føre til unøjagtige forudsigelser, hvis testdataene kun er sæsonbestemte og ikke fuldt repræsentative for den virkelighed, der genererede datapunkterne.

  • Det kan flytte eller skævre dataene, især toppene, hvilket resulterer i et forvrænget billede af, hvad der sker.

  • Det kan være sårbart for betydelige forstyrrelser fra outliers inden for dataene.

  • Det kan medføre en væsentlig afvigelse fra de oprindelige data.

Hvis dataudjævning kun giver dataene kun ansigtsløftning, kan det tegne en grundlæggende fejl på følgende måder:

  • Det kan introducere fejl gennem forvrængninger, der behandler de glatte data som om det var identisk med originalen data.

  • Det kan skæve tolkning ved at ignorere - og gemme - risici indlejret i dataene.

  • Det kan føre til tab af detaljer i dine data - hvilket er en måde at en glatt kurve kan afvige meget fra den oprindelige data.

Hvor alvorligt dataudjævning kan påvirke dine data afhænger af dataene ved hånden, og hvilken udjævningsteknik der blev implementeret på disse data.Hvis de originale data f.eks. Har flere toppe i det, vil dataudjævning føre til større skift af disse toppe i de glatte grafer - sandsynligvis en forvrængning.

Her er nogle advarselspunkter, der skal tages i betragtning, når du nærmer dig dataudjævning:

  • Det er en god ide at sammenligne glatte grafer til uberørte grafer, der plotter de originale data.

  • Datapunkter fjernet under dataudjævning er muligvis ikke støj; de kunne være gyldige, reelle datapunkter, der er resultatet af sjældne-men-virkelige begivenheder.

  • Dataudjævning kan være nyttigt med moderation, men dens overforbrug kan føre til en vildledning af dine data.

Ved at anvende din professionelle vurdering og din virksomheds viden ekspertise, kan du bruge dataudjævning effektivt. Fjernelse af støj fra dine data - uden at påvirke nøjagtigheden og anvendeligheden af ​​de oprindelige data - er mindst lige så meget en kunst som en videnskab.

Sådan bruges dataudjævning i Predictive Analytics - dummies

Valg af editor

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvis du arbejder i Microsoft Excel 2010 og vil begynde at arbejde i en ny Excel-workbook-fil, kan du nemt oprette en ny projektmappe. For at gøre det kan du bruge en kommando på fanen Filer eller en tastaturgenvej. Klik på fanen Filer. Excel viser Backstage-visning, hvor du kan få adgang til filrelaterede kommandoer. ...

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

I Excel 2010 Opret brugerdefinerede ordbøger, der skal bruges, når du stavekontrollerer dine regneark. Du bruger knappen Tilføj til ordbog i dialogboksen Staveord til at tilføje ukendte ord til en brugerdefineret ordbog. Som standard tilføjer Excel disse ord til en brugerdefineret ordbog fil med navnet CUSTOM. DIC, men du kan oprette en ny brugerdefineret ...

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

, Når du opretter en pivottabel i Excel 2010, kan du oprette et pivotdiagram for at vise sine sammendragsværdier grafisk. Du kan også formatere et pivotdiagram for at forbedre udseendet. Du kan bruge en af ​​de diagramtyper, der er tilgængelige med Excel, når du opretter et pivotdiagram. Opret et pivotdiagram Følg disse ...

Valg af editor

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Du kan flytte funktioner rundt på hovedsiden på dit Ning-netværk via siden Tilføj funktioner til dit netværk, ændrer layoutet, indtil det bare er det, du vil have. For at komme til denne side skal du klikke på linket Administrer i din navigation og derefter klikke på Funktioner under Dit netværk. Tilføj funktioner til dit netværk ...

Sådan vælger du et sprog med Ning Language Editor - dummies

Sådan vælger du et sprog med Ning Language Editor - dummies

Ning Language Editor er et af de mest kraftfulde værktøjer til din rådighed for at tilpasse dit netværk til det maksimale. Ning Language Editor hjælper dig med at lave din netværksgrænseflade (menuer, knapper, overskrifter, legender osv.), Og læs præcis som du vil have det til. Sprogeditoren giver dig mulighed for at vælge et bestemt sprog:

Hvordan man vælger et tema til dit Ning-netværk - dummies

Hvordan man vælger et tema til dit Ning-netværk - dummies

Du kan køre dit netværk på Ning uden at være en meget vellykket designer - og Ning's temaer lader dig få det til at ligne en million dollars! Folkene i Ning har taget godt af det og tilbyder dig mere end 50 flotte skabeloner (de kalder dem temaer), som du kan bruge med minimal indsats:

Valg af editor

Forstå kamphandlinger i rutefilter - dummier

Forstå kamphandlinger i rutefilter - dummier

De kamphandlinger, der er tilgængelige for rutefiltre, er identiske med dem, der er tilgængelige for andre routing politikker i Junos. Du kan acceptere ruter, afvise ruter, ændre attributter, der tilhører en rute, eller udføre flow kontrol type funktioner. Langt de mest almindelige handlinger, der skal bruges med rutefiltre, accepteres og afvises. Normalt vil du ...

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Vigtigheden af ​​at følge sikkerhedsprotokoller kan ikke være overvurderet. Hvis der ikke træffes passende forholdsregler, kan der opstå alvorlig skade for personale eller apparatet. Følg disse retningslinjer for at sikre din sikkerhed og beskytte enheden mod skade. Vær altid opmærksom og udøv god dømmekraft. Bemærk: Kun uddannet og kvalificeret personale skal installere enheden. Brug ...

Forstå matchtyper i rutefilter - dummies

Forstå matchtyper i rutefilter - dummies

Rutefilter matcher bestemte IP-adresser eller præfiksintervaller. I lighed med andre routingpolitikker indeholder de nogle matchkriterier og tilsvarende kamphandlinger. En vigtig forskel mellem rutefiltre og andre politiske matchforhold er, hvordan flere filtre håndteres. Hvis du har mere end en matchtilstand, behandles betingelserne som ...