Hjem Personlig finansiering Hvordan Support Vector Machine Predictive Analysis forudsiger fremtiden - dummies

Hvordan Support Vector Machine Predictive Analysis forudsiger fremtiden - dummies

Video: How to Predict Stock Prices Easily - Intro to Deep Learning #7 2025

Video: How to Predict Stock Prices Easily - Intro to Deep Learning #7 2025
Anonim

understøttende vektormaskine (SVM) er en prædiktiv analyse data-klassifikationsalgoritme, der tildeler ny dataelementer til en af ​​mærket kategorier. SVM er i de fleste tilfælde en binær klassifikator; det antager, at de pågældende data indeholder to mulige målværdier.

En anden version af SVM-algoritmen, multiclass SVM, forstærker SVM som klassifikator på et datasæt, der indeholder mere end en klasse (gruppering eller kategori). SVM har med succes været anvendt i mange applikationer som billedgenkendelse, medicinsk diagnose og tekstanalyse.

Antag at du designer en prædiktiv analysemodel, der automatisk genkender og forudsiger navnet på et objekt i et billede. Dette er i det væsentlige problemet med billedgenkendelse - eller mere specifikt ansigtsgenkendelse: Du vil have klassificeringsenheden til at genkende navnet på en person i et billede. Før du tager fat på det niveau af kompleksitet, overvej en enklere version af det samme problem: Antag at du har billeder af enkelte stykker frugt, og du vil gerne have din klassifikator for at forudsige, hvilken slags frugt der vises på billedet. Antag at du kun har to typer frugter: æbler og pærer, en pr. Billede.

Giv et nyt billede, du vil gerne forudsige, om frugten er et æble eller en pære - uden at se på billedet. Du vil have, at SVM klassificerer hvert billede som æble eller pære. Som med alle andre algoritmer er det første skridt at træne klassifikatoren.

Antag at du har 200 billeder af forskellige æbler og 200 billeder af pærer. Læringstrinnet består i at fodre disse billeder til klassifikatoren, så det lærer, hvad et æble ser ud og hvad en pære ser ud. Før du kommer ind i dette første trin, skal du omdanne hvert billede til en datamatrix ved hjælp af (sig) R-statistikpakken.

En simpel måde at repræsentere et billede som tal på i en matrix er at søge geometriske former inden for billedet (såsom cirkler, linjer, firkanter eller rektangler) og også positionerne for hver forekomst af hver geometrisk form. Disse tal kan også repræsentere koordinater for disse objekter inden for billedet, som afbildet i et koordinatsystem.

Som du måske forestiller dig, repræsenterer et billede som en matrix af tal ikke ligefrem en ligetil opgave. Et helt forskelligt forskningsområde er afsat til billedrepræsentation.

Nedenstående viser, hvordan en støttevektormaskine kan forudsige en frugtklasse (mærkning den matematisk som

apple eller pære ), baseret på det, som algoritmen har lært i fortiden. Antag, at du har konverteret alle billederne til datamatricer. Derefter har supportvektormaskinen to hovedindgange:

Tidligere (træningsdata): Dette sæt matricer svarer til tidligere set billeder af æbler og pærer.

  • De nye (usynlige) data består af et billede konverteret til en matrix. Formålet er at forudsige automatisk hvad der er på billedet - et æble eller en pære.

  • Støttevektoren bruger en matematisk funktion, ofte kaldet en

kernelfunktion , som er en matematikfunktion, der matcher de nye data til det bedste billede fra træningsdataene for at forudsige det ukendte billeds etiket (æble eller pære). Sammenlignet med andre klassifikatorer producerer supportvektormaskiner robuste, nøjagtige forudsigelser, er mindst påvirket af støjende data og er mindre tilbøjelige til overfitting. Husk dog, at støttevektormaskiner er mest egnede til binær klassificering - når du kun har to kategorier (f.eks. Æble eller pære).

Hvordan Support Vector Machine Predictive Analysis forudsiger fremtiden - dummies

Valg af editor

Sammenligning af Hadoop-distributioner - dummier

Sammenligning af Hadoop-distributioner - dummier

Du vil opdage, at Hadoop-økosystemet har mange komponenter, som alle eksisterer som deres egne Apache projekter. Fordi Hadoop er vokset betydeligt og står over for nogle betydelige yderligere ændringer, er forskellige versioner af disse komponenter i open source-fællesskabet måske ikke fuldt kompatible med andre komponenter. Dette giver betydelige vanskeligheder for folk, der søger at få ...

Faktorer, der øger omfanget af statistisk analyse i Hadoop - dummies

Faktorer, der øger omfanget af statistisk analyse i Hadoop - dummies

Grunden til, at folk udprøver deres data før du kører statistisk analyse i Hadoop er, at denne form for analyse ofte kræver betydelige databehandlingsressourcer. Det handler ikke kun om datamængder: der er fem hovedfaktorer, der påvirker omfanget af statistisk analyse: Denne er let, men vi skal nævne det: mængden af ​​data på ...

Komprimering af data i Hadoop - dummies

Komprimering af data i Hadoop - dummies

Er de enorme datamængder, der er realiteter i en typisk Hadoop-implementering, en nødvendighed. Datakomprimering sparer helt sikkert en stor mængde lagerplads og er sikker på at fremskynde bevægelsen af ​​disse data i hele din klynge. Ikke overraskende er der en række tilgængelige komprimeringsordninger, kaldet codecs, derude for ...

Valg af editor

Hvordan man bruger Wordtracker Søgeordsværktøj - dummies

Hvordan man bruger Wordtracker Søgeordsværktøj - dummies

Wordracker er måske det mest populære kommercielle søgeordværktøj blandt seo fagfolk. Wordtracker har adgang til data fra et par store metakrawlere og en stor britisk internetudbyder. En metacrawler er et system, der søger flere søgemaskiner til dig. Skriv f.eks. Et ord i Dogpiles søgefelt, og systemet søger på Google, ...

Identificere mobile brugers søgemønstre for SEO - dummies

Identificere mobile brugers søgemønstre for SEO - dummies

I begyndelsen af ​​2014 Endelig skete: Internetbrug via mobile enheder oversteg faktisk desktop internetbrug i USA for første gang. Overveje det, alle har en smartphone i disse dage, og folk bruger i stigende grad disse handy-enheder, tabletter som iPad og det nye mellemstore sortiment af tabletter (overdimensionerede telefon-tablet-enheder) ...

Hvordan man bruger single page analyser til konkurrencedygtig seo forskning - dummies

Hvordan man bruger single page analyser til konkurrencedygtig seo forskning - dummies

Single Page Analyzer værktøj kan hjælpe dig med at forbedre dit websted til SEO. Det fortæller dig, hvad en websides søgeord er og beregner deres tæthed. Søgeordsdensitet er en procentdel, der angiver det antal gange søgeordet opstår i forhold til det samlede antal ord på siden. Når du kører en konkurrents side ...

Valg af editor

Sådan konstrueres en funktion i C Programmering - dummier

Sådan konstrueres en funktion i C Programmering - dummier

I C-programmering, alle funktioner kaldes med en navn, som skal være unikt ingen to funktioner kan have samme navn, og en funktion kan heller ikke have samme navn som et søgeord. Navnet efterfølges af parenteser, som derefter efterfølges af et sæt krøllede parenteser. Så i sin enkleste konstruktion, en ...

Sådan oprettes en ny kode:: Blokerer projekt i C-dummier

Sådan oprettes en ny kode:: Blokerer projekt i C-dummier

I C programmeringssprog, en konsol-applikation er en, der kører i tekst-tilstand i et terminalvindue. Selv om et integreret udviklingsmiljø er i stand til mere, er det den bedste måde at lære grundlæggende programmeringskoncepter på, uden at overvældende dig med et stort, komplekst grafisk dyr af et program. Sådan fungerer det: Start ...

Hvordan man viser tekst på skærmen i C med sætter () og printf () - Dummies

Hvordan man viser tekst på skærmen i C med sætter () og printf () - Dummies

De ting, som et C-program kan gøre, er ubegrænset, men når du først lærer sproget, skal du starte lille. En af de mest almindelige funktioner, du vil have dit C-program til at gøre, er at vise tekst på skærmen, og der er to måder at gøre: sætter () og printf (). sætter () Sætter sandsynligvis ...