Hvordan Support Vector Machine Predictive Analysis forudsiger fremtiden - dummies

Video: How to Predict Stock Prices Easily - Intro to Deep Learning #7 2025

understøttende vektormaskine (SVM) er en prædiktiv analyse data-klassifikationsalgoritme, der tildeler ny dataelementer til en af mærket kategorier. SVM er i de fleste tilfælde en binær klassifikator; det antager, at de pågældende data indeholder to mulige målværdier.

En anden version af SVM-algoritmen, multiclass SVM, forstærker SVM som klassifikator på et datasæt, der indeholder mere end en klasse (gruppering eller kategori). SVM har med succes været anvendt i mange applikationer som billedgenkendelse, medicinsk diagnose og tekstanalyse.

Antag at du designer en prædiktiv analysemodel, der automatisk genkender og forudsiger navnet på et objekt i et billede. Dette er i det væsentlige problemet med billedgenkendelse - eller mere specifikt ansigtsgenkendelse: Du vil have klassificeringsenheden til at genkende navnet på en person i et billede. Før du tager fat på det niveau af kompleksitet, overvej en enklere version af det samme problem: Antag at du har billeder af enkelte stykker frugt, og du vil gerne have din klassifikator for at forudsige, hvilken slags frugt der vises på billedet. Antag at du kun har to typer frugter: æbler og pærer, en pr. Billede.

Giv et nyt billede, du vil gerne forudsige, om frugten er et æble eller en pære - uden at se på billedet. Du vil have, at SVM klassificerer hvert billede som æble eller pære. Som med alle andre algoritmer er det første skridt at træne klassifikatoren.

Antag at du har 200 billeder af forskellige æbler og 200 billeder af pærer. Læringstrinnet består i at fodre disse billeder til klassifikatoren, så det lærer, hvad et æble ser ud og hvad en pære ser ud. Før du kommer ind i dette første trin, skal du omdanne hvert billede til en datamatrix ved hjælp af (sig) R-statistikpakken.

En simpel måde at repræsentere et billede som tal på i en matrix er at søge geometriske former inden for billedet (såsom cirkler, linjer, firkanter eller rektangler) og også positionerne for hver forekomst af hver geometrisk form. Disse tal kan også repræsentere koordinater for disse objekter inden for billedet, som afbildet i et koordinatsystem.

Som du måske forestiller dig, repræsenterer et billede som en matrix af tal ikke ligefrem en ligetil opgave. Et helt forskelligt forskningsområde er afsat til billedrepræsentation.

Nedenstående viser, hvordan en støttevektormaskine kan forudsige en frugtklasse (mærkning den matematisk som

apple eller pære ), baseret på det, som algoritmen har lært i fortiden. Antag, at du har konverteret alle billederne til datamatricer. Derefter har supportvektormaskinen to hovedindgange:

Tidligere (træningsdata): Dette sæt matricer svarer til tidligere set billeder af æbler og pærer.

De nye (usynlige) data består af et billede konverteret til en matrix. Formålet er at forudsige automatisk hvad der er på billedet - et æble eller en pære.
Støttevektoren bruger en matematisk funktion, ofte kaldet en

kernelfunktion , som er en matematikfunktion, der matcher de nye data til det bedste billede fra træningsdataene for at forudsige det ukendte billeds etiket (æble eller pære). Sammenlignet med andre klassifikatorer producerer supportvektormaskiner robuste, nøjagtige forudsigelser, er mindst påvirket af støjende data og er mindre tilbøjelige til overfitting. Husk dog, at støttevektormaskiner er mest egnede til binær klassificering - når du kun har to kategorier (f.eks. Æble eller pære).