Hjem Personlig finansiering Sådan kører du træningsdata i en SVM-overvåget læringsmodel - dummies

Sådan kører du træningsdata i en SVM-overvåget læringsmodel - dummies

Video: Toyota Mirai: Sådan fungerer brintbilen 2024

Video: Toyota Mirai: Sådan fungerer brintbilen 2024
Anonim

Inden du kan føje SVM-klassificeringsenheden (Support Vector Machine) med de data, der blev indlæst til predictive analytics, skal du opdele det fulde datasæt i et træningssæt og test sæt.

Heldigvis har scikit-learn implementeret en funktion, der hjælper dig med nemt at opdele det fulde datasæt. Funktionen train_test_split tager som input et enkelt datasæt og en procentværdi. Procentværdien bruges til at bestemme størrelsen af ​​testsættet. Funktionen returnerer to datasæt: testdatasættet (med den angivne størrelse) og træningsdatasættet (som bruger de resterende data).

Man kan typisk tage omkring 70-80 procent af de data, der skal bruges som træningssæt, og bruge de resterende data som testsæt. Men Iris datasættet er meget lille (kun 150 tilfælde), så du kan tage 90 procent af det til at træne modellen og bruge de andre 10 procent som testdata for at se, hvordan din prædiktive model vil udføre.

Indtast følgende kode for at opdele dit datasæt: >>>> fra sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris. data, iris. target, test_size = 0. 10, random_state = 111)

Den første linje importerer krydsvalideringsbibliotek i din session. Den anden linje skaber testsætet fra 10 procent af prøven.

x_train vil indeholde 135 observationer og dens funktioner.

y_train vil indeholde 135 etiketter i samme rækkefølge som de 135 observationer.

x_test vil indeholde 15 (eller 10 procent) observationer og dens funktioner.

y_test vil indeholde 15 etiketter i samme rækkefølge som de 15 observationer.

Følgende kode verificerer, at splittelsen er, hvad du forventede:

>>>> X_train. form (135, 4) >>> y_train. form (135,) >>> X_test. form (15, 4) >>> y_test. form (15,)

Du kan se fra output, at der er 135 observationer med 4 funktioner og 135 etiketter i træningssættet. Prøvesættet har 15 observationer med 4 funktioner og 15 etiketter.
Mange begyndere inden for predictive analytics glemmer at opdele datasætene - som introducerer en alvorlig designfejl i projektet. Hvis de fulde 150 tilfælde blev indlæst i maskinen som træningsdata, ville det ikke efterlade nogen usynlige data til test af modellen. Så skal du ty til at genbruge nogle af træningsinstanserne for at teste den prædiktive model.

Du kan se, at modellen i en sådan situation forudsiger den korrekte klasse altid - fordi du bruger de samme præcise data, som du brugte til at træne modellen.Modellen har allerede set dette mønster før; det vil ikke have noget problem bare at gentage, hvad det er set. En funktionsdygtig model skal gøre forudsigelser for data, som den ikke har set endnu.

Når du har en forekomst af en SVM-klassifikator, et træningsdatasæt og et testdatasæt, er du klar til at træne modellen med træningsdataene. At skrive følgende kode i tolken vil gøre det nøjagtigt: >>>> svmClassifier. fit (X_train, y_train)

Denne linie kode skaber en arbejdsmodel, der giver forudsigelser fra. Specielt en prædiktiv model, der vil forudsige hvilken klasse af Iris et nyt umærkede datasæt tilhører. SvmClassifier-forekomsten har flere metoder, som du kan ringe til at gøre forskellige ting.

For eksempel, efter at have kaldt tilpasningsmetoden, er den mest anvendte metode til at kalde den forudsigelsesmetode. Det er den metode, som du vil føje nye data til; Til gengæld forutser det resultatet.

Sådan kører du træningsdata i en SVM-overvåget læringsmodel - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...