Hjem Personlig finansiering Hvordan man opretter en overordnet læringsmodel med logistisk regression - dummier

Hvordan man opretter en overordnet læringsmodel med logistisk regression - dummier

Indholdsfortegnelse:

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2024

Video: The Third Industrial Revolution: A Radical New Sharing Economy 2024
Anonim

Efter at du har opbygget din første klassifikation forudsigende model til analyse af dataene, skaber flere modeller som det en rigtig ligetil opgave i scikit. Den eneste reelle forskel fra den ene model til den næste er, at du måske må afstemme parametrene fra algoritme til algoritme.

Sådan indlæser du dine data

Denne kodeoversigt ilægger irisdatasættet i din session: >>>> fra sklearn. datasæt import load_iris >>> iris = load_iris ()

Sådan opretter du en forekomst af klassifikatoren

Følgende to linjer kode opretter en forekomst af klassifikatoren. Den første linje importerer logistikregressionsbiblioteket. Den anden linje skaber en forekomst af den logistiske regressionsalgoritme. >>>> fra sklearn import linear_model >>> logClassifier = linear_model. LogistiskRegression (C = 1, random_state = 111)

Bemærk parameteren (reguleringsparameter) i konstruktøren.

regulariseringsparameter

bruges til at forhindre overfitting. Parameteren er ikke strengt nødvendigt (konstruktøren vil fungere fint uden den, fordi den vil default til C = 1). Oprettelse af en logistisk regressions klassifikator ved hjælp af C = 150 skaber et bedre billede af beslutningens overflade. Du kan se begge punkter nedenfor.

Sådan kører du træningsdataene

Du skal opdele datasættet i trænings- og testsæt, før du kan oprette en forekomst af logistisk regressions klassifikator. Følgende kode vil udføre denne opgave: >>>> fra sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris. data, iris. target, test_size = 0. 10, random_state = 111) >>> logClassifier. fit (X_train, y_train)

Linje 1 importerer biblioteket, som giver dig mulighed for at opdele datasættet i to dele.

Linje 2 kalder funktionen fra biblioteket, der opdeler datasættet i to dele og tildeler de nu opdelte datasæt til to par variabler.

Linje 3 tager forekomsten af ​​den logistiske regressionsklassificator, du lige har oprettet, og kalder tilpasningsmetoden til at træne modellen med træningsdatasættet.

Sådan visualiserer du klassifikatoren

Når man ser på beslutningsoverfladen på plottet, ser det ud til, at nogle afstemninger skal gøres. Hvis du ser tæt på midten af ​​plottet, kan du se, at mange af de datapunkter, der tilhører det midterste område (Versicolor) ligger i området til højre side (Virginica).

Dette billede viser beslutningsoverfladen med en C-værdi på 150. Den ser visuelt bedre ud, så det er passende at vælge at bruge denne indstilling til din logistiske regressionsmodel.

Sådan køres testdataene

I den følgende kode indtaster første linje testdatasættet til modellen, og den tredje linje viser output: >>>> forudsagt = logClassifier. forudsige (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2])

Hvordan evaluere modellen < Du kan krydshenvise output fra forudsigelsen mod y_test array. Som et resultat kan du se, at det forudsagde alle testdatapunkterne korrekt. Her er koden: >>>> fra sklearn importmålinger >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> målinger. accuracy_score (y_test, forudsagt) 1. 0 # 1. 0 er 100 procent nøjagtighed >>> forudsagt == y_testarray ([True, True, True, True, True, True, True, True, True, True, True, True, True, True, True] = bool)

Så sammenligner den logistiske regressionsmodel med parameter C = 150 det? Nå, du kan ikke slå 100 procent. Her er koden til at oprette og evaluere den logistiske klassifikator med C = 150: >>>> logClassifier_2 = linear_model. LogistiskRegression (C = 150, random_state = 111) >>> logClassifier_2. fit (X_train, y_train) >>> forudsagt = logClassifier_2. forudsige (X_test) >>> målinger. accuracy_score (y_test, forudsagt) 0. 93333333333333335 >>> metrics. Confusion_matrix (y_test, forudsagt) array ([[5, 0, 0], [0, 2, 0], [0, 1, 7]])

Vi forventede bedre, men det var faktisk værre. Der var en fejl i forudsigelserne. Resultatet er det samme som for Support Vector Machine (SVM) modellen.

Her er den fulde liste over koden til at oprette og evaluere en logistisk regressionsklassifikationsmodel med standardparametrene: >>>> fra sklearn. datasæt import load_iris >>> fra sklearn import linear_model >>> fra sklearn import cross_validation >>> fra sklearn import målinger >>> iris = load_iris () >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris. data, iris. target, test_size = 0. 10, random_state = 111) >>> logClassifier = linear_model. LogisticRegression (, random_state = 111) >>> logClassifier. fit (X_train, y_train) >>> forudsagt = logClassifier. forudsige (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> metrics. accuracy_score (y_test, forudsagt) 1. 0 # 1. 0 er 100 procent nøjagtighed >>> forudsagt == y_testarray ([True, True, True, True, True, True, True, True, True, True, True, True, True, True, True] = bool)
Hvordan man opretter en overordnet læringsmodel med logistisk regression - dummier

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...