Hjem Personlig finansiering Hvordan man kan forklare resultaterne af en R Klassifikations Predictive Analytics Model - dummies

Hvordan man kan forklare resultaterne af en R Klassifikations Predictive Analytics Model - dummies

Video: What is reddit? 2024

Video: What is reddit? 2024
Anonim

En anden opgave i prædiktiv analyse er at klassificere nye data ved at forudsige hvilken klasse et målelement af data tilhører, givet et sæt uafhængige variabler. Du kan for eksempel klassificere en kunde efter type - sig som en høj værdi kunde, en almindelig kunde eller en kunde, der er klar til at skifte til en konkurrent - ved hjælp af et beslutningstræ.

Indtast følgende kode for at se nogle nyttige oplysninger om R-klassificeringsmodellen:

>> resumé (model) Længdeklasse-tilstand 1 BinaryTree S4
Klassekolonnen fortæller dig, at du har oprettet et beslutningstræ. For at se hvordan splittelserne bestemmes, kan du blot skrive navnet på variablen, hvor du har tildelt modellen, i dette tilfælde model: >> model Conditional inference tree med 6 terminal noder Svar: seedType Inputs: område, omkreds, kompaktitet, længde, bredde, asymmetri, længde2 Antal observationer: 147 1) område <= 16 2; kriterium = 1, statistik = 123. 423 2) areal <= 13. 37; kriterium = 1, statistik = 63. 549 3) længde2 4. 914 5) * vægt = 45 2) område> 13. 37 6) længde2 5. 396 8) * vægt = 8 1) område> 16 2 9) længde2 5. 877 11) * vægte = 40

Endnu bedre, du kan visualisere modellen ved at lave et plot af beslutningstræet med denne kode:> plot (model)


Dette er en grafisk gengivelse af et beslutningstræ. Du kan se, at den overordnede form efterligner et ægte træ. Den er lavet af

noder

(cirklerne og rektanglerne) og links eller kanter (forbindelseslinierne). Den allerførste node (startende øverst) kaldes rodknude, og knuderne i bunden af ​​træet (rektangler) kaldes terminal noder . Der er fem beslutningsknuder og seks terminale noder.

Ved hver knude tager modellen en beslutning baseret på kriterierne i cirklen og linkene og vælger en vej. Når modellen når en terminalknude, opnås en dom eller en endelig beslutning. I dette særlige tilfælde bruges to attributter, og og, til at afgøre, om en given frøtype er i klasse 1, 2 eller 3.

F.eks. Tag observation nr. 2 fra datasættet. Den har en af ​​4.956 og en af ​​14. 88. Du kan bruge det træ, du lige har bygget til at bestemme, hvilken bestemt frø type denne observation tilhører. Her er trinets rækkefølge:

Start ved rodknuden, som er knudepunkt 1 (tallet vises i den lille firkant øverst i cirklen). Bestem baseret på attributten: Er observationen # 2 mindre end eller lig med (betegnet med <=) 16.2? svaret er ja, så bevæg dig langs stien til knude 2.

Ved knude 2 spørger modellen: Er området 13. 37? Svaret er ja, så bevæg dig langs stien til knude 6. Ved denne knude spørger modellen: Er længden2 <= 5.396? det er, og du flytter til terminal nr. 7, og dommen er, at observation nr. 2 er af frø type 1. Og det er faktisk frø type 1.

  1. Modellen gør det for alle andre observationer at forudsige deres forudsigelse klasser.

  2. For at finde ud af om du har trænet en god model, skal du tjekke den mod træningsdataene. Du kan se resultaterne i en tabel med følgende kode: >> tabel (forudsig (model), trainSet $ ​​seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44

    Resultaterne viser, at fejlen (eller fejlklasse) er 11 ud af 147 eller 7. 48 procent.

  3. Med de beregnede resultater er næste trin at læse tabellen.

    De korrekte forudsigelser er dem, der viser kolonne- og rækkenumrene som de samme. Disse resultater vises som en diagonal linje fra øverste venstre til nederste højre; for eksempel [1, 1], [2, 2], [3, 3] er antallet af korrekte forudsigelser for den pågældende klasse.
    

    Så for frø type 1 forudsagde modellen det 45 gange, mens misclassifying frøet 7 gange (4 gange som frø type 2 og 3 gange som type 3). For frø type 2 forudsagde modellen det 47 gange, mens det blev klassificeret 3 gange. For frø type 3 forudsagde modellen det 44 gange, mens det kun blev klassificeret én gang.

  4. Dette viser, at dette er en god model. Så nu vurderer du det med testdataene. Her er koden, der bruger testdataene til at forudsige og gemme den i en variabel (testPrediction) til senere brug: >> testPrediction <- predict (model, newdata = testSet)

    For at evaluere, hvordan modellen udføres med test data, se det i en tabel og beregne fejlen, for hvilken koden ser sådan ud: >> tabel (testPrediction, testSet $ ​​seedType) testPrediktion 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17

Hvordan man kan forklare resultaterne af en R Klassifikations Predictive Analytics Model - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...