Video: Your body language may shape who you are | Amy Cuddy 2025
Det første skridt mod predictive modellering er at forbinde variabler med hinanden. Et simpelt, bemærkelsesværdigt redskab til det er scatterplot. Det er vant til at forholde en kontinuerlig foranstaltning til en anden. Data minearbejdere strækker nogle gange reglerne og bruger det med kategoriske variable også.
Den horisontale ( x ) akse af plottet repræsenterer værdier af en variabel; den lodrette akse ( y ) repræsenterer en anden variabel. Du har måske ikke en følelse af, hvilken variabel der er uafhængig, og som er afhængig af hvert par variabler.
Hvis du gør det, skal den uafhængige variabel være på den vandrette akse. Hvert punkt på plottet repræsenterer koordinaterne, parret af værdier for de to variabler i en enkelt sag. (Disse par kaldes undertiden xy par ).
Find dit scatterplot-værktøj og opret et grundlæggende scatterplot-værktøj ved at vælge to variabler, der skal bruges. Den følgende figur viser dette værktøj på menuen Orange; Placeringen af værktøjet varierer efter produkt.
Eksemplet i det næste billede viser et interaktivt display; scatterplot vises straks. I et andet værktøj kan du have brug for yderligere trin til at udføre og oprette diagrammet.
Scatterplot-eksemplet vedrører automatisk kilometertal til motorhestekræfter. Lav hestekræfter er forbundet med høj kilometertal, og jo højere hestekræfter er, jo lavere kilometertal. Du kan nemt se dette mønster i dataene. Du kan mærke en form, ikke lineær, men noget buet. Dette kunne give tip om, hvilke modeltyper der skal forsøges senere.
Data-mining applikationer har ofte nogle interaktive funktioner i grafiske displays. For eksempel viser den næste figur, at svingning af musen over et punkt afslører de nøjagtige værdier af de to variabler for det punkt. Dette er lettere end at prøve at læse værdierne fra akserne!