Hjem Personlig finansiering Hvordan man opretter avancerede scatterplots i MatPlotLib - dummies

Hvordan man opretter avancerede scatterplots i MatPlotLib - dummies

Indholdsfortegnelse:

Video: Data Camp 4. november 2010 2025

Video: Data Camp 4. november 2010 2025
Anonim

Scatterplots er særligt vigtige for datalogi, fordi de kan vise datamønstre, der ikke er indlysende, når de ses på andre måder. Du kan se datagrupperinger relativt nemt og hjælpe seeren med at forstå, hvornår data tilhører en bestemt gruppe. Du kan også vise overlapninger mellem grupper og endda demonstrere, når visse data er uden for det forventede interval. Viser disse forskellige former for relationer i dataene er en avanceret teknik, som du behøver at vide for at udnytte MatPlotLib bedst muligt.

Afbilder grupper

Farve er den tredje akse, når der arbejdes med en scatterplot. Ved hjælp af farve kan du markere grupper, så andre kan se dem med større lethed. Følgende eksempel viser, hvordan du kan bruge farve til at vise grupper inden for en scatterplot:

import numpy som np

import matplotlib. pyplot som plt

x1 = 5 * np. tilfældig. rand (50)

x2 = 5 * np. tilfældig. rand (50) + 25

x3 = 30 * np. tilfældig. rand (25)

x = np. concatenate ((x1, x2, x3))

y1 = 5 * np. tilfældig. rand (50)

y2 = 5 * np. tilfældig. rand (50) + 25

y3 = 30 * np. tilfældig. rand (25)

y = np. concatenate ((y1, y2, y3))

color_array = ['b'] * 50 + ['g'] * 50 + ['r'] * 25

PLT. scatter (x, y, s = [50], markør = "D", c = color_array)

plt. show ()

Dette eksempel bruger en array til farverne. Den første gruppe er dog blå, efterfulgt af grøn til den anden gruppe. Eventuelle outliers vises i rødt.

Farvearrayer kan gøre scatterplot-grupperne bedre.

Viser korrelationer

I nogle tilfælde skal du kende den generelle retning, dine data tager, når man ser på en scatterplot. Selvom du opretter en klar skildring af grupperne, er den egentlige retning, som dataene tager som helhed, muligvis ikke klar. I dette tilfælde tilføjer du en trendlinie til output. Her er et eksempel på at tilføje en trendlinie til en scatterplot, der indeholder grupper.

import numpy som np

import matplotlib. pyplot som plt

import matplotlib. pylab som plb

x1 = 15 * np. tilfældig. rand (50)

x2 = 15 * np. tilfældig. rand (50) + 15

x3 = 30 * np. tilfældig. rand (30)

x = np. concatenate ((x1, x2, x3))

y1 = 15 * np. tilfældig. rand (50)

y2 = 15 * np. tilfældig. rand (50) + 15

y3 = 30 * np. tilfældig. rand (30)

y = np. concatenate ((y1, y2, y3))

color_array = ['b'] * 50 + ['g'] * 50 + ['r'] * 25

plt. scatter (x, y, s = [90], markør = "*", c = color_array)

z = np. polyfit (x, y, 1)

p = np. poly1d (z)

PLB. plot (x, p (x), 'm -')

plt.show ()

Tilføjelse af en trendlinie betyder at kalde NumPy polyfit () -funktionen med dataene, som returnerer en vektor af koefficienter, p , der minimerer mindst kvadraterfejlen. Mindst kvadratisk regression er en metode til at finde en linje, der opsummerer forholdet mellem to variabler, x og y i dette tilfælde, i det mindste inden for domænet af forklaringsvariablen x . Den tredje polyfit () parameter udtrykker graden af ​​polynomisk pasform.

Vektorudgangen på polyfit () bruges som input til poly1d () , som beregner de faktiske y-akse datapunkter. Opkaldet til plot () skaber trendlinjen på scatterplot.

Scatterplot trendlinjer kan vise dig den generelle dataretning.

Hvordan man opretter avancerede scatterplots i MatPlotLib - dummies

Valg af editor

10 Transaktioner og funktioner, som de fleste oplysninger konverterer til i QuickBooks Online - dummies

10 Transaktioner og funktioner, som de fleste oplysninger konverterer til i QuickBooks Online - dummies

Følgende listen indeholder detaljer om transaktioner og funktioner, som de fleste data konverterer og sammenlignelige transaktioner og funktioner findes i QuickBooks Online (QBO). I nogle tilfælde findes undtagelser; Du finder specifikke noter i web-ekstraartikel & ldquo; Hvordan QuickBooks Desktop Lister Konverter til QuickBooks Online. & Rdquo; Og for flere oplysninger, besøg QuickBooks ofte stillede spørgsmål, og ldquo; Hvorfor ...

Der producerer betalingsopgørelser i MYOB-dummies

Der producerer betalingsopgørelser i MYOB-dummies

I slutningen af ​​hvert lønningsår (som slutter den 30. juni) kan bruge MYOB til at levere hver medarbejder med et betalingsoversigt. Et betalingsopsamling er et kort dokument, der opsummerer de bruttolønninger, skat og godtgørelser, som medarbejderen har modtaget i løbet af de sidste 12 måneder af ansættelsen. Opsætning af betalingsoversigter Til ...

15 Funktioner, der ikke konverteres og findes ikke i QuickBooks Online

15 Funktioner, der ikke konverteres og findes ikke i QuickBooks Online

Følgende oplysninger viser transaktioner og funktioner, som ikke konverteres fra desktop QuickBooks til QuickBooks Online (QBO) og heller ikke har nogen sammenlignelig funktion i QBO. Selv om en eller flere af disse transaktioner eller funktioner kan være afbrudte afbrydere, skal du huske at for mange af disse funktioner kan du bruge løsninger. Typen af ​​data eller funktional noter ...

Valg af editor

Sådan bruger du FREQUENCY-funktionen i Excel - dummier

Sådan bruger du FREQUENCY-funktionen i Excel - dummier

FREQUENCY-funktionen i Excel tæller værdierne i en array der falder inden for en rækkevidde eller bin. Funktionen bruger følgende syntaks: = FREQUENCY (data_array, bins_array) hvor data_array er det regnearkområde, der indeholder de værdier, du vil tælle, og bins_array er et regnearkområde, der identificerer værdierne eller bakkerne, der ...

Hvordan man bruger målsøgningsfunktionen i Excel 2013 - dummies

Hvordan man bruger målsøgningsfunktionen i Excel 2013 - dummies

, Når du skal analysere , bruger du Excel 2013s målsøgningsfunktion til at finde de indgangsværdier, der er nødvendige for at opnå det ønskede mål. Nogle gange, når du gør hvad-hvis analyse, har du et bestemt udgangspunkt i tankerne, såsom et mål salgsmængde eller vækstprocent. Hvis du vil bruge funktionen Målsøgning placeret på What-If ...

Hvordan man vælger Excel CHOOSE-funktionen i datamodeller - dummier

Hvordan man vælger Excel CHOOSE-funktionen i datamodeller - dummier

Selvom valgmuligheden måske ikke Se nyttige på overfladen, denne funktion kan dramatisk forbedre dine Excel-datamodeller. VÆLG-funktionen returnerer en værdi fra en bestemt liste over værdier baseret på et angivet positionsnummer. Hvis du f.eks. Indtaster formlerne VÆLG (3, "Rød", "Gul", "Grøn", "Blå") i en celle, returnerer Excel ...

Valg af editor

Indlæs en Workflow i SharePoint 2010 - dummies

Indlæs en Workflow i SharePoint 2010 - dummies

Konfigurere dit bibliotek til at bruge en workflow i SharePoint 2010 løser kun en del af problemet. Hvis du ikke har dit bibliotek konfigureret til at kick-off automatisk, skal en person manuelt starte workflowen. Start manuelt en arbejdsgang ved at følge disse trin: Gennemse det element, du vil godkende, klik på rullelisten og vælg Workflows. ...

Bibliotek / Liste Generelle indstillinger Område i SharePoint 2010 - dummies

Bibliotek / Liste Generelle indstillinger Område i SharePoint 2010 - dummies

Bibliotekets generelle indstillinger / listen er blevet udvidet i SharePoint 2010 til at omfatte flere nye indstillinger, herunder validering, kolonne standardværdi (for biblioteker), vurdering, metadata navigation, visningsvisning og formular (for lister). Her er et overblik for at se, hvad du kan gøre med hver af disse muligheder. Generelle indstillinger Konfigurationsindstillinger Indstillingsnavn ...

Importer et regneark som en liste i SharePoint 2010 - dummies

Importer et regneark som en liste i SharePoint 2010 - dummies

Har allerede data i et regneark, som du Vil du være en SharePoint 2010 liste? Du er halvvejs derhen! Før du starter, skal du sørge for at gøre følgende: Rens listen. Sørg for, at din liste ligner et bord uden tomme kolonner eller rækker. Sørg for, at din liste har overskrifter. Alle kolonner skal have en ...