Ved hjælp af Python Ecosystem for Data Science - dummies

Video: The Internet of Things by James Whittaker of Microsoft 2025

Du skal indlæse biblioteker for at kunne udføre datavidenskabsopgaver i Python. Her er et overblik over de biblioteker, du kan bruge til datalogi. Disse biblioteker kan udføre flere funktioner for datavidenskaberen.

Adgang til videnskabelige værktøjer ved hjælp af SciPy

SciPy-stakken indeholder en række andre biblioteker, som du også kan downloade separat. Disse biblioteker yder støtte til matematik, videnskab og teknik. Når du får SciPy, får du et sæt af biblioteker, der er designet til at arbejde sammen for at skabe applikationer af forskellige slags. Disse biblioteker er

NumPy
SciPy
matplotlib
IPython
Sympy
pandas

SciPy-biblioteket fokuserer sig selv på numeriske rutiner, såsom rutiner for numerisk integration og optimering. SciPy er et universelt bibliotek, der giver funktionalitet til flere problemområder. Det giver også støtte til domænespecifikke biblioteker, såsom Scikit-learn, Scikit-image og statsmodeller.

Udførelse af grundlæggende videnskabelig databehandling ved hjælp af NumPy

NumPy-biblioteket giver mulighed for at udføre n-dimensional array manipulation, hvilket er kritisk for datalogisk arbejde. Du kunne ikke nemt få adgang til n-dimensionelle arrayer uden NumPy-funktioner, der omfatter understøttelse af lineær algebra, Fourier-transformation og tilfældig talgenerering.

Udførelse af dataanalyse ved hjælp af pandas

Pandas biblioteket understøtter datastrukturer og dataanalyseværktøjer. Biblioteket er optimeret til at udføre datavidenskabsopgaver, særligt hurtigt og effektivt. Grundprincippet bag pandas er at levere dataanalyse og modelleringsstøtte til Python, der ligner andre sprog, såsom R.

Implementering af maskine læring ved hjælp af Scikit-learn

Scikit-lær biblioteket er et af et antal Scikit-biblioteker, der bygger på funktionerne fra NumPy og SciPy, så Python-udviklere kan udføre domæne-specifikke opgaver. I dette tilfælde fokuserer biblioteket på data mining og data analyse. Det giver adgang til følgende former for funktionalitet:

Klassifikation
Regression
Klyngning
Dimensionalitetsreduktion
Modelvalg
Forbehandling

Plotting af data ved hjælp af matplotlib

Matplotlib biblioteket giver dig en MATLAB-lignende grænseflade til at skabe data præsentationer af den analyse, du udfører. Biblioteket er i øjeblikket begrænset til 2D-udgang, men det giver dig stadig midler til at udtrykke grafisk de datamønstre, du ser i de data, du analyserer.Uden dette bibliotek kunne du ikke skabe output, som folk uden for datalogi kunne forstå let.

Parsering af HTML-dokumenter ved hjælp af smuk suppe

Download af smukke suppe-bibliotek findes faktisk på Pythons websted. Dette bibliotek giver mulighed for at analysere HTML- eller XML-data på en måde, som Python forstår. Det giver dig mulighed for at arbejde med træbaserede data.

Udover at give et middel til at arbejde med træbaserede data, tager Beautiful Soup meget af arbejdet ud af at arbejde med HTML-dokumenter. For eksempel konverterer den automatisk kodningen (den måde, hvorpå tegn gemmes i et dokument) af HTML-dokumenter fra UTF-8 til Unicode. En Python-udvikler ville normalt have at bekymre sig om ting som kodning, men med Beautiful Soup kan du fokusere på din kode i stedet.