Indholdsfortegnelse:
- Datavidenskab og datateknik er ikke det samme.
- Datavidenskab og business intelligence er heller ikke det samme.
Video: What Most Schools Don't Teach 2025
Del af Data Science for Dummies Cheat Sheet
Traditionelt store data er udtrykket for data, der har utrolig volumen, hastighed og variation. Traditionelle databaseteknologier er ikke i stand til at håndtere store data - der kræves flere innovative datastyrede løsninger. For at evaluere dit projekt for, om det kvalificerer som et stort dataprojekt, skal du overveje følgende kriterier:
-
Volumen: Mellem 1 terabyte / år og 10 petabytter / år
-
Hastighed: Mellem 30 kilobytes / sekund og 30 gigabyte / sekund
-
Variety: Kombinerede kilder til ustrukturerede, semistrukturerede og strukturerede data
Datavidenskab og datateknik er ikke det samme.
Ansættelse ledere har en tendens til at forvirre rollen som datavidenskabsmand og dataingeniør. Mens det er muligt at finde nogen, der gør lidt af begge, er hvert felt utrolig komplekst. Det er usandsynligt, at du vil finde nogen med robuste færdigheder og erfaring på begge områder. Af denne grund er det vigtigt at kunne identificere hvilken type specialist der er bedst egnet til at hjælpe dig med at nå dine specifikke mål. Beskrivelserne nedenfor skal hjælpe dig med at gøre det.
-
Datavidenskabsmænd: Datavidenskabsmænd bruger kodning, kvantitative metoder (matematisk, statistisk og maskinindlæring) og højt specialiseret ekspertise inden for deres studieområde til at udlede løsninger på komplekse forretnings- og videnskabelige problemer.
-
Datateknikere: Datateknikere bruger færdigheder inden for computervidenskab og software engineering til at designe systemer til og løse problemer med, håndtering og manipulation af store datasæt.
Datavidenskab og business intelligence er heller ikke det samme.
Business-centreret datavidenskabsfolk og forretningsanalytikere, der driver business intelligence, er som fætre. Begge typer specialbrugsdata til opnåelse af de samme forretningsmål, men deres tilgange, teknologier og funktioner er forskellige. Beskrivelserne nedenfor præciserer forskellene mellem de to roller.
-
Business Intelligence (BI): BI-løsninger er generelt bygget ved hjælp af datasæt, der genereres internt - fra en organisation i stedet for fra uden med andre ord. Fælles værktøjer og teknologier omfatter online analytisk behandling, ekstrakt transformation og belastning, og datalagring. Selvom BI nogle gange indebærer fremadrettede metoder som prognoser, er disse metoder baseret på enkle matematiske påvirkninger fra historiske eller aktuelle data.
-
Business-centreret datalogi: Business-centreret datalogi løsninger er bygget ved hjælp af datasæt, der er både interne og eksterne til en organisation. Fælles værktøjer, teknologier og færdigheder omfatter cloud-baserede analytik platforme, statistisk og matematisk programmering, maskinindlæring, data analyse ved hjælp af Python og R, og avanceret data visualisering. Business-centreret datavidenskabsfolk bruger avancerede matematiske eller statistiske metoder til at analysere og generere forudsigelser fra store mængder forretningsdata.