Indholdsfortegnelse:
Video: Unlimited 4G Hotspot for $20 per Month! 2025
Hvordan vil du vide, hvordan du sætter alle dine data sammen? Med et stort dataprojekt angiver, hvad du vil gøre med dine strukturerede og ustrukturerede data, hvorfor du måske vælger et stykke teknologi over en anden. Det bestemmer også behovet for at forstå indgående datastrukturer for at sætte disse data på rette sted.
Administrer forskellige datatyper til store data
Du skal overveje nogle af egenskaberne ved store data og de typer datastyringssystemer, du måske vil bruge til at adressere hver enkelt.
Integrér datatyper i en stor datamiljø
Et andet vigtigt aspekt ved store data er, at du ofte ikke behøver at eje alle de data, du vil bruge. Mange eksempler gør punktet. Du kan muligvis udnytte sociale medier data, data kommer fra tredjeparts industristatistikker, eller endda data kommer fra satellitter. Tænk bare på sociale medier, og du forstår.
Ofte bliver det nødvendigt at integrere forskellige kilder. Disse data kan komme fra alle interne systemer, både fra interne og eksterne kilder, eller fra helt eksterne kilder. Meget af disse data kan have været tømt før.
Data behøver ikke komme til dig i realtid. Du kan bare have meget af det, og det er uensartet i naturen. Dette kunne stadig kvalificere sig som et stort data problem. Selvfølgelig kan du også stå over for et scenario, hvor du ser store datamængder, ved høje hastigheder, og det er forskelligt i naturen.
Pointen er, at du ikke får forretningsmæssig værdi, hvis du behandler en række datakilder som et sæt af afbrudte informationssiloer.
Komponenter, du har brug for, inkluderer stik og metadata.
Tilslutninger
Du vil have nogle stik, der gør det muligt at trække data ind fra forskellige store datakilder. Måske vil du have en Twitter-stik eller en Facebook-en. Måske skal du integrere fra dit datalager med en stor datakilde, der er uden for dine lokaler, så du kan analysere begge disse datakilder sammen.
Metadata
En kritisk komponent til integration af alle disse data er metadataene. Metadata er definitionerne, mappings og andre egenskaber, der bruges til at beskrive, hvordan man finder, får adgang til og bruger en virksomheds data (og software) komponenter. Et eksempel på metadata er data om et kontonummer. Dette kan omfatte nummer, beskrivelse, datatype, navn, adresse, telefonnummer og privatlivsniveau.
Metadata kan bruges til at hjælpe dig med at organisere dine datalager og håndtere nye og ændrede datakilder. Selvom ideen om metadata ikke er ny, ændrer og udvikler den sig i forbindelse med store data.I den traditionelle metadataværld er det vigtigt at have et katalog, der giver en enkelt visning af alle datakilder.
Men dette katalog skal være anderledes, når du ikke kontrollerer alle disse datakilder. Du har måske brug for et analytisk værktøj, der kan hjælpe dig med at forstå de underliggende metadata.