Hjem Personlig finansiering Fundamentals of Big Data Integration - dummies

Fundamentals of Big Data Integration - dummies

Anonim

De grundlæggende elementer i den store datastruktur styrer data på nye måder i forhold til den traditionelle relationsdatabase. Dette skyldes behovet for at have skalerbarhed og høj ydeevne, der kræves for at klare både strukturerede og ustrukturerede data.

Komponenter i det store datasøkosystem, der spænder fra Hadoop til NoSQL DB, MongoDB, Cassandra og HBase, har alle deres egen tilgang til udpakning og indlæsning af data. Som et resultat kan dine teams måske udvikle nye færdigheder til at styre integrationsprocessen på tværs af disse platforme. Imidlertid vil mange af virksomhedens datastyrings bedste praksis blive endnu vigtigere, når du flytter ind i verden med store data.

Mens store data introducerer et nyt niveau af integrationskompleksitet, gælder de grundlæggende grundlæggende principper stadig. Dit forretningsmæssige mål skal fokusere på at levere kvalitets- og pålidelige data til organisationen på det rette tidspunkt og i den rigtige sammenhæng.

For at sikre denne tillid skal du etablere fælles regler for datakvalitet med vægt på dataens nøjagtighed og fuldstændighed. Derudover har du brug for en omfattende tilgang til udvikling af virksomhedsmetadata, holde styr på datastamning og styring for at understøtte integration af dine data.

Samtidig udvikler traditionelle værktøjer til dataintegration sig til at håndtere den stigende række ustrukturerede data og voksende volumen og hastighed for store data. Selv om traditionelle former for integration tager nye betydninger i en stor dataf verden, har din integrationsteknologi brug for en fælles platform, der understøtter datakvalitet og profilering.

For at gøre sunde forretningsbeslutninger baseret på stor dataanalyse, skal disse oplysninger være pålidelige og forstås på alle niveauer i organisationen. Selv om det sandsynligvis ikke vil være omkostning eller tidseffektivt at være alt for bekymret over datakvaliteten i den eksplorative fase af en stor dataanalyse, skal kvalitet og tillid til sidst spille en rolle, hvis resultaterne skal indarbejdes i forretningsprocessen.

Oplysninger skal leveres til virksomheden på en pålidelig, kontrolleret, konsekvent og fleksibel måde på tværs af virksomheden, uanset kravene til individuelle systemer eller applikationer. For at nå dette mål gælder tre grundlæggende principper:

  • Du skal skabe en fælles forståelse af datadefinitioner. I de indledende faser af din store dataanalyse har du sandsynligvis ikke samme kontrolniveau over datadefinitioner som du gør med dine operationelle data.Når du først har identificeret de mønstre, der er mest relevante for din virksomhed, har du brug for evnen til at kortlægge dataelementer til en fælles definition.

  • Du skal udvikle et sæt datatjenester for at kvalificere dataene og gøre det konsekvent og i sidste ende troværdigt. Når dine ustrukturerede og store datakilder er integreret med strukturerede operationelle data, skal du være sikker på, at resultaterne vil være meningsfulde.

  • Du har brug for en strømlinet måde at integrere dine store datakilder og registreringssystemer på. For at træffe gode beslutninger baseret på resultaterne af din store dataanalyse, skal du levere oplysninger til det rigtige tidspunkt og med den rette sammenhæng. Din store dataintegrationsproces skal sikre konsistens og pålidelighed.

For at integrere data på tværs af blandede applikationsmiljøer, få data fra et datamiljø (kilde) til et andet datamiljø (mål). Uddrag, transformation og belastning (ETL) teknologier er blevet brugt til at opnå dette i traditionelle data warehouse miljøer. ETLs rolle udvikler sig til at håndtere nyere databehandlingsmiljøer som Hadoop.

I et stort datamiljø kan du muligvis kombinere værktøjer, som understøtter integrationsprocesser i batch (ved hjælp af ETL) med real-time integration og føderation på tværs af flere kilder. For eksempel kan et lægemiddelfirma muligvis blande data, der er lagret i dets MDD-system (Master Data Management), med store datakilder om medicinske resultater af brugernes brug af kunder.

Virksomheder bruger MDM til at lette indsamling, aggregering, konsolidering og levering af ensartede og pålidelige data på en kontrolleret måde på tværs af virksomheden. Derudover bruges nye værktøjer som Sqoop og Scribe til at understøtte integration af store datamiljøer. Du finder også en stigende vægt på at bruge ekstrakt, load og transform (ELT) teknologier. Disse teknologier beskrives næste.

Fundamentals of Big Data Integration - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...