Hjem Personlig finansiering Stor dataanalyse og data warehouse dummies

Stor dataanalyse og data warehouse dummies

Indholdsfortegnelse:

Video: Data Warehouse Tutorial For Beginners | Data Warehouse Concepts | Data Warehousing | Edureka 2024

Video: Data Warehouse Tutorial For Beginners | Data Warehouse Concepts | Data Warehousing | Edureka 2024
Anonim

Du vil finde værdi i at bringe data warehouseets og det store datamiljø sammen. Du skal oprette et hybrid-miljø, hvor store data kan fungere sammen med datalageret.

For det første er det vigtigt at erkende, at datalageret som det er designet i dag, ikke ændres på kort sigt.

Derfor er det mere pragmatisk at bruge datalagret til det, det er designet til at gøre - give en velbevidst version af sandheden om et emne, som virksomheden ønsker at analysere. Lageret kan indeholde oplysninger om et bestemt virksomheds produktlinje, dets kunder, dets leverandører og detaljerne om et års værd for transaktioner.

Oplysningerne i datalageret eller en afdelingsdata mart er blevet omhyggeligt konstrueret, så metadataene er korrekte. Med væksten af ​​ny web-baseret information er det praktisk og ofte nødvendigt at analysere denne massive mængde data i sammenhæng med historiske data. Det er her, hvor hybridmodellen kommer ind.

Visse aspekter ved at gifte data warehouse med store data kan være forholdsvis let. For eksempel kommer mange af de store datakilder fra kilder, der indeholder deres egne veldesignede metadata. Komplekse e-handelssites omfatter veldefinerede dataelementer. Derfor arbejder informationsstyringsorganisationen ved analyser mellem lageret og den store datakilde med to datasæt med omhyggeligt udformede metadata-modeller, som skal rationaliseres.

Selvfølgelig mangler informationskilderne i nogle situationer eksplicitte metadata. Før en analytiker kan kombinere de historiske transaktionsdata med de mindre strukturerede store data, skal arbejdet gøres. Typisk vil indledende analyse af petabytes af data afsløre interessante mønstre, der kan hjælpe med at forudsige subtile ændringer i forretning eller potentielle løsninger til patientens diagnose.

Den indledende analyse kan udfyldes udnytte værktøjer som MapReduce med Hadoop distribuerede filsystem ramme. På dette tidspunkt kan du begynde at forstå, om det er i stand til at hjælpe med at evaluere det problem, der behandles.

I analyseprocessen er det lige så vigtigt at eliminere unødvendige data som det er at identificere data, der er relevante for erhvervskonteksten. Når denne fase er færdig, skal de resterende data omdannes, så metadatadefinitioner er præcise. På denne måde, når de store data kombineres med traditionelle historiske data fra lageret, bliver resultaterne nøjagtige og meningsfulde.

Den store data integration lynchpin

Denne proces kræver en veldefineret data integrationsstrategi. Mens dataintegration er et kritisk element i styring af store data, er det lige så vigtigt, når der oprettes en hybridanalyse med datalageret. Faktisk er processen med at udvinde data og omdanne den i et hybridmiljø meget ligner, hvordan denne proces udføres inden for et traditionelt datalager.

I datalageret hentes data fra traditionelle kildesystemer som CRM eller ERP-systemer. Det er kritisk, at elementer fra disse forskellige systemer er korrekt tilpasset.

Rethink-ekstraktion, transformation og belastning til datalagre

I datalageret finder du ofte en kombination af relationelle database tabeller, flade filer og ikke-relationelle kilder. Et velopbygget datalager vil blive opbygget, så dataene konverteres til et fælles format, så forespørgsler kan behandles præcist og konsekvent. De udpakkede filer skal omformes for at matche forretningsreglerne og processerne i det emneområde, som datalageret er designet til at analysere.

Med andre ord skal dataene udvindes fra de store datakilder, således at disse kilder sikkert kan fungere sammen og give meningsfulde resultater. Derudover skal kildene omdannes, så de er nyttige til at analysere forholdet mellem de historiske data og de mere dynamiske og realtidsdata, der kommer fra store datakilder.

Indlæser oplysninger i den store datamodel vil være anderledes end hvad du ville forvente i et traditionelt datalager. Med data warehouses, efter data er blevet kodificeret, ændrer det aldrig. Et typisk datalager vil give virksomheden et øjebliksbillede af data baseret på behovet for at analysere et bestemt forretningsproblem, som kræver overvågning, såsom lager eller salg.

Den distribuerede struktur af store data vil ofte føre til, at organisationer først indlæser data i en række noder og derefter udfører udvinding og transformation. Når man opretter en hybrid af det traditionelle datalager og det store datamiljø, kan den store datamiljøs distribuerede karakter dramatisk ændre organisationernes evne til at analysere store mængder data i forbindelse med virksomheden.

Stor dataanalyse og data warehouse dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...