Hjem Personlig finansiering Stor dataanalyse og data warehouse dummies

Stor dataanalyse og data warehouse dummies

Indholdsfortegnelse:

Video: Data Warehouse Tutorial For Beginners | Data Warehouse Concepts | Data Warehousing | Edureka 2025

Video: Data Warehouse Tutorial For Beginners | Data Warehouse Concepts | Data Warehousing | Edureka 2025
Anonim

Du vil finde værdi i at bringe data warehouseets og det store datamiljø sammen. Du skal oprette et hybrid-miljø, hvor store data kan fungere sammen med datalageret.

For det første er det vigtigt at erkende, at datalageret som det er designet i dag, ikke ændres på kort sigt.

Derfor er det mere pragmatisk at bruge datalagret til det, det er designet til at gøre - give en velbevidst version af sandheden om et emne, som virksomheden ønsker at analysere. Lageret kan indeholde oplysninger om et bestemt virksomheds produktlinje, dets kunder, dets leverandører og detaljerne om et års værd for transaktioner.

Oplysningerne i datalageret eller en afdelingsdata mart er blevet omhyggeligt konstrueret, så metadataene er korrekte. Med væksten af ​​ny web-baseret information er det praktisk og ofte nødvendigt at analysere denne massive mængde data i sammenhæng med historiske data. Det er her, hvor hybridmodellen kommer ind.

Visse aspekter ved at gifte data warehouse med store data kan være forholdsvis let. For eksempel kommer mange af de store datakilder fra kilder, der indeholder deres egne veldesignede metadata. Komplekse e-handelssites omfatter veldefinerede dataelementer. Derfor arbejder informationsstyringsorganisationen ved analyser mellem lageret og den store datakilde med to datasæt med omhyggeligt udformede metadata-modeller, som skal rationaliseres.

Selvfølgelig mangler informationskilderne i nogle situationer eksplicitte metadata. Før en analytiker kan kombinere de historiske transaktionsdata med de mindre strukturerede store data, skal arbejdet gøres. Typisk vil indledende analyse af petabytes af data afsløre interessante mønstre, der kan hjælpe med at forudsige subtile ændringer i forretning eller potentielle løsninger til patientens diagnose.

Den indledende analyse kan udfyldes udnytte værktøjer som MapReduce med Hadoop distribuerede filsystem ramme. På dette tidspunkt kan du begynde at forstå, om det er i stand til at hjælpe med at evaluere det problem, der behandles.

I analyseprocessen er det lige så vigtigt at eliminere unødvendige data som det er at identificere data, der er relevante for erhvervskonteksten. Når denne fase er færdig, skal de resterende data omdannes, så metadatadefinitioner er præcise. På denne måde, når de store data kombineres med traditionelle historiske data fra lageret, bliver resultaterne nøjagtige og meningsfulde.

Den store data integration lynchpin

Denne proces kræver en veldefineret data integrationsstrategi. Mens dataintegration er et kritisk element i styring af store data, er det lige så vigtigt, når der oprettes en hybridanalyse med datalageret. Faktisk er processen med at udvinde data og omdanne den i et hybridmiljø meget ligner, hvordan denne proces udføres inden for et traditionelt datalager.

I datalageret hentes data fra traditionelle kildesystemer som CRM eller ERP-systemer. Det er kritisk, at elementer fra disse forskellige systemer er korrekt tilpasset.

Rethink-ekstraktion, transformation og belastning til datalagre

I datalageret finder du ofte en kombination af relationelle database tabeller, flade filer og ikke-relationelle kilder. Et velopbygget datalager vil blive opbygget, så dataene konverteres til et fælles format, så forespørgsler kan behandles præcist og konsekvent. De udpakkede filer skal omformes for at matche forretningsreglerne og processerne i det emneområde, som datalageret er designet til at analysere.

Med andre ord skal dataene udvindes fra de store datakilder, således at disse kilder sikkert kan fungere sammen og give meningsfulde resultater. Derudover skal kildene omdannes, så de er nyttige til at analysere forholdet mellem de historiske data og de mere dynamiske og realtidsdata, der kommer fra store datakilder.

Indlæser oplysninger i den store datamodel vil være anderledes end hvad du ville forvente i et traditionelt datalager. Med data warehouses, efter data er blevet kodificeret, ændrer det aldrig. Et typisk datalager vil give virksomheden et øjebliksbillede af data baseret på behovet for at analysere et bestemt forretningsproblem, som kræver overvågning, såsom lager eller salg.

Den distribuerede struktur af store data vil ofte føre til, at organisationer først indlæser data i en række noder og derefter udfører udvinding og transformation. Når man opretter en hybrid af det traditionelle datalager og det store datamiljø, kan den store datamiljøs distribuerede karakter dramatisk ændre organisationernes evne til at analysere store mængder data i forbindelse med virksomheden.

Stor dataanalyse og data warehouse dummies

Valg af editor

Sådan tager du et portræt ved brug af kort belysning - dummier

Sådan tager du et portræt ved brug af kort belysning - dummier

Når du bruger kort belysning, skal du dreje dit motivs hoved, så hans eller hendes ansigt ikke stirrer direkte ind i kameraet. Den vigtigste lyskilde i kort belysning kommer fra den side af ansigtet rettet væk fra kameraet. Nogle gange betegnes smal belysning, er kort belysning en værdifuld belysning ...

Sådan får du bedre feriebilleder - dummies

Sådan får du bedre feriebilleder - dummies

Et par enkle tricks og retningslinjer kan forbedre dine feriebilleder eller lave dine rejsebilleder er mere unikke. Når du rejser med dit digitalkamera, vil du jo tage billeder, der fortæller historien om din rejse, enten at dele dine oplevelser med andre eller at bringe dine egne minder tilbage fra ...

Hvordan man tager digitale billeder i tidlig morgen eller sent på eftermiddagen - dummies

Hvordan man tager digitale billeder i tidlig morgen eller sent på eftermiddagen - dummies

Tiden af dagen påvirker, hvordan du kan tage billeder med dit digitalkamera. Den tidlige morgen og den sene eftermiddags sol kræver en vis tilgang til billedoptagelse. Morgen og eftermiddagssol er nær horisonten og skaber fotografiske skygger, du kan drage fordel af.

Valg af editor

Elektronik: 555 Timer som en Astable Multivibrator - Dummies

Elektronik: 555 Timer som en Astable Multivibrator - Dummies

555 Kan opføre sig som en astabil multivibrator eller oscillator. Ved at forbinde komponenter til chippen i din elektronik, kan du konfigurere 555 til at producere en kontinuerlig serie af spændingsimpulser, som automatisk veksler mellem lavt (0 volt) og højt (den positive forsyningsspænding, VCC). Du kan beregne de lave og høje tidsintervaller ...

Elektronisk projektplan Trin 3: Prototype dine kredsløbsdummier

Elektronisk projektplan Trin 3: Prototype dine kredsløbsdummier

Inden du forpligter dit elektroniske kredsløb til en permanent printkort, vil du gerne sørge for at det virker. Den nemmeste måde at gøre det på er at opbygge kredsløbet på et loddefrit brødbræt. Det loddefrie brødbræt giver dig mulighed for hurtigt at samle komponenterne i dit kredsløb uden at lodde noget. I stedet skubber du bare baren ...

Elektronisk projektplan Trin 2: Design kretsdummierne

Elektronisk projektplan Trin 2: Design kretsdummierne

, Når du har en ide om en elektronisk projekt, det næste skridt er at designe et kredsløb, som opfylder projektets behov. I første omgang finder du det meget svært at designe dine egne kredsløb, så du kan vende dig til bøger eller til internettet for at finde andres kredsløbsdesign. Med en smule Google ...

Valg af editor

Læge assistent eksamen praksis sundhed vedligeholdelse og medicinsk etik spørgsmål - dummies

Læge assistent eksamen praksis sundhed vedligeholdelse og medicinsk etik spørgsmål - dummies

Disse praksis spørgsmål er ens til de egentlige spørgsmål, du måtte se på den lægeassistenteksamen (PANCE) eksamen, der har at gøre med forebyggende medicin, epidemiologi, vold i hjemmet og etik. Eksempel PANCE Spørgsmål Du ser en 19-årig kvinde, der har været seksuelt aktiv i de sidste to år. Du bruger meget af kontoret ...

Lægeassistenteksamen Øvelsesspørgsmål om fordøjelsessystemet - dummies

Lægeassistenteksamen Øvelsesspørgsmål om fordøjelsessystemet - dummies

En masse patologi vedrører fordøjelseskanalen system og du kan satse der vil være spørgsmål om dem på Lægeassistenteksamen (kendt som PANCE). Her er nogle livlige spørgsmål om GI-systemet. Eksempel PANCE Spørgsmål Hvilket af følgende udsagn angående tyktarmscancer screening er korrekt? ? (A) Efter alderen af ​​...

Lægeassistenteksamen: skulderfrakturer - dummies

Lægeassistenteksamen: skulderfrakturer - dummies

Stort set alle ved, hvordan det er at gøre ondt i skulderen eller overdelen arm, så det er vigtigt at kende til lægeassistenteksamen (PANCE). At gøre meget af noget kan være svært, især hvis smerten eller skaden påvirker den dominerende arm. Du bør vide om forskellige forskydninger af skulder og overarm, nemlig ...