Hjem Personlig finansiering Traditionelle ETLs rolle i Big Data - dummier

Traditionelle ETLs rolle i Big Data - dummier

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2024

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2024
Anonim

ETL-værktøjer kombinerer tre vigtige funktioner (ekstrakt, transformation, belastning), der kræves for at få data fra et stort datamiljø og sæt det i et andet datamiljø. Traditionelt er ETL blevet brugt med batchbehandling i data warehouse miljøer. Data warehouses giver forretningsbrugere mulighed for at konsolidere information til at analysere og rapportere om data, der er relevante for deres forretningsfokus. ETL-værktøjer bruges til at omdanne data til det format, der kræves af datalagre.

Transformationen udføres faktisk i en mellemliggende placering, før dataene indlæses i datalageret. Mange software-leverandører, herunder IBM, Informatica, Pervasive, Talend og Pentaho, leverer ETL-softwareværktøjer.

ETL giver den underliggende infrastruktur til integration ved at udføre tre vigtige funktioner:

  • Uddrag: Læs data fra kildedatabasen.

  • Transform: Konverter formatet af de udvundne data, så det overholder kravene i måldatabasen. Transformation sker ved at bruge regler eller fusionere data med andre data.

  • Load: Skriv data til måldatabasen.

ETL udvikler sig imidlertid for at understøtte integrationen på tværs af langt mere end traditionelle datalagre. ETL kan understøtte integration på tværs af transaktionssystemer, operative data butikker, BI platforme, MDM hubs, cloud og Hadoop platforme. ETL-softwareleverandører udvider deres løsninger til at give stor dataudvinding, -transformation og -indlæsning mellem Hadoop og traditionelle datastyringsplatforme.

ETL og softwareværktøjer til andre dataintegrationsprocesser som dataudrensning, profilering og revision af alt arbejde på forskellige aspekter af dataene for at sikre, at dataene anses for troværdige. ETL-værktøjer integreres med datakvalitetsværktøjer, og mange indeholder værktøjer til dataudrensning, datakortlægning og identifikation af datastyring. Med ETL ekstraherer du kun de data, du skal bruge til integrationen.

ETL-værktøjer er nødvendige til indlæsning og konvertering af strukturerede og ustrukturerede data til Hadoop. Avancerede ETL-værktøjer kan læse og skrive flere filer parallelt fra og til Hadoop for at forenkle, hvordan data slås sammen til en fælles transformationsproces. Nogle løsninger indeholder biblioteker af forudbyggede ETL-transformationer til både transaktions- og interaktionsdata, der kører på Hadoop eller en traditionel netværksinfrastruktur.

Datatransformation er processen med at ændre formatet for data, så det kan bruges af forskellige applikationer.Dette kan betyde en ændring fra det format, som dataene er gemt i, i det format, der er nødvendigt af den applikation, der vil bruge dataene. Denne proces indeholder også mapping instruktioner, så programmerne bliver fortalt, hvordan de får de data, de skal behandle.

Datatransformationsprocessen gøres langt mere kompleks på grund af den svimlende vækst i mængden af ​​ustrukturerede data. En forretningsapplikation som f.eks. Kundeforvaltning har specifikke krav til, hvordan data skal lagres. Dataene er sandsynligvis struktureret i de organiserede rækker og kolonner i en relationsdatabase. Data er halvstruktureret eller ustruktureret , hvis det ikke følger stive formatkrav.

Oplysningerne i en e-mail-besked anses for eksempel ustrukturerede. Nogle af virksomhedens vigtigste oplysninger findes i ustrukturerede og halvstrukturerede former som dokumenter, e-mail-meddelelser, komplekse messagingformater, kundesupportinteraktioner, transaktioner og informationer fra pakkede applikationer som ERP og CRM.

Datatransformationsværktøjer er ikke designet til at fungere godt med ustrukturerede data. Som følge heraf er virksomheder, der har brug for at indarbejde ustrukturerede oplysninger i sin beslutningsproces for forretningsprocesser, blevet udsat for en betydelig mængde manuel kodning for at opnå den nødvendige dataintegration.

I betragtning af væksten og betydningen af ​​ustrukturerede data i beslutningsprocessen begynder ETL-løsninger fra større leverandører at tilbyde standardiserede tilgange til at omdanne ustrukturerede data, så det lettere kan integreres med operationelle strukturerede data.

Traditionelle ETLs rolle i Big Data - dummier

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...