Hjem Personlig finansiering Traditionelle ETLs rolle i Big Data - dummier

Traditionelle ETLs rolle i Big Data - dummier

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2025

Video: AWS Tutorial For Beginners | AWS Full Course - Learn AWS In 10 Hours | AWS Training | Edureka 2025
Anonim

ETL-værktøjer kombinerer tre vigtige funktioner (ekstrakt, transformation, belastning), der kræves for at få data fra et stort datamiljø og sæt det i et andet datamiljø. Traditionelt er ETL blevet brugt med batchbehandling i data warehouse miljøer. Data warehouses giver forretningsbrugere mulighed for at konsolidere information til at analysere og rapportere om data, der er relevante for deres forretningsfokus. ETL-værktøjer bruges til at omdanne data til det format, der kræves af datalagre.

Transformationen udføres faktisk i en mellemliggende placering, før dataene indlæses i datalageret. Mange software-leverandører, herunder IBM, Informatica, Pervasive, Talend og Pentaho, leverer ETL-softwareværktøjer.

ETL giver den underliggende infrastruktur til integration ved at udføre tre vigtige funktioner:

  • Uddrag: Læs data fra kildedatabasen.

  • Transform: Konverter formatet af de udvundne data, så det overholder kravene i måldatabasen. Transformation sker ved at bruge regler eller fusionere data med andre data.

  • Load: Skriv data til måldatabasen.

ETL udvikler sig imidlertid for at understøtte integrationen på tværs af langt mere end traditionelle datalagre. ETL kan understøtte integration på tværs af transaktionssystemer, operative data butikker, BI platforme, MDM hubs, cloud og Hadoop platforme. ETL-softwareleverandører udvider deres løsninger til at give stor dataudvinding, -transformation og -indlæsning mellem Hadoop og traditionelle datastyringsplatforme.

ETL og softwareværktøjer til andre dataintegrationsprocesser som dataudrensning, profilering og revision af alt arbejde på forskellige aspekter af dataene for at sikre, at dataene anses for troværdige. ETL-værktøjer integreres med datakvalitetsværktøjer, og mange indeholder værktøjer til dataudrensning, datakortlægning og identifikation af datastyring. Med ETL ekstraherer du kun de data, du skal bruge til integrationen.

ETL-værktøjer er nødvendige til indlæsning og konvertering af strukturerede og ustrukturerede data til Hadoop. Avancerede ETL-værktøjer kan læse og skrive flere filer parallelt fra og til Hadoop for at forenkle, hvordan data slås sammen til en fælles transformationsproces. Nogle løsninger indeholder biblioteker af forudbyggede ETL-transformationer til både transaktions- og interaktionsdata, der kører på Hadoop eller en traditionel netværksinfrastruktur.

Datatransformation er processen med at ændre formatet for data, så det kan bruges af forskellige applikationer.Dette kan betyde en ændring fra det format, som dataene er gemt i, i det format, der er nødvendigt af den applikation, der vil bruge dataene. Denne proces indeholder også mapping instruktioner, så programmerne bliver fortalt, hvordan de får de data, de skal behandle.

Datatransformationsprocessen gøres langt mere kompleks på grund af den svimlende vækst i mængden af ​​ustrukturerede data. En forretningsapplikation som f.eks. Kundeforvaltning har specifikke krav til, hvordan data skal lagres. Dataene er sandsynligvis struktureret i de organiserede rækker og kolonner i en relationsdatabase. Data er halvstruktureret eller ustruktureret , hvis det ikke følger stive formatkrav.

Oplysningerne i en e-mail-besked anses for eksempel ustrukturerede. Nogle af virksomhedens vigtigste oplysninger findes i ustrukturerede og halvstrukturerede former som dokumenter, e-mail-meddelelser, komplekse messagingformater, kundesupportinteraktioner, transaktioner og informationer fra pakkede applikationer som ERP og CRM.

Datatransformationsværktøjer er ikke designet til at fungere godt med ustrukturerede data. Som følge heraf er virksomheder, der har brug for at indarbejde ustrukturerede oplysninger i sin beslutningsproces for forretningsprocesser, blevet udsat for en betydelig mængde manuel kodning for at opnå den nødvendige dataintegration.

I betragtning af væksten og betydningen af ​​ustrukturerede data i beslutningsprocessen begynder ETL-løsninger fra større leverandører at tilbyde standardiserede tilgange til at omdanne ustrukturerede data, så det lettere kan integreres med operationelle strukturerede data.

Traditionelle ETLs rolle i Big Data - dummier

Valg af editor

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvis du arbejder i Microsoft Excel 2010 og vil begynde at arbejde i en ny Excel-workbook-fil, kan du nemt oprette en ny projektmappe. For at gøre det kan du bruge en kommando på fanen Filer eller en tastaturgenvej. Klik på fanen Filer. Excel viser Backstage-visning, hvor du kan få adgang til filrelaterede kommandoer. ...

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

I Excel 2010 Opret brugerdefinerede ordbøger, der skal bruges, når du stavekontrollerer dine regneark. Du bruger knappen Tilføj til ordbog i dialogboksen Staveord til at tilføje ukendte ord til en brugerdefineret ordbog. Som standard tilføjer Excel disse ord til en brugerdefineret ordbog fil med navnet CUSTOM. DIC, men du kan oprette en ny brugerdefineret ...

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

, Når du opretter en pivottabel i Excel 2010, kan du oprette et pivotdiagram for at vise sine sammendragsværdier grafisk. Du kan også formatere et pivotdiagram for at forbedre udseendet. Du kan bruge en af ​​de diagramtyper, der er tilgængelige med Excel, når du opretter et pivotdiagram. Opret et pivotdiagram Følg disse ...

Valg af editor

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Du kan flytte funktioner rundt på hovedsiden på dit Ning-netværk via siden Tilføj funktioner til dit netværk, ændrer layoutet, indtil det bare er det, du vil have. For at komme til denne side skal du klikke på linket Administrer i din navigation og derefter klikke på Funktioner under Dit netværk. Tilføj funktioner til dit netværk ...

Sådan vælger du et sprog med Ning Language Editor - dummies

Sådan vælger du et sprog med Ning Language Editor - dummies

Ning Language Editor er et af de mest kraftfulde værktøjer til din rådighed for at tilpasse dit netværk til det maksimale. Ning Language Editor hjælper dig med at lave din netværksgrænseflade (menuer, knapper, overskrifter, legender osv.), Og læs præcis som du vil have det til. Sprogeditoren giver dig mulighed for at vælge et bestemt sprog:

Hvordan man vælger et tema til dit Ning-netværk - dummies

Hvordan man vælger et tema til dit Ning-netværk - dummies

Du kan køre dit netværk på Ning uden at være en meget vellykket designer - og Ning's temaer lader dig få det til at ligne en million dollars! Folkene i Ning har taget godt af det og tilbyder dig mere end 50 flotte skabeloner (de kalder dem temaer), som du kan bruge med minimal indsats:

Valg af editor

Forstå kamphandlinger i rutefilter - dummier

Forstå kamphandlinger i rutefilter - dummier

De kamphandlinger, der er tilgængelige for rutefiltre, er identiske med dem, der er tilgængelige for andre routing politikker i Junos. Du kan acceptere ruter, afvise ruter, ændre attributter, der tilhører en rute, eller udføre flow kontrol type funktioner. Langt de mest almindelige handlinger, der skal bruges med rutefiltre, accepteres og afvises. Normalt vil du ...

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Vigtigheden af ​​at følge sikkerhedsprotokoller kan ikke være overvurderet. Hvis der ikke træffes passende forholdsregler, kan der opstå alvorlig skade for personale eller apparatet. Følg disse retningslinjer for at sikre din sikkerhed og beskytte enheden mod skade. Vær altid opmærksom og udøv god dømmekraft. Bemærk: Kun uddannet og kvalificeret personale skal installere enheden. Brug ...

Forstå matchtyper i rutefilter - dummies

Forstå matchtyper i rutefilter - dummies

Rutefilter matcher bestemte IP-adresser eller præfiksintervaller. I lighed med andre routingpolitikker indeholder de nogle matchkriterier og tilsvarende kamphandlinger. En vigtig forskel mellem rutefiltre og andre politiske matchforhold er, hvordan flere filtre håndteres. Hvis du har mere end en matchtilstand, behandles betingelserne som ...