Video: Data Warehouse Tutorial For Beginners | Data Warehouse Concepts | Data Warehousing | Edureka 2024
Replication middleware-tjenester kombinerer udvælgelse og udtræk, bevægelse og indlæsning fra en database til en eller flere andre, som normalt forvaltes af et enkelt DBMS-produkt. (Kildedatabasen og alle målene er alle Oracle, alle Sybase eller alle Microsoft SQL Server, for eksempel.)
Selv om replikationsservicefunktionerne varierer blandt DBMS-produkter, har de traditionelt været snapshot-oriented: Et øjebliksbillede af enten en hel database eller ændringerne siden den sidste replikation skete, udtrækkes på et forudbestemt tidspunkt fra kilden og kopieres over et netværksmiljø til de tilsigtede mål.
Dataene transmitteres derefter og indlæses som-er (ingen transformation forekommer). Mange databaseleverandører har implementeret deres replikation ved at læse logfilerne for ændringer. Denne replikeringstype er meget effektiv, fordi den ikke øger overhead af dine transaktionssystemer til at replikere dataene.
Men replikering erstatter ikke den lange liste over data warehousing middleware-tjenester. Du vil bruge replikering i et datalagringsmiljø først og fremmest, når du registrerer ændringer i kildedatabasen, ofte kaldet ændring af datafangst (CDC), eller efter at du har indlæst dataene i dit datalager og derefter ekstraheret data og sendt det til data marts, som vist i denne figur.
RDBMS-baserede replikeringstjenester registrerer ændringer i kildesystemet for at optimere dataudvælgelsen og udvindingsprocessen.