Video: 05 SQL Server 2016 Enterprise Information Management (EIM) 2025
Omkring 1995 begyndte sælgerne at placere deres software som virtuelle datalagringsværktøjer. Den grundlæggende forudsætning var, at det til tider ikke giver mening at kopiere og manipulere en masse data, bare hvis nogen har brug for det. Hvorfor ikke få adgang til data direkte fra kilden efter behov?
Desværre har adgang til data via et netværk ved dets kilde vist sig at være den mindst udfordrende for problemerne med at forsøge at levere en slags in-house datalagring. De samme udfordringer, der står over for ethvert datalagringsmiljø (som f.eks. Håndtering af datakvalitet, beslutter, hvilke typer transformationer der skal forekomme, og hvordan man håndterer disse transformationer, når forskellige kilder er inkonsekvente), er stadig til stede.
Bare fordi du kan komme til data ved sin kilde (i næsten enhver database eller filstruktur) betyder det ikke, at data giver den nødvendige forretningsinformation, når den er i dine hænder.
For at løse disse datakvalitetsproblemer er mange dataarkitekter begyndt at udføre bottom-up data mart-konstruktion for at udvikle et komponentbaseret datalager. I stedet for at have en enkelt database, hvor du indlæser alle data (oprettelse af dit datalager), håndterer en række komponenter hver især et bestemt sæt funktioner (f.eks. Besvarelse af specifikke forretningsspørgsmål) eller bestemte emner. Sammen omfatter disse data marts (eller komponenter) et datalagringsmiljø.
Denne komponentbaserede, dynamiske adgangsdataarkitektur er grundlaget for virtuel datalagring og mere specifikt, hvilke Enterprise Information Integration (EII) servere tilbyder markedet.
Denne figur viser et miljø, hvor individuelle komponenter oprettes inden for datalagringsmiljøet på en bottom-up måde. I stedet for at kombinere komponenterne i en stor database (og kopiere alle data igen) skaber EII et datalagringsmiljø, hvor brugere kan få adgang til hver komponents indhold fra et business intelligence-værktøj, som de alle blev gemt sammen, selvom de ikke er.
Tænk på, hvordan du bruger en webbrowser på skrivebordet. Du enten klikker på et link eller skriver en bestemt webadresse, og miljøet, der arbejder bag kulisserne, tager dig til det rigtige sted for det indhold, du bad om. Forestil dig nu, at internettet løber meget hurtigere.
Når du går til forskellige steder, har du ikke adgang til annoncer til det seneste firehjulstræk, du har spillet, sportsscorere, Dilbert-tegnefilm eller hvad som helst, det gør du på internettet.Du bringer data tilbage, som derefter kombineres og sendes tilbage til din browser. Det er virtuel datalagring - det er ligesom internettet!
Det er ikke en god ide at opbygge et virtuelt datalagringsmiljø for at få adgang til kildedata direkte i sit eget format. Din udfordring er ikke at finde ud af, hvordan du deltager i tværplatformsdatabaser (f.eks. Kombinering af IMS-data med DB2-data) og håndtering af disse typer af systemniveautransformation sikrer det, at kvaliteten af dataene er høj og ikke kræver brugeren skal manuelt rense dataene.
Hver applikation skal derfor være lageraktiveret og indeholde en dataudgiver, der er ansvarlig for alle middleware-tjenester (som udvinding og kvalitetssikring) som angivet i miljøets forretningsregler.
Dataudgiveren kunne tænkes at fungere næsten i realtidstilstand, ligesom den skulle gøre i en operationel datalager, eller den kunne fungere i en periodisk (batch-orienteret) tilstand, hvis øjeblikkelige opdateringer ikke er nødvendige. I denne situation er dataudgiveren et mini-middleware-produkt, der er indlejret i applikationen (eller en tjeneste, der er tilgængelig af applikationen).
Når du tænker på virtuel datalagring, skal du erstatte spørgsmålet "Kan jeg komme til dataene? "Med spørgsmålet" Kan jeg komme til brugbare data? "Dataudgiveren spiller en vigtig rolle, og bør ikke overses.
Du kan heller ikke forsømme dataarkitekturen. Bare fordi du udvikler komponenter i bunden, og de bliver adgang til på stedet, snarere end at blive kopieret til en større datalagerdatabase, betyder det ikke, at du kan forsømme denne funktion.
Sig, at en komponent gemmer kunde-id'er som femcifrede tal efter omdannelse, og kun kunder, der har købt inden for de seneste seks måneder. Og en anden komponent, som indeholder alle kunder, der nogensinde har købt virksomhedens produkter, bruger alfanumeriske identifikatorer med syv tegn. I denne situation kan du have den samme type af data mismatch problemer, du ville, hvis du havde adgang til data direkte fra kilderne.
Selvom EII muliggør forskelle mellem komponentindhold, skal du forstå og styre forskellene, så du ikke hindrer business intelligence mission.