Video: Calculation Model (lite version) for Global Management Challenge 2025
Et datalager lite er en no-frills, bare-bone, low-tech tilgang til at levere data, der kan hjælpe med nogle af din forretningsbeslutning. No-frills betyder, at du sammen, hvor det er muligt, har beviser og værktøjer, der allerede findes i din organisation, for at opbygge dit system.
Områder og dataindhold i et datalager lite
En datalagerlite er fokuseret på rapportering eller analyse af kun ét eller muligvis to fagområder. Antag at i dit job på en trådløs division af et telefonselskab analyserer du salg af tjenester som f.eks. Netværksminuter, netværk uden for netværket, tekstbeskeder, internetadgang og anden mobilbrug til forbrugsholdninger.
Hvis du opbygger et datalager lite udelukkende til dette formål, har du alle de nødvendige oplysninger til at understøtte din analyse og rapportering til forbrugermarkedet. Du har dog ikke oplysninger om erhvervsbrugere og betalingshistorik, fordi disse oplysninger er en del af et andet emneområde, som vist i denne figur.
Baseret på emneområdets begrænsning har en datalagrings lite lige nok dataindhold til at tilfredsstille det primære formål med miljøet, men ikke nok til mange ustrukturerede scenarier, som brugerne kan oprette.
Du skal derfor vælge omhyggeligt blandt sæt af alle mulige dataelementer og vælge en håndterbar delmængde - elementer, der uden tvivl er vigtige at have. Denne proces er den samme for enhver implementering af data warehouse, bortset fra at du skal være ekstremt disciplineret, når du træffer beslutninger om, hvilket indhold der skal medtages.
Brug standardrapporter, især dem, der i øjeblikket kræver en stor manuel forberedelse, som en af dine primære guider til at bestemme dataindhold i et datalager lite.
Datakilder
Et datalager lite har et begrænset antal datakilder - typisk en til en håndfuld. Som en del af et samlet enkelt applikationsmiljø virker datalageret lite som omstruktureringsagenten for applikationens data for at gøre det mere forespørgsels- og rapportvenligt.
Det mest almindelige middel til at omstrukturere en enkelt applikations data er at deormalisere indholdet af applikationens relationelle database tabeller for at eliminere så mange relationelle tilslutningsoperationer (processen med at samle data fra mere end en database tabel) som muligt, når brugere kører rapporter eller gør simpel forespørgsel.
Denormalisering er modsat af relational database konceptet normalisering, et noget komplekst sæt retningslinjer, der fortæller dig, hvilke dataelementer der skal være i hvilke tabeller i en database.
Når du denormaliserer en database, bekymrer du dig ikke om duplikeret data; Du forsøger at oprette rækker af data i et enkelt bord, der sandsynligvis afspejler rapporter og forespørgsler, som brugerne kører. Denne figur viser et eksempel på et enkeltkildedata lagerhus bygget på denormalisering.
Selv om du kan bruge eksternt tilvejebragte data i en datalager-implementering, er de data du bruger sjældent nyligt erhvervet. Du er mere tilbøjelige til at indarbejde data, som du allerede bruger til analyse (måske på en selvstændig måde).
Business Intelligence Tools
Brugerne af et datalager ligner normalt spørgsmål og opretter rapporter, der afspejler et "Fortæl mig hvad der skete" perspektiv. Fordi disse brugere ikke gør meget tungt analytisk behandling, skal de produkter, de bruger til at få adgang til datalageret, være let for dem at bruge.
Dataudvinding, bevægelse og indlæsning
Enkelhed er navnet på spillet i et datalager lite. Gør derfor processen med at udvinde data fra kilder og udføre alle de funktioner, der er nødvendige for at forberede dataene til at blive lastet så let som muligt ved at bruge disse to elementer:
-
Simple filekstrakter fra driftssystemerne og filoverførsler, der overfører giver dig mulighed for at flytte data fra sine kilder til datalagret lite
-
Retfærdig brugerdefineret kode (eller måske et brugervenligt værktøj), der kan udpakke og flytte dataene
Hvis datakilden til dit datalagringssted er bygget på en relationsdatabase, og du planlægger at bruge det samme databaseprodukt til dit datalager, skal du bruge SQL til nemt at håndtere dataudvinding og bevægelse. Disse trin - som vist i figuren - giver en standardprocedure til denne proces (du vil selvfølgelig tilpasse disse trin til dit eget miljø):
-
På det system, der huser dit lager, skal du bruge SQL CREATE TABLE erklæring for at oprette definitionen for hver tabel i dit datalager lite.
-
Opret en database backup , der indeholder kopier af alle tabeller fra den kilde, der leverer data til lageret, og derefter genindlæs disse tabeller i et mellemrum på systemet, hvor du planlægger at lokalisere dit datalager.
Du bør sikre, at netværkets båndbredde og tidsvindue er tilstrækkelige til at kopiere alle kildetabeller til systemet ved hjælp af et filoverførselsprogram.
-
Brug SQL INSERT-sætningen med en indlejret SELECT-sætning med angivelse af kildetabellerne og deres respektive kolonner, der vil fylde data warehouse-tabellen (og hvordan tabellerne vil blive sluttet) for at indlæse dataene i din datalagring lite.
-
Kør en række kvalitetssikringsrutiner (QA) for at kontrollere, at alle data er blevet indlæst korrekt.
Kontrollér række rækker, numeriske totaler og alt andet du kan.
Arkitektur
Arkitekturen i en datalagring lite består af den database, der bruges til at gemme dataene, de forreste forretningsinformationsværktøjer, der bruges til at få adgang til dataene, måden dataene flyttes på, og antallet af emner områder.Krydsordet for dette miljø er minimalistisk: ingen klokker, ingen fløjter, ikke noget fancy - lige nok teknologi anvendt til miljøet for at give brugerne adgang til de data, de har brug for.
Arkitekturen i et datalagerhus, som vist i denne figur, indeholder disse hovedkomponenttyper:
-
En enkelt database indeholder lagerets data.
-
Denne database bliver fodret direkte fra hver af de kilder, der leverer data til lageret.
-
Brugere får adgang til data direkte fra lageret.