Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2025
Mens verdens store data og det traditionelle datalager krydser, er det usandsynligt, at de vil fusionere når som helst snart. Tænk på et datalager som et system for rekord for business intelligence, ligesom en CRM eller et regnskabssystem. Disse systemer er stærkt strukturerede og optimerede til specifikke formål. Desuden har disse rekordsystemer en tendens til at være meget centraliseret.
Diagrammet viser en typisk tilgang til datastrømme med varehuse og marts:
Organisationer vil uundgåeligt fortsætte med at bruge datalagre til at styre typen af strukturerede og operationelle data, der karakteriserer systemernes rekord. Disse data warehouses vil stadig give forretningsanalytikere mulighed for at analysere nøgledata, trends og så videre. Adventen af store data både udfordrer data warehouseens rolle og giver en komplementær tilgang.
Tænk på forholdet mellem datalagret og store data som fusionerer for at blive en hybridstruktur. I denne hybridmodel forbliver de stærkt strukturerede optimerede driftsdata i det tæt kontrollerede datalager, mens dataene, der er meget distribuerede og ændret i realtid, styres af en Hadoop-baseret (eller lignende NoSQL) infrastruktur.
Det er uundgåeligt, at operationelle og strukturerede data skal interagere i verden af store data, hvor informationskilderne ikke nødvendigvis er blevet renset eller profileret. Organisationer forstår i stigende grad, at de har et erhvervskrav til at kunne kombinere traditionelle datalagre med deres historiske forretningsdata kilder med mindre strukturerede og overvåget store datakilder. En hybrid tilgang til traditionelle og store datakilder kan bidrage til at nå disse forretningsmål.