Video: Introduction to Amazon Web Services by Leo Zhadanovsky 2025
En almindelig misforståelse, som mange data warehouse aficionados holder, er, at det eneste gode datalager er et stort datalager - et enormt stort datalager. Mange mener endda, at medmindre de har noget astronomisk stort antal byte gemt, er det ikke rigtig et datalager.
"Fem hundrede gigabyte? Okay, det er et rigtigt datalager; Det ville imidlertid være et bedre datalager, hvis det mindst havde en terabyte (1 billioner bytes) data. Femogtyve gigabyte? Beklager, det er en data mart, ikke et datalager. ”
Størrelsen på et datalager er en karakteristik - næsten et biprodukt - af et datalager; det er ikke et mål. Ingen skal nogensinde sætte op med en mission om at "opbygge et 500 gigabyte datalager, der indeholder (hvad som helst). "
Følg disse trin for at bestemme den størrelse, du har brug for til dit datalager:
-
Bestem missionens eller forretningsmålene for datalageret.
Stil spørgsmålet, "Hvorfor generer du opbygningen af dette lager? ”
-
Bestem funktionaliteten , som du vil have datalageret til.
Find ud af, hvilke typer spørgsmål brugere vil spørge.
-
Bestem hvilke indhold (datatyper) datalageret skal understøtte dets funktionalitet.
Forstå hvilke typer svar dine brugere vil søge.
-
Bestem baseret på indholdsvolumenet (som er baseret på funktionaliteten, som igen er baseret på missionen), hvor stor du skal lave dit datalager.