Indholdsfortegnelse:
- Store databaser: RDBMS og vedvarende data
- Store databaser: RDBMS og tabeller
- PostgreSQL, en open source relationel database
Video: Entity Relationship Diagram (ERD) Tutorial - Part 1 2024
Store data bliver et vigtigt element i, hvordan organisationer udnytter data i høj volumen til den rigtige hastighed for at løse specifikke data problemer. Relationelle Database Management Systems er vigtige for dette høje volumen. Store data lever ikke isoleret. For at være effektive skal virksomheder ofte kombinere resultaterne af stor dataanalyse med de data, der findes inden for virksomheden.
Store databaser: RDBMS og vedvarende data
En af de vigtigste tjenester, der leveres af operationelle databaser (også kaldet datalager ), er vedholdenhed. Persistens garanterer, at de data, der er gemt i en database, ikke vil blive ændret uden tilladelser, og at den vil blive tilgængelig, så længe det er vigtigt for virksomheden. Hvilken god er en database, hvis den ikke kan stole på at beskytte de data, du lægger i det?
I betragtning af dette vigtige krav skal du da tænke over, hvilken type data du vil fortsætte, hvordan kan du få adgang til og opdatere den, og hvordan kan du bruge den til at træffe forretningsbeslutninger. På dette mest grundlæggende niveau er valget af dine databasemotorer afgørende for din samlede succes med din store dataimplementering.
Selv om den underliggende teknologi har eksisteret i nogen tid, er mange af disse systemer i drift i dag, fordi de virksomheder, de støtter, er stærkt afhængige af dataene. At erstatte dem ville være beslægtet med at ændre motorerne på et fly på en transoceanisk flyvning.
Store databaser: RDBMS og tabeller
Relationsdatabaser er bygget på et eller flere relationer og er repræsenteret af tabeller. Disse tabeller er defineret af deres kolonner, og dataene gemmes i rækkerne. Den primære nøgle er ofte den første kolonne i tabellen. Databasens konsistens og meget af dens værdi opnås ved at "normalisere" dataene. Normaliserede data er konverteret fra indfødt format til et delt, aftalt format.
For eksempel i en database kan du have "telefon" som XXX-XXX-XXXX, mens i en anden kan det være XXXXXXXXX. For at opnå en konsekvent visning af oplysningerne skal feltet normaliseres til en anden form. Der findes fem niveauer af standarder for normalisering. Valget af normal form er ofte henvist til databasedesigneren. Samlingen af tabeller, nøgler, elementer og så videre er kendt som databasen skema.
I løbet af årene har det strukturerede forespørgselssprog (SQL) udviklet sig i låsesteg med RDBMS-teknologi og er den mest anvendte mekanisme til oprettelse, forespørgsel, vedligeholdelse og drift af relationsdatabaser.
I virksomheder, både små og store, er de fleste af deres vigtige operationelle oplysninger sandsynligvis opbevaret i RDBMS'er. Mange virksomheder har forskellige RDBMS'er til forskellige områder af deres forretning. Transaktionsdata kan lagres i en leverandørs database, mens kundeoplysninger kan gemmes i en anden.
Det er ikke sandsynligt, at du vil bruge RDBMS'er til kernen i implementeringen, men du bliver nødt til at stole på de data, der er gemt i RDBMS'er, for at skabe det højeste niveau af værdi for virksomheden med store data.
PostgreSQL, en open source relationel database
Under din store dataimplementation vil du sandsynligvis komme på tværs af PostgreSQL, en udbredt, open source relationel database. Flere faktorer bidrager til populariteten af PostgreSQL. Som RDBMS med understøttelse af SQL-standarden gør det alle de ting, der forventes i et databaseprodukt, plus dets levetid og bred brug har gjort det "kamptestet. "Det er også tilgængeligt på næsten alle forskellige operativsystemer, fra pc'er til mainframes.
At give det grundlæggende og gøre det pålideligt er kun en del af historien. PostgreSQL understøtter også mange funktioner, der kun findes i dyre proprietære RDBMS'er, herunder følgende:
-
Mulighed for direkte at håndtere "objekter" i relationskemaet
-
Udenlandske nøgler (henvisningsnøgler fra en tabel til en anden)
-
Udløsere brugt til automatisk at starte en gemt procedure)
-
Komplekse forespørgsler (underforespørgsler og tilknytning til diskrete tabeller)
-
Transaktionel integritet
-
Multiversion samtidighedskontrol
PostgreSQL's reelle styrke er dens udvidelsesmuligheder. Brugere og databaseprogrammerere kan tilføje nye funktioner uden at påvirke databasens grundlæggende drift eller pålidelighed. Mulige udvidelser omfatter
-
Datatyper
-
Operatører
-
Funktioner
-
Indekseringsmetoder
-
Procedurelle sprog
Dette høje niveau af tilpasning gør PostgreSQL ønskeligt, når stive, proprietære produkter ikke vil få jobbet færdigt. Det er uendeligt udvideligt.
Endelig tillader PostgreSQL-licensen ændring og distribution i enhver form, åben eller lukket kilde. Eventuelle ændringer kan holdes private eller deles med fællesskabet, som du ønsker.