Hjem Personlig finansiering NoSQL Data Stores versus Hadoop-dummies

NoSQL Data Stores versus Hadoop-dummies

Video: NoSQL and Hadoop for Solving Big Data #WhiteboardWalkthrough 2024

Video: NoSQL and Hadoop for Solving Big Data #WhiteboardWalkthrough 2024
Anonim

NoSQL-datalager oprindeligt abonnerede på forestillingen "Just Say No to SQL" (at omskrive fra en anti-stof reklamekampagne i 1980'erne), og de var en reaktion på de opfattede begrænsninger af (SQL-baserede) relationelle databaser. Det er ikke, at disse folk hadede SQL, men de var trætte af at tvinge firkantede pinde i runde huller ved at løse problemer, som relationelle databaser ikke var designet til.

En relationsdatabase er et kraftfuldt værktøj, men for nogle slags data (som nøgleværdipar eller grafer) og nogle anvendelsesmønstre (som ekstremt storskala opbevaring) er en relationsdatabase bare ikke ' t praktisk. Og når det kommer til opbevaring i store mængder, kan relationsdatabasen være dyrt, både hvad angår database licensomkostninger og hardwareomkostninger. (Relationsdatabaser er designet til at fungere med hardware i enterprise-grade.)

Så med NoSQL-bevægelsen udviklede kreative programmører snesevis af løsninger til forskellige slags tornede datalagrings- og behandlingsproblemer. Disse NoSQL databaser giver typisk massiv skalerbarhed ved hjælp af clustering, og er ofte designet til at muliggøre høj gennemløb og lav latenstid.

Navnet NoSQL er noget vildledende, fordi mange databaser, der passer til kategorien gør , har SQL-support (i stedet for "NoSQL" -support). Tænk på sit navn i stedet for som "Ikke kun SQL. ”

De NoSQL-tilbud, der er tilgængelige i dag, kan opdeles i fire forskellige kategorier, baseret på deres design og formål:

  • Nøgletal butikker: Dette tilbud giver en måde at lagre enhver form for af data uden at skulle bruge et skema. Dette er i modsætning til relationelle databaser, hvor du skal definere skemaet (bordstrukturen), inden der indsættes data. Da nøgletalbutikker ikke kræver et skema, har du stor fleksibilitet til at gemme data i mange formater.

    I en nøgleværdisbutik består en række simpelthen af ​​en nøgle (en identifikator) og en værdi, som kan være alt fra et helt tal til en stor binær datastreng. Mange implementeringer af nøgletalbutikker er baseret på Amazons Dynamo-papir.

  • Kolonnefamilieforretninger: Her har du databaser, hvor kolonner grupperes i kolonnefamilier og gemmes sammen på disk.

    Strengt taget er mange af disse databaser ikke kolonneorienterede, fordi de er baseret på Googles BigTable-papir, der lagrer data som et flerdimensionalt sorteret kort.

  • Dokumentbutikker: Dette tilbud er baseret på samlinger af tilsvarende kodede og formaterede dokumenter for at forbedre effektiviteten.Dokumentbutikker aktiverer individuelle dokumenter i en samling for kun at omfatte en delmængde af felter, så kun de data, der er nødvendige, er gemt. For sparsomme datasæt, hvor mange felter ofte ikke er befolket, kan dette oversætte til betydelige pladsbesparelser.

    Derimod optager tomme kolonner i relationelle database tabeller plads. Dokumentforretninger muliggør også skemafleksibilitet, fordi kun de felter, der er nødvendige, er gemt, og nye felter kan tilføjes. I modsætning til relationelle databaser er bordstrukturer defineret foran, inden dataene gemmes, og skiftende kolonner er en kedelig opgave, som påvirker hele datasættet.

  • Grafdatabaser: Her har du databaser, der gemmer grafstrukturer - repræsentationer der viser samlinger af enheder (hjørner eller knuder) og deres forhold (kanter) med hinanden. Disse strukturer gør det muligt for grafdatabaser at være særdeles velegnede til opbevaring af komplekse strukturer, som de sammenkædende relationer mellem alle kendte websider. (For eksempel er individuelle websider knuder, og kanterne, der forbinder dem, er links fra den ene side til den anden.)

    Google er selvfølgelig helt overgrafeteknologi og opfundet en grafbehandlingsmaskine, der hedder Pregel, for at drive sin PageRank algoritme. (Og ja, der er et hvidbog om Pregel.) I Hadoop-fællesskabet er der et Apache-projekt kaldet Giraph (baseret på Pregel-papiret), som er en grafbehandlingsmotor designet til at behandle grafer, der er gemt i HDFS.

De tilgængelige datalagrings- og behandlingsmuligheder i Hadoop er i mange tilfælde implementeringer af de NoSQL-kategorier, der er angivet her. Dette vil hjælpe dig med bedre at vurdere løsninger, der er tilgængelige for dig og se, hvordan Hadoop kan supplere traditionelle datalagre.

NoSQL Data Stores versus Hadoop-dummies

Valg af editor

GoPro HERO4 Silver Edition - dummies

GoPro HERO4 Silver Edition - dummies

HERO4 Silver er fyldt med funktioner, fanger 4K video og var den første GoPro kamera til at omfatte en søger. Mens det kan optage 4K-video, gør det det med 15 billeder pr. Sekund, hvilket er fantastisk til stadig eller langsomt motiverende emner, men ikke så godt, når de bevæger sig hurtigt. På HD-siden er dette ...

Hvorfor GoPro-kameraet er bedre end et videokamera - dummier

Hvorfor GoPro-kameraet er bedre end et videokamera - dummier

GoPro-kameraet ligner ikke en konventionelle videokamera, og det opfører sig heller ikke som en. Det ligner mere en lille firkantet kasse med en udragende linse end et elegant designet videokamera. Selvom du kan holde det som et traditionelt kamera, er det lige så effektivt (hvis ikke mere), når det er knyttet til noget. Her er ...

GoPro HERO Session - dummies

GoPro HERO Session - dummies

Det er ikke kun det mindste GoPro i lineupen, men det er også det mest uhyggelige. Nemt slidt eller monteret, giver HERO Session dig mulighed for at indspille imponerende video og billeder i de mindste rum. One-button-funktion gør det nemt at starte optagelsen, men den lille størrelse giver mindre kontrol på kameraet. Det er ikke noget problem, ...

Valg af editor

Gris latin i Hadops grise programmer - dummies

Gris latin i Hadops grise programmer - dummies

Gris latin er sproget for grise programmer. Pig oversætter Pig Latin script til MapReduce jobs, som det kan udføres i Hadoop cluster. Når man kom op med gris latin, fulgte udviklingsholdet tre centrale designprincipper: Hold det enkelt. Pig Latin giver en strømlinet metode til interaktion med Java MapReduce. Det er en ...

NoSQL Data Stores versus Hadoop-dummies

NoSQL Data Stores versus Hadoop-dummies

NoSQL data butikker oprindeligt abonnerede på forestillingen "Just Say No to SQL" ( at omskrive fra en reklamekampagne mod narkotika i 1980'erne), og de var en reaktion på de opfattede begrænsninger af (SQL-baserede) relationelle databaser. Det er ikke, at disse folk hadede SQL, men de var trætte af at tvinge firkantede pinde til runde huller af ...

Replikerende datablokke i Hadoop Distributed File System - dummies

Replikerende datablokke i Hadoop Distributed File System - dummies

Hadoop Distributed File System (HDFS) er designet til at gemme data om billig og mere upålidelig hardware. Billig har en attraktiv ring til det, men det rejser bekymringer om systemets pålidelighed som helhed, især for at sikre den høje tilgængelighed af dataene. Planlægningen i forvejen for katastrofe gjorde hjernerne bag HDFS ...

Valg af editor

Sådan indsættes figurer i Office 2011 til Mac - dummies

Sådan indsættes figurer i Office 2011 til Mac - dummies

I Office 2011 til Mac, medierne browser er hvor du kan finde et udvalg af former for at føje til dine dokumenter, workbooks og præsentationer. Du finder også de samme former på forskellige steder på båndet. Hver form kan tilpasses og formateres på endeløse måder, så du kan få det rigtige ...

Sådan gemmes som et skabelon i Office 2011 til Mac - dummies

Sådan gemmes som et skabelon i Office 2011 til Mac - dummies

, Når du åbner en skabelon i en Office 2011-applikation åbnes en kopi af skabelonen med et nyt filnavn, så selve skabelonfilen forbliver uændret. På den måde kan du genbruge skabelonen, når du har brug for det. Når du gemmer et dokument som en skabelon fra Word, Excel eller PowerPoint, skal dit dokument ...

Sådan gemmes en fil til OneDrive fra din iPad - dummies

Sådan gemmes en fil til OneDrive fra din iPad - dummies

Deling er omhyggelig, og du kan gemme en Word, Excel eller PowerPoint-fil på din iPad eller stationære computer direkte til en OneDrive-mappe. Når filen lander på OneDrive, kan andre, der har adgang til mappen på OneDrive, åbne filen. De kan åbne det i et kontor til iPad-applikationen, Office ...