Hjem Personlig finansiering Butik Big Data med HBase dummies

Butik Big Data med HBase dummies

Video: Databases & Data Warehouses, Data: Structures, Types, Integrations 2025

Video: Databases & Data Warehouses, Data: Structures, Types, Integrations 2025
Anonim

HBase er en distribueret, ikke-relativ (kolonnebaseret) database, der udnytter HDFS som sin persistensbutik til store dataprojekter. Den er modelleret efter Google BigTable og kan hoste meget store tabeller (milliarder af kolonner / rækker), fordi den er lagdelt på Hadoop-klynger af råvarehardware.

HBase giver tilfældig, realtid læse / skrive adgang til store data. HBase er meget konfigurerbar, hvilket giver stor fleksibilitet til at håndtere store mængder data effektivt. Tag et kig på, hvordan HBase kan hjælpe med at løse dine store dataudfordringer.

HBase er en kolonne database, så alle data er gemt i tabeller med rækker og kolonner, der ligner relational database management systems (RDBMSs). Krydset mellem en række og en kolonne kaldes en celle. En vigtig forskel mellem HBase-tabeller og RDBMS-tabeller er versionering.

Hver celleværdi indeholder en "version" -attribut, som ikke er mere end en tidsstempel, der identificerer cellen særskilt. Versioning tracks ændrer sig i cellen og gør det muligt at hente en hvilken som helst version af indholdet, hvis det bliver nødvendigt. HBase gemmer dataene i celler i faldende rækkefølge (ved hjælp af tidsstempel), så en læsning finder altid de nyeste værdier først.

Kolonner i HBase tilhører en kolonnefamilie. Kolonnefamilienavnet bruges som præfiks for at identificere medlemmer af sin familie. For eksempel er frugt: æble og frugt: banan medlemmer af frugtkolonnefamilien. HBase implementeringer er indstillet på kolonnefamilieniveau, så det er vigtigt at være opmærksom på, hvordan du får adgang til dataene og hvor stort du forventer, at kolonnerne skal være.

Rækkerne i HBase-tabeller har også en nøgle forbundet med dem. Nøglens struktur er meget fleksibel. Det kan være en beregnet værdi, en streng eller endda en anden datastruktur. Nøglen bruges til at styre adgangen til cellerne i rækken, og de gemmes i rækkefølge fra lav værdi til høj værdi.

Alle disse funktioner udgør sammen skemaet. Skemaet er defineret og oprettet, før data kan gemmes. Alligevel kan tabeller ændres, og nye kolonnefamilier kan tilføjes, efter at databasen er i gang. Denne udvidelsesmulighed er yderst nyttig, når du beskæftiger dig med store data, fordi du ikke altid kender til mangfoldigheden af ​​dine datastrømme.

Butik Big Data med HBase dummies

Valg af editor

Microsoft Project 2010 Genvejstaster - dummies

Microsoft Project 2010 Genvejstaster - dummies

Microsoft Project 2010 maksimerer effektiviteten, når du administrerer projekter - men også genvejstaster i Project 2010 din tid på tastaturet: Her er nogle genvejstaster, du vil bruge hele tiden, når du bygger og arbejder med en projektplan. Indtastning af tastetryk Indsæt Indsætter ny opgave Ctrl + K Indsætter hyperlink F7 Starter stavekontrol Alt + F10 Tildeler ressourcer ...

Hvordan man ændrer gridlines i Project 2016 - dummies

Hvordan man ændrer gridlines i Project 2016 - dummies

Flere visninger i Project 2016 inkluderer gridlines for at angive visse elementer, f.eks. en pause mellem uger eller status dato (det vil sige den dato, hvor der er sporet fremskridt på et projekt). Disse linjer hjælper en person med at læse planen for at skelne mellem tidsintervaller eller brud på information; For eksempel kan netlinjer være ...

Projekt 2016 AutoFilter-funktion - dummier

Projekt 2016 AutoFilter-funktion - dummier

Projekt 2016 AutoFilter-funktionen er som standard tændt for alle nye tidsplanfiler. Pile vises i kolonneoverskrifterne i det viste ark. Når du klikker på pilen i kolonnen Ressourcenavne, er navnet på hver ressource, der er tildelt opgaver i projektet, angivet i alfabetisk rækkefølge sammen med ...

Valg af editor

Netværksadministration: Windows Command Omdirigering og piping - dummies

Netværksadministration: Windows Command Omdirigering og piping - dummies

Omdirigering og piping af Windows-kommandoer er relaterede teknikker. Omdirigering giver dig mulighed for at angive en alternativ destination for output, der vil blive vist med en kommando eller en alternativ kilde til input, der skal indtastes i en kommando. Du kan f.eks. Gemme resultaterne af en kommando ipconfig / all til en fil ved navn myconfig. txt ...

Netværksadministration: VPN Security - dummies

Netværksadministration: VPN Security - dummies

Udtrykket tunnel er nogle gange brugt til at beskrive en VPN, fordi VPN'en skaber en sikker tunnel mellem to steder, som kun kan indtastes fra begge ender. De data, der bevæger sig gennem tunnelen fra den ene ende til den anden, er sikre, så længe det er inden for tunnelen - det vil sige inden for ...

Netværksadministration: Windows Miljøvariabler - dummies

Netværksadministration: Windows Miljøvariabler - dummies

Windows-kommandoskallen giver flere miljøvariabler til kommandoer. Miljøvariabler begynder og slutter med procent tegn. Du kan bruge en miljøvariabel overalt i en kommando. For eksempel viser C:> echo% OS%, der kører på% PROCESSOR_IDENTIFIER% en linje som denne: Windows_NT kører på en x86 Familie 15 Model 2 Stepping 8, ...

Valg af editor

Sådan bruger du arv i PHP med objektorienteret programmering - dummier

Sådan bruger du arv i PHP med objektorienteret programmering - dummier

Objektorienteret programmering i PHP har en anden funktion, der gør det meget nyttigt til store projekter. Mange objekter er relateret til hinanden, og du kan bruge et familietræforhold til at forenkle din programmering. Hvordan man bygger en critter baseret på en anden critter Der er en ny critter i byen. Denne har den samme grundlæggende ...

Sådan bruges PHP til at lave en switch til HTML5 og CSS3 Programmering - dummies

Sådan bruges PHP til at lave en switch til HTML5 og CSS3 Programmering - dummies

Du kører ofte over en situation i HTML5 og CSS3 programmering, hvor du har et udtryk, der kan have mange mulige værdier. Du kan altid bruge strukturen til at klare denne situation, men PHP leverer en anden interessant mulighed. Koden til dette program anvender omskifterstrukturen. Tag et kig på, hvordan det er gjort: