Hjem Personlig finansiering Kompaktioner i HBase-dummies

Kompaktioner i HBase-dummies

Video: Nintendo Switch Lite Unboxing! 2025

Video: Nintendo Switch Lite Unboxing! 2025
Anonim

Komprimering , processen, hvorved HBase rydder op efter sig selv, kommer i to varianter: større og mindre. Store komplikationer kan være en big deal, men først skal du forstå mindre komplikationer.

Mindre kompakanter kombinerer et konfigurerbart antal mindre HFiler i en større HFile. Du kan indstille antallet af HFiles til kompakt og hyppigheden af ​​en mindre komprimering. Mindre komplikationer er vigtige, fordi uden dem kan læsning af en bestemt række kræve, at mange diske læser og forårsager langsom overordnet ydeevne.

Figuren, som illustrerer hvordan dette koncept fungerer, kan hjælpe dig med at visualisere, hvordan følgende tabel kan vedblive på HDFS.

Logisk visning af kundekontaktoplysninger i HBase

Rækkefølge Kolonnefamilie: {Kolonnekvalificering: Version: Værdi}
00001 Kundenavn: {'FN':

1383859182496: ' John ',

' LN ': 1383859182858:' Smith ',

' MN ': 1383859183001:' Timothy ',

' MN ': 1383859182915:' T '}

KontaktInfo: {' EA ':

1383859183030:' John. Smith @ xyz. com ',

' SA ': 1383859183073:' 1 Hadoop Lane, NY

11111 '}

00002 Kundenavn: {' FN ':

1383859183103:' Jane ',

'LN': 1383859183163: 'Doe',

KontaktInfo: {

'SA': 1383859185577: '7 HBase Ave, CA

22222'}

Bemærk, hvordan kolonnen FamilyName-kolonne blev skrevet til HDFS med to MemStore-flusher, og hvordan dataene i ContactInfo-kolonnefamilien var vedvarende til disk med kun én MemStore-flush. Dette eksempel er hypotetisk, men det er et sandsynligt scenario afhængigt af tidens skrivning.

Billede et servicevirksomhed, der får flere og flere kundekontaktoplysninger over tid. Servicevirksomheden kan kende sin kundes for- og efternavn, men ikke lære om dens mellemnavn til timer eller uger senere i efterfølgende serviceanmodninger. Dette scenario vil medføre, at dele af række 00001 vedbliver ved HDFS i forskellige HFiles.

Indtil HBase-systemet udfører en mindre komprimering, vil læsning fra række 00001 kræve, at der læses tre disker for at hente det relevante HFile-indhold! Mindre komplikationer søger at minimere systemets overhead, samtidig med at antallet af HFiles styres. HBase-designere var særlig opmærksomme på at give HBase-administratoren så meget tuningkontrol som muligt for at få systemets indvirkning "mindre". "

Som navnet antyder, er en større komprimering forskellig fra perspektivet af en systempåvirkning. Komprimeringen er imidlertid ret vigtig for HBase systemets overordnede funktionalitet. En stor komprimering søger at kombinere alle HFiles i en stor HFile.

Derudover udfører en større komprimering oprydning efter at en bruger sletter en rekord. Når en bruger udsender et Slet opkald, placerer HBase-systemet en markør i nøgleværdiparret, så det kan fjernes permanent under den næste større komprimering.

Da store samlinger kombinerer alle HFiles i en stor HFile, er tiden også korrekt for systemet at gennemgå versionerne af dataene og sammenligne dem med TTL-ejendommen. Værdier ældre end TTL renses.

Tid til live henviser til variablen i HBase, du kan indstille for at definere, hvor lang tid data med flere versioner vil forblive i HBase.

Du har muligvis gættet, at en større komprimering påvirker systemets responstid betydeligt. Brugere, der forsøger at tilføje, hente eller manipulere data i systemet under en større komprimering, kan muligvis se dårlig systemrespons tid.

Hertil kommer, at HBase-klyngen måske skal opdele regioner samtidig med at en større komprimering finder sted og balancerer regionerne på tværs af alle RegionServers. Dette scenario vil resultere i en betydelig mængde netværkstrafik mellem RegionServers.

Derfor skal din HBase-administrator have en stor komprimeringsstrategi for din implementering.

Kompaktioner i HBase-dummies

Valg af editor

Financial Freedom Tilbydes af Bitcoin - Dummies

Financial Freedom Tilbydes af Bitcoin - Dummies

Bitcoin tilbyder sine brugere mange fordele, men måske er den vigtigste en hidtil uset niveau af frihed. Og denne frihed kommer på mange forskellige måder: finansiel frihed fra at være nødt til at stole på eksisterende infrastruktur, men også den mentale frihed til at være i kontrol med egne midler og teknologi. Flyt mod ...

Indsætte lydfiler i et PowerPoint Slide-dummies

Indsætte lydfiler i et PowerPoint Slide-dummies

For at afspille lyd i en PowerPoint 2007-præsentation, indsætter du en lydfil i et dias. Hvordan og når lyden høres, er op til dig. Du kan gøre lydfilen automatisk afspilning, når diaset vises eller begynder at afspille, når du klikker. Før du indsætter din lydfil på et dias, spørg ...

Er dit Excel Dashboard eller rapport nøjagtigt? - dummies

Er dit Excel Dashboard eller rapport nøjagtigt? - dummies

Intet dræber et Excel-dashboard eller rapporterer hurtigere end den opfattelse, at dens data er unøjagtige. Inden du sender dit færdige Excel dashboard eller rapport, skal du sørge for at kontrollere din rapporteringsmekanisme. Dit omdømme er på linjen! Her er tre faktorer, der fastslår, at et dashboard er korrekt: Overensstemmelse med autoritative ...

Valg af editor

Annoncer på Facebook - dummies

Annoncer på Facebook - dummies

Facebook er gratis for dig at bruge. I stedet for at opkræve sine brugere penge betaler Facebook regningerne ved at sælge annoncer. Disse annoncer vises derefter til dig. Så på en måde ser du på annoncer, hvordan du betaler for at bruge Facebook. Facebook har en række forskellige måder, hvorpå det vælger hvilke annoncer der skal ...

Automatisk fotoalbum på Facebook - dummies

Automatisk fotoalbum på Facebook - dummies

Det meste af tiden, hvor du laver et fotoalbum i Facebook, du bestemmer hvad du skal title det og hvilke fotos går ind i det. Der er nogle få undtagelser fra denne regel. Facebook samler visse typer billeder i album på dine vegne. Vigtigste, hver gang du ændrer dit profilbillede eller omslagsfoto, ...

Hvem kan se ting på din Facebook-tidslinje? - dummies

Hvem kan se ting på din Facebook-tidslinje? - dummies

Der er forskel på at tilføje ting til dit Facebook-tidslinje, som de foregående indstillinger kontrollerer, og blot kigger på dit tidslinje, som indstillingerne i dette afsnit styrer. Tre indstillinger her vedrører, hvad folk ser, når de ser på din profil. Gennemgå, hvad andre mennesker ser på din tidslinje. Dette er ikke så meget en indstilling ...

Valg af editor

Beskyt Excel-regneark og låseceller i Office 2011 til Mac-dummies

Beskyt Excel-regneark og låseceller i Office 2011 til Mac-dummies

, Når du laver formularer I Excel 2011 til Mac skifter du ofte regnearkbeskyttelse til og fra. Du skal slukke for regnearkbeskyttelse, når du vil opbygge en formular. Slukning af arkbeskyttelse gør det muligt at bruge formularkontrolerne på fanen Udvikler i båndet og giver dig mulighed for at redigere regnearket ...

Arbejder med Excel-arktyper i Office 2011 til Mac-dummies

Arbejder med Excel-arktyper i Office 2011 til Mac-dummies

Hvis du arbejder i Office 2011 til Mac, finder du, at Excel-ark kan være generelle eller dedikeret til et bestemt formål. Du behøver ikke være ekspert i Excel 2011 til Mac til at bruge de forskellige arktyper, men du bør kende deres navne og hver arktype formål. Du kan blande forskellige ...

Udfyldning af et formular med en grafik i Office 2011 til Mac - dummies

Udfyldning af et formular med en grafik i Office 2011 til Mac - dummies

I Office 2011 for Mac-programmer, former kan fyldes med et billede fra en fil eller fyldes med en af ​​flere teksturer fra en menu ved hjælp af fanen Billede eller tekstur i dialogboksen Formatformat. Mønstre er geometriske design, der bruger to farver, og de er tilgængelige fra fanen Mønster i ...