Hjem Personlig finansiering Datablokke i Hadoop Distributed File System (HDFS) - dummier

Datablokke i Hadoop Distributed File System (HDFS) - dummier

Video: Bruk av datablokker (DB) i Simatic Step 7 2024

Video: Bruk av datablokker (DB) i Simatic Step 7 2024
Anonim

Når du gemmer en fil i HDFS, bryder systemet det ned i et sæt individuelle blokke og gemmer disse blokke i forskellige slave noder i Hadoop-klyngen. Dette er en helt normal ting at gøre, da alle filsystemer bryder filer ned i blokke, før de lagres til disk.

HDFS har ingen idé (og er ligeglad), hvad der er gemt inde i filen, så rå filer er ikke opdelt i overensstemmelse med regler, som vi mennesker ville forstå. Mennesker vil for eksempel have rekordgrænser - linjerne viser hvor en post begynder og slutter - for at blive respekteret.

HDFS er ofte lykkeligt uvidende om, at den endelige post i en blok kun kan være en delvis rekord, med resten af ​​indholdet shuntet ud til den følgende blok. HDFS vil kun sikre sig, at filerne er opdelt i lige store blokke, der matcher den foruddefinerede blokstørrelse for Hadoop-forekomsten (medmindre en brugerdefineret værdi blev indtastet for den fil, der lagres). I det foregående billede er denne blokstørrelse 128 MB.

Ikke alle filer, du skal gemme, er et nøjagtigt antal af systemets blokstørrelse, så den endelige datablok for en fil bruger kun så meget plads som nødvendigt. I tilfælde af det foregående billede er den endelige datablok 1MB.

Begrebet lagring af en fil som en samling af blokke er helt i overensstemmelse med, hvordan filsystemer normalt fungerer. Men hvad er forskelligt om HDFS er skalaen. En typisk blokstørrelse, som du vil se i et filsystem under Linux, er 4KB, mens en typisk blokstørrelse i Hadoop er 128 MB. Denne værdi kan konfigureres, og den kan tilpasses som både en ny systemstandard og en brugerdefineret værdi for individuelle filer.

Hadoop var designet til at gemme data på petabyte skalaen, hvor eventuelle potentielle begrænsninger til udskalering er minimeret. Den høje blokstørrelse er en direkte konsekvens af dette behov for at gemme data i massiv skala.

Først og fremmest har alle datablokke, der er gemt i HDFS, deres egne metadata og skal spores af en central server, så programmer, der behøver adgang til en bestemt fil, kan rettes til, hvor alle filens blokke er gemt. Hvis blokstørrelsen var i kilobyteområdet, ville selv beskedne datamængder i terabyte-skalaen overvælde metadata-serveren med for mange blokke til at spore.

For det andet er HDFS designet til at muliggøre høj gennemstrømning, så parallelbehandling af disse store datasæt sker så hurtigt som muligt. Nøglen til Hadops skalerbarhed på databehandlingssiden er og vil altid være parallelisme - evnen til at behandle de enkelte blokke af disse store filer parallelt.

For at muliggøre effektiv behandling skal der sikres en balance. På den ene side skal blokstørrelsen være stor nok til at berettige de ressourcer, der er dedikeret til en individuel databehandlingsenhed (f.eks. Et kort eller en reduceret opgave). På den anden side kan blokstørrelsen ikke være så stor, at systemet venter meget lang tid for en sidste databehandlingsenhed for at afslutte sit arbejde.

Disse to overvejelser afhænger naturligvis af, hvilke former for arbejde der udføres på datablokkerne.

Datablokke i Hadoop Distributed File System (HDFS) - dummier

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...