Hjem Personlig finansiering Navngiv datablokke med NameNode i HDFS - dummies

Navngiv datablokke med NameNode i HDFS - dummies

Indholdsfortegnelse:

Video: hadoop yarn architecture 2024

Video: hadoop yarn architecture 2024
Anonim

NameNode fungerer som adressebogen for Hadoop Distributed File System (HDFS), fordi den ikke ved kun hvilke blokke udgør enkelte filer, men også hvor hver af disse blokke og deres replikaer er gemt. Når en bruger gemmer en fil i HDFS, er filen opdelt i datablokke, og tre kopier af disse datablokke gemmes i slave noder i hele Hadoop-klyngen.

Det er mange datablokke, der holder styr på. Som du måske ville forvente, at vide, hvor legemerne er begravet, gør NameNode til en kritisk vigtig komponent i en Hadoop-klynge. Hvis NameNode ikke er tilgængeligt, kan programmer ikke få adgang til data, der er gemt i HDFS.

Hvis du kigger på nedenstående figur, kan du se NameNode-dæmonen køre på en master node-server. Alle kortlægningsoplysninger, der vedrører datablokkerne og deres tilsvarende filer, er gemt i en navngivet fil.

HDFS er et journaling-filsystem, hvilket betyder, at eventuelle dataændringer logges i en redigeringsjournal, der sporer begivenheder siden det sidste kontrolpunkt - sidste gang, hvor redigeringsloggen blev slået sammen. I HDFS opretholdes redigeringsjournalen i en fil med navnet, der er gemt på NameNode.

NavnNode opstart og drift

For at forstå, hvordan NameNode fungerer, er det nyttigt at se, hvordan det starter. Fordi formålet med NameNode er at informere applikationer om, hvor mange datablokker de skal behandle og for at holde styr på det nøjagtige sted, hvor de er gemt, har det brug for alle blokplaceringer og blok-til-fil-mappings, der er tilgængelige i VÆDDER.

Dette er de trin, som NameNode tager. For at indlæse alle de oplysninger, som NameNode har brug for, efter at den starter, sker følgende:

  1. NavnNoden indlæser filen i hukommelsen.

  2. NavnNoden indlæser filen og afspiller de journalerede ændringer for at opdatere de blokmetadata, der allerede er i hukommelsen.

  3. DataNode-dæmonerne sender NameNode-blokrapporterne.

    For hver slave node er der en blokrapport, der indeholder alle de datablokke, der er gemt der, og beskriver sundheden for hver enkelt.

Efter startprocessen er færdig, har NameNode et komplet billede af alle de data, der er gemt i HDFS, og det er klar til at modtage ansøgningsanmodninger fra Hadoop-klienter.

Da datafiler tilføjes og fjernes baseret på klientanmodninger, skrives ændringerne til slaveknutens diskmængder, der opdateres journalopdateringer til filen, og ændringerne afspejles i blokplaceringerne og metadata gemt i NameNode's hukommelse.

Gennem hele klyngens liv sender DataNode-dæmonerne NameNode-hjerteslagene (et hurtigt signal) hvert tredje sekund, hvilket indikerer at de er aktive.(Denne standardværdi kan konfigureres.) Hver 6. time (igen, en konfigurerbar standard) sender DataNodes NameNode en blokrapport, der beskriver hvilke filblokke der findes på deres noder. På denne måde har NameNode altid en oversigt over de tilgængelige ressourcer i klyngen.

Skrivning af data

For at oprette nye filer i HDFS skal følgende fremgangsmåde finde sted:

  1. Klienten sender en anmodning til NameNode for at oprette en ny fil.

    NameNode bestemmer, hvor mange blokke der er brug for, og klienten får en leasing for at oprette disse nye filblokke i klyngen. Som led i denne lejekontrakt har klienten en frist for at fuldføre oprettelsesopgaven. (Denne tidsfrist sikrer, at lagerplads ikke optages af mislykkede klientprogrammer.)

  2. Klienten skriver derefter de første kopier af filblokkene til slaveknyderne ved hjælp af den lejekontrakt, der er tildelt af NameNode.

    NameNode håndterer skriveforespørgsler og bestemmer, hvor filblokkene og deres replikaer skal skrives, balancere tilgængelighed og ydeevne. Den første kopi af en filblok er skrevet i et rack, og den anden og tredje kopi er skrevet på et andet rack end den første kopi, men i forskellige slavenoder i samme rack. Dette arrangement minimerer netværkstrafik, samtidig med at der sikres, at ingen datablokke er på samme fejlpunkt.

  3. Da hver blok er skrevet til HDFS, skriver en særlig proces de resterende replikaer til de andre slave noder identificeret af NameNode.

  4. Efter at DataNode-dæmonerne har erkendt, at filblok-replikerne er blevet oprettet, lukker klientprogrammet filen og meddeler NameNode, som lukker den åbne lease.

Læsning af data

For at læse filer fra HDFS skal følgende fremgangsmåde finde sted:

  1. Klienten sender en anmodning til NameNode for en fil.

    NameNode bestemmer hvilke blokke der er involveret og vælger, baseret på den samlede nærhed af blokkene til hinanden og til klienten, den mest effektive adgangsvej.

  2. Klienten får adgang til blokkene ved hjælp af adresserne givet af NameNode.

Balancering af data i Hadoop-klyngen

Over tid, med kombinationer af ujævne dataindtagingsmønstre (hvor nogle slave noder kan have flere data skrevet til dem) eller knudefejl, vil data sandsynligvis blive ujævnt fordelt på tværs af stativerne og slave noder i din Hadoop-klynge.

Denne ujævn fordeling kan have en skadelig indvirkning på ydeevnen, fordi efterspørgslen på individuelle slaveknude vil blive ubalanceret; noder med små data vil ikke blive fuldt ud brugt; og knuder med mange blokke vil blive overbrugt. ( Bemærk: Overbruget og underbruget er baseret på diskaktivitet, ikke på CPU eller RAM.)

HDFS indeholder et balancerværktøj til at omfordele blokke fra overbrugte slave noder til underudnyttede blokke på forskellige slave noder og stativer. Hadoop-administratorer bør regelmæssigt kontrollere HDFS-sundhed, og hvis data bliver ujævnt fordelt, skal de påberåbe sig balancerapporten.

NavnNode master server design

På grund af sin missionskritiske karakter har mesterserveren, der kører NameNode-dæmonen, brug for markant forskellige hardwarekrav end dem til en slaveknude. Mest væsentligt skal komponenter på virksomhedsniveau bruges til at minimere sandsynligheden for et brud. Du skal også have nok RAM til at indlæse alle metadata og positionsdata i hukommelsen om alle de datablokke, der er gemt i HDFS.

Navngiv datablokke med NameNode i HDFS - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...