Hjem Personlig finansiering Navngiv datablokke med NameNode i HDFS - dummies

Navngiv datablokke med NameNode i HDFS - dummies

Indholdsfortegnelse:

Video: hadoop yarn architecture 2025

Video: hadoop yarn architecture 2025
Anonim

NameNode fungerer som adressebogen for Hadoop Distributed File System (HDFS), fordi den ikke ved kun hvilke blokke udgør enkelte filer, men også hvor hver af disse blokke og deres replikaer er gemt. Når en bruger gemmer en fil i HDFS, er filen opdelt i datablokke, og tre kopier af disse datablokke gemmes i slave noder i hele Hadoop-klyngen.

Det er mange datablokke, der holder styr på. Som du måske ville forvente, at vide, hvor legemerne er begravet, gør NameNode til en kritisk vigtig komponent i en Hadoop-klynge. Hvis NameNode ikke er tilgængeligt, kan programmer ikke få adgang til data, der er gemt i HDFS.

Hvis du kigger på nedenstående figur, kan du se NameNode-dæmonen køre på en master node-server. Alle kortlægningsoplysninger, der vedrører datablokkerne og deres tilsvarende filer, er gemt i en navngivet fil.

HDFS er et journaling-filsystem, hvilket betyder, at eventuelle dataændringer logges i en redigeringsjournal, der sporer begivenheder siden det sidste kontrolpunkt - sidste gang, hvor redigeringsloggen blev slået sammen. I HDFS opretholdes redigeringsjournalen i en fil med navnet, der er gemt på NameNode.

NavnNode opstart og drift

For at forstå, hvordan NameNode fungerer, er det nyttigt at se, hvordan det starter. Fordi formålet med NameNode er at informere applikationer om, hvor mange datablokker de skal behandle og for at holde styr på det nøjagtige sted, hvor de er gemt, har det brug for alle blokplaceringer og blok-til-fil-mappings, der er tilgængelige i VÆDDER.

Dette er de trin, som NameNode tager. For at indlæse alle de oplysninger, som NameNode har brug for, efter at den starter, sker følgende:

  1. NavnNoden indlæser filen i hukommelsen.

  2. NavnNoden indlæser filen og afspiller de journalerede ændringer for at opdatere de blokmetadata, der allerede er i hukommelsen.

  3. DataNode-dæmonerne sender NameNode-blokrapporterne.

    For hver slave node er der en blokrapport, der indeholder alle de datablokke, der er gemt der, og beskriver sundheden for hver enkelt.

Efter startprocessen er færdig, har NameNode et komplet billede af alle de data, der er gemt i HDFS, og det er klar til at modtage ansøgningsanmodninger fra Hadoop-klienter.

Da datafiler tilføjes og fjernes baseret på klientanmodninger, skrives ændringerne til slaveknutens diskmængder, der opdateres journalopdateringer til filen, og ændringerne afspejles i blokplaceringerne og metadata gemt i NameNode's hukommelse.

Gennem hele klyngens liv sender DataNode-dæmonerne NameNode-hjerteslagene (et hurtigt signal) hvert tredje sekund, hvilket indikerer at de er aktive.(Denne standardværdi kan konfigureres.) Hver 6. time (igen, en konfigurerbar standard) sender DataNodes NameNode en blokrapport, der beskriver hvilke filblokke der findes på deres noder. På denne måde har NameNode altid en oversigt over de tilgængelige ressourcer i klyngen.

Skrivning af data

For at oprette nye filer i HDFS skal følgende fremgangsmåde finde sted:

  1. Klienten sender en anmodning til NameNode for at oprette en ny fil.

    NameNode bestemmer, hvor mange blokke der er brug for, og klienten får en leasing for at oprette disse nye filblokke i klyngen. Som led i denne lejekontrakt har klienten en frist for at fuldføre oprettelsesopgaven. (Denne tidsfrist sikrer, at lagerplads ikke optages af mislykkede klientprogrammer.)

  2. Klienten skriver derefter de første kopier af filblokkene til slaveknyderne ved hjælp af den lejekontrakt, der er tildelt af NameNode.

    NameNode håndterer skriveforespørgsler og bestemmer, hvor filblokkene og deres replikaer skal skrives, balancere tilgængelighed og ydeevne. Den første kopi af en filblok er skrevet i et rack, og den anden og tredje kopi er skrevet på et andet rack end den første kopi, men i forskellige slavenoder i samme rack. Dette arrangement minimerer netværkstrafik, samtidig med at der sikres, at ingen datablokke er på samme fejlpunkt.

  3. Da hver blok er skrevet til HDFS, skriver en særlig proces de resterende replikaer til de andre slave noder identificeret af NameNode.

  4. Efter at DataNode-dæmonerne har erkendt, at filblok-replikerne er blevet oprettet, lukker klientprogrammet filen og meddeler NameNode, som lukker den åbne lease.

Læsning af data

For at læse filer fra HDFS skal følgende fremgangsmåde finde sted:

  1. Klienten sender en anmodning til NameNode for en fil.

    NameNode bestemmer hvilke blokke der er involveret og vælger, baseret på den samlede nærhed af blokkene til hinanden og til klienten, den mest effektive adgangsvej.

  2. Klienten får adgang til blokkene ved hjælp af adresserne givet af NameNode.

Balancering af data i Hadoop-klyngen

Over tid, med kombinationer af ujævne dataindtagingsmønstre (hvor nogle slave noder kan have flere data skrevet til dem) eller knudefejl, vil data sandsynligvis blive ujævnt fordelt på tværs af stativerne og slave noder i din Hadoop-klynge.

Denne ujævn fordeling kan have en skadelig indvirkning på ydeevnen, fordi efterspørgslen på individuelle slaveknude vil blive ubalanceret; noder med små data vil ikke blive fuldt ud brugt; og knuder med mange blokke vil blive overbrugt. ( Bemærk: Overbruget og underbruget er baseret på diskaktivitet, ikke på CPU eller RAM.)

HDFS indeholder et balancerværktøj til at omfordele blokke fra overbrugte slave noder til underudnyttede blokke på forskellige slave noder og stativer. Hadoop-administratorer bør regelmæssigt kontrollere HDFS-sundhed, og hvis data bliver ujævnt fordelt, skal de påberåbe sig balancerapporten.

NavnNode master server design

På grund af sin missionskritiske karakter har mesterserveren, der kører NameNode-dæmonen, brug for markant forskellige hardwarekrav end dem til en slaveknude. Mest væsentligt skal komponenter på virksomhedsniveau bruges til at minimere sandsynligheden for et brud. Du skal også have nok RAM til at indlæse alle metadata og positionsdata i hukommelsen om alle de datablokke, der er gemt i HDFS.

Navngiv datablokke med NameNode i HDFS - dummies

Valg af editor

Landskabsfoto - Sanibel Sentinel - Dummies

Landskabsfoto - Sanibel Sentinel - Dummies

Florida's Sanibel Island er en skattekiste for naturfotografen. Ding Darling Refuge er fuld af fugle og andet indfødt dyreliv. Et blusteri Januar dagen, solen synkende lavt; med de høje skyer så det ud som om solnedgangen ville være spektakulært. Dette billede blev fotograferet et par minutter efter solnedgangen. Kamera indstillinger ...

Landskabsfoto - Solnedgang i Paradis - Dummies

Landskabsfoto - Solnedgang i Paradis - Dummies

Dette landskabsbillede blev taget i Caspersen Beach i Venedig, Florida. Dette billede blev fotograferet om vinteren. Vinter i Florida er et hårdt arbejde, men nogen skal gøre det. Kameraindstillinger ISO-indstilling 100: Der var masser af lys, så fotografen gik med en lav ISO-indstilling. Eksponeringskompensation -1/3 EV: Underexposing solnedgange ...

Landskabsfoto - Tag den høje trail - dummies

Landskabsfoto - Tag den høje trail - dummies

Dette billede blev fotograferet i Myakka River State Park nær Sarasota, Florida. Parken er smuk med mange miles af stier. Denne sti slingrer gennem en frodig eng med prikker med dejlige træer. Solen synkende lavt og dejlige skyer var i himlen. Et polariserende filter blev føjet til linsen, mørkere bluesen ...

Valg af editor

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Excel 2013 gør det nemt at oprette en nyt pivottabel ved hjælp af en dataliste valgt i dit regneark med dets nye Quick Analysis-værktøj. For at forhåndsvise forskellige typer af pivottabeller, som Excel kan oprette til dig på stedet, bruger indtastningerne i en dataliste, som du har åbnet i en Excel ...

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Et problem, du kan løbe ind, når du importerer data til Excel, er at dine tekstetiketter måske ikke ser rigtigt ud. Du kan holde dine data rene med følgende tekstfunktioner. FIND-funktionen FIND-funktionen finder starttekstpositionen for en tekststreng i en anden tekststreng. For eksempel, hvis du ...

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Funktionerne DSTDEV og DSTDEVP i Excel beregner en standardafvigelse. DSTDEV beregner standardafvigelsen for en prøve. DSTDEVP beregner standardafvigelsen for en population. Som med andre databasestatistiske funktioner, er den unikke og virkelig nyttige funktion af DSTDEV og DSTDEVP, at du kan angive, at du kun vil have listeoptegnelser, der ...

Valg af editor

Basic Photoshop CS5-kommandoer - dummies

Basic Photoshop CS5-kommandoer - dummies

Bliver fortrolig med Photoshop CS5-programvinduet er en god måde at få din kuglelejer på. før du dyker ind i Photoshops værktøjer og kommandoer. Her er et par grundlæggende tips: Start Photoshop ved at klikke på Start-menuen eller et ikon på proceslinjen (Windows) eller klikke på Photoshop-ikonet på Dock (Mac). Du kan også ...

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop har flere filtre, som du kan bruge på stort set ethvert billede, der skal forbedres eller finesse det. De fleste billeder, for eksempel, drage fordel af mindst en smule skarphed for at forbedre detaljerne i billedet. I nogle tilfælde vil du reducere den synlige detalje i et billede på nogle områder til ...

Værktøjskasse Genveje i Photoshop 6 - dummier

Værktøjskasse Genveje i Photoshop 6 - dummier

For at hjælpe dig med at manipulere billeder, Photoshop 6 tilbyder en værktøjskasse med en hel masse nyttige værktøjer. Du klikker på Photoshop-ikonet og nogle gange en anden nøgle eller to for at få adgang til værktøjerne, der gør arbejde og afspilning med Photoshop 6 så sjovt. Nedenstående tabel viser værktøjskassebillederne og deres genvejstaster. Hvis du ...