Hjem Personlig finansiering Master nodes i Hadoop Clusters - dummies

Master nodes i Hadoop Clusters - dummies

Indholdsfortegnelse:

Video: Hadoop Multi Node Cluster Setup | Hadoop Installation | Hadoop Administration Tutorial | Edureka 2025

Video: Hadoop Multi Node Cluster Setup | Hadoop Installation | Hadoop Administration Tutorial | Edureka 2025
Anonim

Masterknuderne i distribuerede Hadoop-klynger er vært for de forskellige lagrings- og behandlingsstyringstjenester, der er beskrevet i denne liste, for hele Hadoop-klyngen. Redundans er afgørende for at undgå enkelte punkter med fejl, så du kan se to kontakter og tre master noder.

  • NavnNode: Styrer HDFS-lagring. For at sikre høj tilgængelighed har du både en aktiv NameNode og en standby NavnNode. Hver kører på egen hånd, dedikeret master node.

  • Checkpoint node (eller backup node): Tilbyder checkpointing tjenester til NameNode. Dette indebærer at læse NameNode's redigeringslogfil for ændringer i filer i HDFS (nye, slettede og vedhæftede filer) siden det sidste kontrolpunkt og anvende dem til NameNode's hovedfil, der kortlægger filer til datablokke.

    Derudover opretholder Backup Node en kopi af filsystemnavnet i hukommelsen og holder det synkroniseret med tilstanden til NameNode. Ved brug af højtilgængelige implementeringer må du ikke bruge en checkpunktknude eller backupknude - brug en Standby NameNode i stedet. Ud over at være et aktivt standby til NameNode opretholder Standby NameNode checkpoint-tjenesterne og holder en opdateret kopi af filsystemnavnet i hukommelsen.

  • JournalNode: Modtager redigeringslogfodifikationer, der angiver ændringer i filer i HDFS fra NameNode. Mindst tre JournalNode-tjenester (og det er altid et ulige antal) skal køre i en klynge, og de er lette nok til, at de kan samles med andre tjenester på masterknuderne.

  • Resource Manager: Overvåger planlægningen af ​​applikationsopgaver og styring af Hadoop-klyngens ressourcer. Denne tjeneste er hjertet af Garn.

  • JobTracker: For Hadoop 1-servere, håndteres cluster ressource management og planlægning. Med YARN er JobTracker forældet og bruges ikke. En række Hadoop-implementeringer har stadig ikke migreret til Hadoop 2 og YARN.

  • HMaster: Overvåger HBase-regionens servere og håndterer alle metadataændringer. For at sikre høj tilgængelighed skal du sørge for at bruge et andet HMaster-eksempel. HMaster-tjenesten er let nok til at være colocated med andre tjenester på master noder. I Hadoop 1 kører forekomster af HMaster-tjenesten på master nodes. I Hadoop 2, med Hoya (HBase on Garn), løber HMaster-forekomster i beholdere på slave noder.

  • Zookeeper: Koordinerer distribuerede komponenter og giver mekanismer til at holde dem i synkronisering. Zookeeper bruges til at registrere fejlen i NameNode og vælge en ny NameNode.Det bruges også med HBase til at styre HMaster og RegionServers 'stater.

    Som med JournalNode har du brug for mindst tre forekomster af Zookeeper-noder (og altid et ulige antal), og de er lette nok til at være colocated med andre tjenester på master nodene.

Her har du tre master noder (med samme hardware), hvor nøgletjenesterne Active NameNode, Standby NameNode og Resource Manager hver har deres egen server. Der er også JournalNode og Zookeeper-tjenester, der kører på hver server, men de er lette og vil ikke være en kilde til ressourceforvanskning med NameNode og Resource Manager-tjenesterne.

Principperne er de samme for Hadoop 1, hvor du har brug for en dedikeret masterknude til NameNode, Secondary NameNode og JobTracker-tjenester.

Hvis du planlægger at bruge HBase med Hoya i Hadoop 2, behøver du ikke yderligere tjenester. For Hadoop 1-implementeringer ved hjælp af HBase, tjek følgende figur for udbredelsen af ​​tjenester på Hadoop-klyngens hovedknudepunkter.

Der er to forskelle, når man sammenligner disse master-servere med Hadoop 1-mesterservere uden HBase-support: her har du brug for to HMaster-tjenester (en til at koordinere HBase og en til at fungere som standby) og Zookeeper-tjenester på alle tre master noder at håndtere failover.

Hvis du kun vil bruge din Hadoop 1-klynge til HBase, kan du undvære JobTracker-tjenesten, da HBase ikke er afhængig af Hadoop 1 MapReduce-infrastrukturen.

Når folk taler om hardware til Hadoop, lægger de generelt vægt på brugen af ​​ vare komponenter - de billige. Fordi du skal plunke ned for kun nogle få master noder (typisk tre eller fire), bliver du ikke ramt af at multiplicere omkostninger, hvis du for eksempel vælger at bruge dyre harddiske.

Husk på, at der ikke er nogen Hadoop-klynge uden hovedknudepunkter. Master noder tjener en missionskritisk funktion, og selv om du har brug for redundans, bør du designe dem med høj tilgængelighed og elasticitet i tankerne.

Anbefalet opbevaring

For Hadoop master noder, uanset antallet af slave noder eller anvendelser af klyngen, er lagringsegenskaberne konsistente. Brug fire 900 GB SAS drev, sammen med en RAID HDD controller konfigureret til RAID 1 + 0. SAS-drev er dyrere end SATA-drev og har lavere lagerkapacitet, men de er hurtigere og meget mere pålidelige.

Implementering af dine SAS-drev som et RAID-array sikrer, at Hadoop-styringstjenesterne har en overflødig butik for deres missionskritiske data. Dette giver dig tilstrækkelig stabil, hurtig og overflødig opbevaring til at understøtte styringen af ​​din Hadoop-klynge.

Anbefalede processorer

På tidspunktet for denne skrivning anbefaler de fleste referencearkitekturer at bruge bundkort med to CPU-stik, hver med seks eller otte kerner. Intel Ivy Bridge arkitekturen er almindeligt anvendt.

Anbefalet hukommelse

Hukommelseskravene varierer betydeligt afhængigt af omfanget af en Hadoop-klynge.Hukommelse er en kritisk faktor for Hadoop-masterknudepunkter, fordi de aktive og standby-navne-navne-servere er stærkt afhængige af RAM til at styre HDFS. Som sådan skal du bruge fejlkorrigerende hukommelse (ECC) til Hadoop-masterknudepunkter. Masternoder har typisk brug for mellem 64 GB og 128 GB RAM.

NameNode-hukommelseskravet er en direkte funktion af antallet af filblokke, der er gemt i HDFS. Normalt bruger NameNode ca. 1 GB RAM pr. Million HDFS-blokke. (Husk at filer er opdelt i enkelte blokke og replikeret, så du har tre kopier af hver blok.)

Hukommelseskravene til Resource Manager, HMaster, Zookeeper og JournalNode-servere er betydeligt mindre end for NameNode-serveren. Det er dog god praksis at dimensionere hovedknudepunkterne på en ensartet måde, så de kan udskiftes i tilfælde af hardwarefejl.

Anbefalet netværk

Hurtig kommunikation er afgørende for tjenesterne på master nodes, så vi anbefaler at bruge et par bundne 10GbE forbindelser. Dette bundne par giver redundans, men fordobler også gennemgangen til 20GbE. For mindre klynger (for eksempel mindre end 50 noder) kan du komme væk med at bruge 1 GbE-stik.

Master nodes i Hadoop Clusters - dummies

Valg af editor

Landskabsfoto - Sanibel Sentinel - Dummies

Landskabsfoto - Sanibel Sentinel - Dummies

Florida's Sanibel Island er en skattekiste for naturfotografen. Ding Darling Refuge er fuld af fugle og andet indfødt dyreliv. Et blusteri Januar dagen, solen synkende lavt; med de høje skyer så det ud som om solnedgangen ville være spektakulært. Dette billede blev fotograferet et par minutter efter solnedgangen. Kamera indstillinger ...

Landskabsfoto - Solnedgang i Paradis - Dummies

Landskabsfoto - Solnedgang i Paradis - Dummies

Dette landskabsbillede blev taget i Caspersen Beach i Venedig, Florida. Dette billede blev fotograferet om vinteren. Vinter i Florida er et hårdt arbejde, men nogen skal gøre det. Kameraindstillinger ISO-indstilling 100: Der var masser af lys, så fotografen gik med en lav ISO-indstilling. Eksponeringskompensation -1/3 EV: Underexposing solnedgange ...

Landskabsfoto - Tag den høje trail - dummies

Landskabsfoto - Tag den høje trail - dummies

Dette billede blev fotograferet i Myakka River State Park nær Sarasota, Florida. Parken er smuk med mange miles af stier. Denne sti slingrer gennem en frodig eng med prikker med dejlige træer. Solen synkende lavt og dejlige skyer var i himlen. Et polariserende filter blev føjet til linsen, mørkere bluesen ...

Valg af editor

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Excel 2013 gør det nemt at oprette en nyt pivottabel ved hjælp af en dataliste valgt i dit regneark med dets nye Quick Analysis-værktøj. For at forhåndsvise forskellige typer af pivottabeller, som Excel kan oprette til dig på stedet, bruger indtastningerne i en dataliste, som du har åbnet i en Excel ...

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Et problem, du kan løbe ind, når du importerer data til Excel, er at dine tekstetiketter måske ikke ser rigtigt ud. Du kan holde dine data rene med følgende tekstfunktioner. FIND-funktionen FIND-funktionen finder starttekstpositionen for en tekststreng i en anden tekststreng. For eksempel, hvis du ...

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Funktionerne DSTDEV og DSTDEVP i Excel beregner en standardafvigelse. DSTDEV beregner standardafvigelsen for en prøve. DSTDEVP beregner standardafvigelsen for en population. Som med andre databasestatistiske funktioner, er den unikke og virkelig nyttige funktion af DSTDEV og DSTDEVP, at du kan angive, at du kun vil have listeoptegnelser, der ...

Valg af editor

Basic Photoshop CS5-kommandoer - dummies

Basic Photoshop CS5-kommandoer - dummies

Bliver fortrolig med Photoshop CS5-programvinduet er en god måde at få din kuglelejer på. før du dyker ind i Photoshops værktøjer og kommandoer. Her er et par grundlæggende tips: Start Photoshop ved at klikke på Start-menuen eller et ikon på proceslinjen (Windows) eller klikke på Photoshop-ikonet på Dock (Mac). Du kan også ...

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop har flere filtre, som du kan bruge på stort set ethvert billede, der skal forbedres eller finesse det. De fleste billeder, for eksempel, drage fordel af mindst en smule skarphed for at forbedre detaljerne i billedet. I nogle tilfælde vil du reducere den synlige detalje i et billede på nogle områder til ...

Værktøjskasse Genveje i Photoshop 6 - dummier

Værktøjskasse Genveje i Photoshop 6 - dummier

For at hjælpe dig med at manipulere billeder, Photoshop 6 tilbyder en værktøjskasse med en hel masse nyttige værktøjer. Du klikker på Photoshop-ikonet og nogle gange en anden nøgle eller to for at få adgang til værktøjerne, der gør arbejde og afspilning med Photoshop 6 så sjovt. Nedenstående tabel viser værktøjskassebillederne og deres genvejstaster. Hvis du ...