Video: Hadoop HDFS vs Spectrum Scale (GPFS) 2025
Ofte i Hadops børnefølge var en stor del af diskussionen centreret om NameNodes repræsentation af et enkelt fejlfelt. Hadoop har generelt haft en robust og svigt tolerant arkitektur med undtagelse af dette nøgleområde. Uden NameNode er der ingen Hadoop-klynge.
Brug Hadoop 2, du kan konfigurere HDFS, så der er et Aktivt navnNode og et Standby NameNode. Standby NameNode skal være på en dedikeret masterknude, der er konfigureret identisk til hovednoden, der bruges af Active NameNode.
Standby NameNode sidder ikke idiotisk, mens NameNode håndterer alle anmodninger om blokadresse. Standby NameNode, der er opført med opgaven med at holde tilstanden for blokplaceringerne og blokere metadata i hukommelsen, håndterer HDFS-kontrolpunktsansvar.
Den Active NameNode skriver journalposter på filændringer til hovedparten af JournalNode-tjenesterne, som kører på master nodene. ( Bemærk: HDFS-højtilgængeløsningen kræver mindst tre masterknudepunkter, og hvis der er flere, kan der kun være et ulige antal.)
Hvis en fejl opstår, læser Standby Node først alle udfyldte journalposter (hvor et flertal af Journal Noder har en post med andre ord) for at sikre, at det nye Active NameNode er helt i overensstemmelse med klyngens tilstand.
Zookeeper bruges til at overvåge Active NameNode og håndtere failover logistik, hvis Active NameNode bliver utilgængelig. Både Active og Standby NameNodes har dedikerede Zookeeper Failover Controllers (ZFC), der udfører overvågnings- og failover-opgaverne. I tilfælde af en fejl informerer ZFC Zookeeper-forekomsterne på klyngen, som derefter vælger et nyt Active NameNode.
Apache Zookeeper tilbyder koordinerings- og konfigurationstjenester for distribuerede systemer, så det er ikke underligt, vi ser det bruges overalt i Hadoop.