Hjem Personlig finansiering Shuffle-fasen af ​​Hadoop's MapReduce Application Flow-dummies

Shuffle-fasen af ​​Hadoop's MapReduce Application Flow-dummies

Video: Didactische werkvormen - De eerste gedachte #18 2024

Video: Didactische werkvormen - De eerste gedachte #18 2024
Anonim

Efter kortfasen og før begyndelsen af ​​Reduce-fasen er en handoff-proces, kendt som shuffle og sortere . Her udarbejdes data fra mapperopgaverne og flyttes til noderne, hvor reduktionsopgaverne bliver kørt. Når mapper-opgaven er færdig, sorteres resultaterne efter nøgle, partitioneret, hvis der er flere reducere, og derefter skrevet til disk.

Du kan se dette koncept i følgende figur, som viser MapReduce-databehandlingsstrømmen og dets interaktion med Hadoop-klyngens fysiske komponenter. (En hurtig note: Data i hukommelsen er repræsenteret af hvide firkanter, og data gemt på disk er repræsenteret af grå firkanter.)

For at fremskynde den samlede MapReduce-proces flyttes dataene øjeblikkeligt til reduktionsopgaverens noder for at undgå en oversvømmelse af netværksaktivitet, når den endelige mapper-opgave afslutter sit arbejde. Denne overførsel sker, mens mapper-opgaven kører, da udgange for hver post - husk - gemmes i hukommelsen af ​​en ventende reduceringsopgave. (Du kan konfigurere om dette sker - eller ikke sker - og også antallet af involverede tråde.)

Husk, at selvom en reduktionsopgave måske har størstedelen af ​​mapper-opgavens output, kan reduktionsopgavens behandling ikke begynde, før alle mapperopgaver er færdige.

For at undgå scenarier, hvor udførelsen af ​​et MapReduce-job er hæmmet af en afbrydende mapper-opgave, der kører på en dårligt fungerende slave node, bruger MapReduce-rammen et koncept kaldet spekulativ udførelse .

Hvis nogle mapper opgaver kører langsommere end hvad der anses for rimeligt, vil Application Master udkoble duplikatopgaver (i Hadoop 1, JobTracker gør dette). Uanset hvilken opgave der er færdig først - duplikatet eller originalen - bliver resultaterne gemt på disk, og den anden opgave er dræbt. Hvis du overvåger dine job tæt og undrer dig over, hvorfor der er flere mapper opgaver, der løber, end du forventer, er dette en sandsynlig årsag.

Udgangen fra mapper-opgaver er ikke skrevet til HDFS, men snarere til lokal disk på slaveknuden, hvor mapper-opgaven blev kørt. Som sådan er det ikke replikeret på tværs af Hadoop-klyngen.

Bortset fra komprimering af output, kan du potentielt øge ydelsen ved at køre en combiner-opgave. Denne enkle taktik, der vises her, involverer en lokal reduktion af output for individuelle mapper opgaver.

I de fleste tilfælde er der ikke behov for ekstra programmering, da du kan fortælle systemet at bruge reduktionsfunktionen. Hvis du ikke bruger din reduceringsfunktion, skal du sikre dig, at combinerfunktionens output er identisk med reduktionsfunktionens funktion.

Det er op til MapReduce-rammen, om combinerfunktionen skal køres en gang, flere gange eller aldrig, så det er kritisk, at combinerens kode sikrer, at de endelige resultater ikke påvirkes af flere kørsler. At køre combiner kan give en præstationsfordel ved at mindske mængden af ​​mellemliggende data, som ellers skulle overføres over netværket.

Dette reducerer også mængden af ​​behandling, som reduktionsopgaverne skal gøre. Du løber en ekstra opgave her, så det er muligt, at enhver præstationsgevinst er ubetydelig eller måske endda resultere i dårligere overordnet præstation. Din kilometertal kan variere, så test det omhyggeligt.

Efter at alle resultaterne af mapperopgaverne er kopieret til reduceropgaverne, knyttes disse filer sammen og sorteres.

Shuffle-fasen af ​​Hadoop's MapReduce Application Flow-dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...