Hjem Personlig finansiering Hvordan man optimerer MapReduce-opgaver - dummies

Hvordan man optimerer MapReduce-opgaver - dummies

Indholdsfortegnelse:

Video: Bildæk: Optimer dit dæktryk, spar penge, og kør sikkert. Se guiden her! 2024

Video: Bildæk: Optimer dit dæktryk, spar penge, og kør sikkert. Se guiden her! 2024
Anonim

Bortset fra at optimere den aktuelle applikationskode med MapReduce til store dataprojekter, kan du bruge nogle optimeringsteknikker til forbedring af pålidelighed og ydeevne. De falder i tre kategorier: hardware / netværkstopologi, synkronisering og filsystem.

Stor datahjælp / netværkstopologi

Uafhængigt af applikationen vil den hurtigste hardware og netværk sandsynligvis give de hurtigste runde gange for din software. En klar fordel ved MapReduce er evnen til at køre på billige klynger af råvarehardware og standardnetværk. Hvis du ikke er opmærksom på, hvor dine servere er fysisk organiserede, får du ikke den bedste ydelse og høj grad af fejltolerance, der er nødvendige for at understøtte store dataopgaver.

Commodity-hardware opbevares ofte i racks i datacenteret. Nærheden af ​​hardwaren i racket giver en præstationsfordel i modsætning til at flytte data og / eller kode fra rack til rack. Under implementeringen kan du konfigurere din MapReduce-motor til at være opmærksom på og drage fordel af denne nærhed.

Ved at holde dataene og koden sammen er en af ​​de bedste optimeringer til MapReduce-ydeevne. I virkeligheden jo tættere hardwareforarbejdningselementerne er til hinanden, jo mindre latens skal du håndtere.

Stor datasynkronisering

Da det er ineffektivt at holde alle resultaterne af din kortlægning i noden, kopierer synkroniseringsmekanismerne kortlægningsresultaterne til de reducerende noder, umiddelbart efter at de er afsluttet, så at behandling kan begynde med det samme. Alle værdier fra samme nøgle sendes til samme reducer, hvilket igen sikrer højere ydelse og bedre effektivitet.

Reduktionsudgange skrives direkte til filsystemet, så det skal konstrueres og indstilles til de bedste resultater.

Stort datafilsystem

Din MapReduce-implementering understøttes af et distribueret filsystem. Den største forskel mellem lokale og distribuerede filsystemer er kapacitet. For at håndtere de enorme mængder information i en stor datafil, skal filsystemer spredes på tværs af flere maskiner eller noder i et netværk.

MapReduce implementeringer er afhængige af en master-slave distributionsform, hvor hovednoden lagrer alle metadata, adgangsrettigheder, kortlægning og placering af filer og blokke osv. Slaverne er knuder, hvor de faktiske data er gemt. Alle anmodninger går til mesteren og håndteres derefter af den relevante slave node.Som du overvejer filsystemets design, bør du overveje følgende:

  • Hold det varmt: Som du måske regner med, kan master node blive overarbejde, fordi alt begynder der. Hvis masternoden fejler, er hele filsystemet utilgængeligt, indtil masteren er gendannet. En meget vigtig optimering er at skabe en "varm standby" masterknude, der kan komme i brug, hvis der opstår et problem med online master.

  • Jo større jo bedre: Filstørrelse er også en vigtig overvejelse. Masser af små filer (mindre end 100 MB) bør undgås. Distribuerede filsystemer, der understøtter MapReduce-motorer, virker bedst, når de er befolket med et beskedent antal store filer.

  • Den lange visning: Fordi arbejdsbelastninger forvaltes i batcher, er meget vedholdende netværksbåndbredde vigtigere end hurtige udførelsestider for mappere eller reduktionsanordninger. Den optimale tilgang er, at koden strømmer masser af data, når den læser og igen, når det er tid til at skrive til filsystemet.

  • Hold det sikkert: Men ikke overdrevent det. Tilføjelse af sikkerhedslag på det distribuerede filsystem vil nedbryde dets ydeevne. Filtilladelserne er der for at beskytte mod utilsigtede konsekvenser, ikke skadelig adfærd. Den bedste fremgangsmåde er at sikre, at kun autoriserede brugere har adgang til datacentermiljøet og for at holde det distribuerede filsystem beskyttet udefra.

Hvordan man optimerer MapReduce-opgaver - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...