Hjem Personlig finansiering MapReduce Programmeringsparamigm - dummier

MapReduce Programmeringsparamigm - dummier

Video: MapReduce - Computerphile 2025

Video: MapReduce - Computerphile 2025
Anonim

MapReduce er et programmeringsparadigme, der er designet til at tillade parallel distribueret behandling af store sæt af data, konvertere dem til sæt af tupler, og derefter kombinere og reducere disse tupler i mindre sæt tupler. I layman's vilkår blev MapReduce designet til at tage store data og bruge parallelt distribueret computing til at konvertere store data til små eller regelmæssige data.

Parallelt distribueret behandling refererer til en kraftfuld ramme, hvor massemængder af data behandles meget hurtigt ved at distribuere behandlingsopgaver på tværs af klynger af råvareservere. Med hensyn til MapReduce, tuples henvises til nøgleværdipar, hvorved data grupperes, sorteres og behandles.

MapReduce job arbejder via kort og reducerer procesoperationssekvenser på tværs af et distribueret sæt af servere. I kortopgave delegerer du dine data til nøgleværdipar, forvandler det og filtrerer det. Derefter tildeler du dataene til knuder til behandling.

I reducere opgaven samler du dataene ned i mindre datasæt. Data fra reduktionstrinnet omdannes til et standard nøgleværdiformat - hvor -tasten fungerer som registreringsidentifikatoren og -værdien er den værdi, der identificeres ved nøglen. Klyngernes computerknuder behandler kortet og reducerer opgaver, der er defineret af brugeren. Dette arbejde udføres i overensstemmelse med følgende to trin:

  1. Kort dataene.

    De indgående data skal først delegeres til nøgleværdipar og opdelt i fragmenter, der derefter tildeles kortopgaver. Hver computerklynge - en gruppe af noder, der er forbundet til hinanden og udfører en fælles computergruppe - tildeles en række kortopgaver, der efterfølgende fordeles mellem sine noder.

    Ved behandling af nøgleværdiparene genereres mellemliggende nøgleværdipar. De mellemliggende nøgleværdipar er sorteret efter deres nøgleværdier, og denne liste er opdelt i et nyt sæt af fragmenter. Uanset hvad du har for disse nye fragmenter, vil det være det samme som antallet af reducere opgaver.

  2. Reducer dataene.

    Hver reducere opgave har et fragment tildelt det. Den reducerede opgave behandler blot fragmentet og producerer en output, som også er et nøgleværdipar. Reducer opgaver er også fordelt mellem de forskellige knudepunkter. Når opgaven er afsluttet, skrives den endelige udgave på et filsystem.

Kort sagt kan du hurtigt og effektivt koge ned og begynde at give mening for et stort volumen, hastighed og forskellige data ved at bruge kort og reducere opgaver for at mærke dine data med (nøgle, værdi) par og reducere derefter disse par til mindre sæt data gennem aggregeringsoperationer - operationer, der kombinerer flere værdier fra et datasæt til en enkelt værdi.Et diagram af MapReduce arkitekturen findes her.

Hvis dine data ikke gør det muligt at blive mærket og behandlet via nøgler, værdier og aggregering, er kort og reduceret generelt ikke en god ide til dine behov.

Hvis du bruger MapReduce som en del af en Hadoop-løsning, skrives den endelige udgave på Hadoop Distributed File System (HDFS). HDFS er et filsystem, der omfatter klynger af råvareservere, der bruges til at gemme store data. HDFS gør stor databehandling og -lagring økonomisk gennemførlig ved at distribuere oplagringsopgaver på tværs af klynger af billige råvareservere.

MapReduce Programmeringsparamigm - dummier

Valg af editor

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvis du arbejder i Microsoft Excel 2010 og vil begynde at arbejde i en ny Excel-workbook-fil, kan du nemt oprette en ny projektmappe. For at gøre det kan du bruge en kommando på fanen Filer eller en tastaturgenvej. Klik på fanen Filer. Excel viser Backstage-visning, hvor du kan få adgang til filrelaterede kommandoer. ...

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

I Excel 2010 Opret brugerdefinerede ordbøger, der skal bruges, når du stavekontrollerer dine regneark. Du bruger knappen Tilføj til ordbog i dialogboksen Staveord til at tilføje ukendte ord til en brugerdefineret ordbog. Som standard tilføjer Excel disse ord til en brugerdefineret ordbog fil med navnet CUSTOM. DIC, men du kan oprette en ny brugerdefineret ...

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

, Når du opretter en pivottabel i Excel 2010, kan du oprette et pivotdiagram for at vise sine sammendragsværdier grafisk. Du kan også formatere et pivotdiagram for at forbedre udseendet. Du kan bruge en af ​​de diagramtyper, der er tilgængelige med Excel, når du opretter et pivotdiagram. Opret et pivotdiagram Følg disse ...

Valg af editor

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Du kan flytte funktioner rundt på hovedsiden på dit Ning-netværk via siden Tilføj funktioner til dit netværk, ændrer layoutet, indtil det bare er det, du vil have. For at komme til denne side skal du klikke på linket Administrer i din navigation og derefter klikke på Funktioner under Dit netværk. Tilføj funktioner til dit netværk ...

Sådan vælger du et sprog med Ning Language Editor - dummies

Sådan vælger du et sprog med Ning Language Editor - dummies

Ning Language Editor er et af de mest kraftfulde værktøjer til din rådighed for at tilpasse dit netværk til det maksimale. Ning Language Editor hjælper dig med at lave din netværksgrænseflade (menuer, knapper, overskrifter, legender osv.), Og læs præcis som du vil have det til. Sprogeditoren giver dig mulighed for at vælge et bestemt sprog:

Hvordan man vælger et tema til dit Ning-netværk - dummies

Hvordan man vælger et tema til dit Ning-netværk - dummies

Du kan køre dit netværk på Ning uden at være en meget vellykket designer - og Ning's temaer lader dig få det til at ligne en million dollars! Folkene i Ning har taget godt af det og tilbyder dig mere end 50 flotte skabeloner (de kalder dem temaer), som du kan bruge med minimal indsats:

Valg af editor

Forstå kamphandlinger i rutefilter - dummier

Forstå kamphandlinger i rutefilter - dummier

De kamphandlinger, der er tilgængelige for rutefiltre, er identiske med dem, der er tilgængelige for andre routing politikker i Junos. Du kan acceptere ruter, afvise ruter, ændre attributter, der tilhører en rute, eller udføre flow kontrol type funktioner. Langt de mest almindelige handlinger, der skal bruges med rutefiltre, accepteres og afvises. Normalt vil du ...

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Vigtigheden af ​​at følge sikkerhedsprotokoller kan ikke være overvurderet. Hvis der ikke træffes passende forholdsregler, kan der opstå alvorlig skade for personale eller apparatet. Følg disse retningslinjer for at sikre din sikkerhed og beskytte enheden mod skade. Vær altid opmærksom og udøv god dømmekraft. Bemærk: Kun uddannet og kvalificeret personale skal installere enheden. Brug ...

Forstå matchtyper i rutefilter - dummies

Forstå matchtyper i rutefilter - dummies

Rutefilter matcher bestemte IP-adresser eller præfiksintervaller. I lighed med andre routingpolitikker indeholder de nogle matchkriterier og tilsvarende kamphandlinger. En vigtig forskel mellem rutefiltre og andre politiske matchforhold er, hvordan flere filtre håndteres. Hvis du har mere end en matchtilstand, behandles betingelserne som ...