Hjem Personlig finansiering MapReduce Application Flow i Hadoop - dummies

MapReduce Application Flow i Hadoop - dummies

Video: Hadoop MapReduce Data Flow | Hadoop Training Videos | Mr. Srinivas 2025

Video: Hadoop MapReduce Data Flow | Hadoop Training Videos | Mr. Srinivas 2025
Anonim

MapReduce er i sin kerne en programmeringsmodel til behandling af datasæt, der opbevares på en distribueret måde over en Hadoop-klynges slaveknude. Nøglekonceptet her er opdele og erobre. Specifikt vil du slå et stort datasæt i mange mindre stykker og behandle dem parallelt med den samme algoritme.

Med Hadoop Distributed File System (HDFS) er filerne allerede opdelt i bitformede stykker. MapReduce er, hvad du bruger til at behandle alle stykker.

MapReduce-applikationer har flere faser, som angivet i denne liste:

  1. Bestem de nøjagtige datasæt til at behandle fra datablokkerne. Dette indebærer beregning hvor de poster, der skal behandles, er placeret inden for datablokkerne.

  2. Kør den angivne algoritme mod hver post i datasættet, indtil alle registreringer er behandlet.

    Den enkelte forekomst af applikationen, der kører mod en data blok i et datasæt, kaldes en mapper opgave. (Dette er kortlægningsdelen af ​​MapReduce.)

  3. Udfør lokalt en foreløbig reduktion af output fra hver mapper.

    (Udgangene er foreløbigt kombineret, med andre ord.) Denne fase er valgfri, fordi det i nogle almindelige tilfælde ikke er ønskeligt.

  4. Baseret på partitioneringskrav grupperer du de relevante partitioner af data fra hver mappers resultatsæt.

  5. Kog resultatet sættene fra mapperne til et enkelt resultat sæt - Reducer del af MapReduce.

    En individuel forekomst af applikationen, der kører mod mapper-outputdata, kaldes en reduceringsopgave . (Så mærkeligt som det kan synes, da "Reducer" er en del af MapReduce-navnet, kan denne fase være valgfri; applikationer uden reducer er kendt som kort-kun job , hvilket kan være nyttigt, når der ikke er nogen skal kombinere resultatsætene fra kortopgaverne.)

MapReduce Application Flow i Hadoop - dummies

Valg af editor

Landskabsfoto - Sanibel Sentinel - Dummies

Landskabsfoto - Sanibel Sentinel - Dummies

Florida's Sanibel Island er en skattekiste for naturfotografen. Ding Darling Refuge er fuld af fugle og andet indfødt dyreliv. Et blusteri Januar dagen, solen synkende lavt; med de høje skyer så det ud som om solnedgangen ville være spektakulært. Dette billede blev fotograferet et par minutter efter solnedgangen. Kamera indstillinger ...

Landskabsfoto - Solnedgang i Paradis - Dummies

Landskabsfoto - Solnedgang i Paradis - Dummies

Dette landskabsbillede blev taget i Caspersen Beach i Venedig, Florida. Dette billede blev fotograferet om vinteren. Vinter i Florida er et hårdt arbejde, men nogen skal gøre det. Kameraindstillinger ISO-indstilling 100: Der var masser af lys, så fotografen gik med en lav ISO-indstilling. Eksponeringskompensation -1/3 EV: Underexposing solnedgange ...

Landskabsfoto - Tag den høje trail - dummies

Landskabsfoto - Tag den høje trail - dummies

Dette billede blev fotograferet i Myakka River State Park nær Sarasota, Florida. Parken er smuk med mange miles af stier. Denne sti slingrer gennem en frodig eng med prikker med dejlige træer. Solen synkende lavt og dejlige skyer var i himlen. Et polariserende filter blev føjet til linsen, mørkere bluesen ...

Valg af editor

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Excel 2013 gør det nemt at oprette en nyt pivottabel ved hjælp af en dataliste valgt i dit regneark med dets nye Quick Analysis-værktøj. For at forhåndsvise forskellige typer af pivottabeller, som Excel kan oprette til dig på stedet, bruger indtastningerne i en dataliste, som du har åbnet i en Excel ...

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Et problem, du kan løbe ind, når du importerer data til Excel, er at dine tekstetiketter måske ikke ser rigtigt ud. Du kan holde dine data rene med følgende tekstfunktioner. FIND-funktionen FIND-funktionen finder starttekstpositionen for en tekststreng i en anden tekststreng. For eksempel, hvis du ...

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Funktionerne DSTDEV og DSTDEVP i Excel beregner en standardafvigelse. DSTDEV beregner standardafvigelsen for en prøve. DSTDEVP beregner standardafvigelsen for en population. Som med andre databasestatistiske funktioner, er den unikke og virkelig nyttige funktion af DSTDEV og DSTDEVP, at du kan angive, at du kun vil have listeoptegnelser, der ...

Valg af editor

Basic Photoshop CS5-kommandoer - dummies

Basic Photoshop CS5-kommandoer - dummies

Bliver fortrolig med Photoshop CS5-programvinduet er en god måde at få din kuglelejer på. før du dyker ind i Photoshops værktøjer og kommandoer. Her er et par grundlæggende tips: Start Photoshop ved at klikke på Start-menuen eller et ikon på proceslinjen (Windows) eller klikke på Photoshop-ikonet på Dock (Mac). Du kan også ...

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop har flere filtre, som du kan bruge på stort set ethvert billede, der skal forbedres eller finesse det. De fleste billeder, for eksempel, drage fordel af mindst en smule skarphed for at forbedre detaljerne i billedet. I nogle tilfælde vil du reducere den synlige detalje i et billede på nogle områder til ...

Værktøjskasse Genveje i Photoshop 6 - dummier

Værktøjskasse Genveje i Photoshop 6 - dummier

For at hjælpe dig med at manipulere billeder, Photoshop 6 tilbyder en værktøjskasse med en hel masse nyttige værktøjer. Du klikker på Photoshop-ikonet og nogle gange en anden nøgle eller to for at få adgang til værktøjerne, der gør arbejde og afspilning med Photoshop 6 så sjovt. Nedenstående tabel viser værktøjskassebillederne og deres genvejstaster. Hvis du ...