Hjem Personlig finansiering MapReduces betydning i Hadoop - dummies

MapReduces betydning i Hadoop - dummies

Video: Kenneth Cukier: Big data is better data 2024

Video: Kenneth Cukier: Big data is better data 2024
Anonim

For det meste af Hadops historie har MapReduce været det eneste spil i byen, når det kommer til databehandling. Tilgængeligheden af ​​MapReduce har været årsagen til Hadops succes og samtidig en vigtig faktor i begrænsningen af ​​yderligere adoption.

MapReduce gør det muligt for dygtige programmører at skrive distribuerede applikationer uden at skulle bekymre sig om den underliggende distribuerede computerinfrastruktur. Dette er en meget stor aftale: Hadoop og MapReduce-rammen håndterer alle former for kompleksitet, som applikationsudviklere ikke behøver at håndtere.

For eksempel sker evnen til at gennemsøge klyngen gennemsigtigt ved at tilføje knuder og den automatiske fejloverførsel af både datalagring og databehandlingsundersystemer med nul virkning på applikationer.

Den anden side af mønten her er, at selv om MapReduce gemmer en enorm mængde kompleksitet, har du ikke råd til at glemme, hvad det er: en grænseflade til parallel programmering. Dette er en avanceret færdighed - og en barriere for bredere vedtagelse. Der er simpelthen ikke mange MapReduce programmører, og ikke alle har evnen til at mestre det.

I Hadops tidlige dage (Hadoop 1 og før) kunne du kun køre MapReduce-applikationer på dine klynger. I Hadoop 2 ændrede YARN-komponenten alt det ved at overtage ressourcehåndtering og planlægning fra MapReduce-rammen og levere en generisk grænseflade til at lette applikationer til at køre på en Hadoop-klynge.

Kort sagt betyder dette, at MapReduce nu kun er en af ​​mange applikationsrammer, du kan bruge til at udvikle og køre applikationer på Hadoop. Selvom det sikkert er muligt at køre applikationer ved hjælp af andre rammer på Hadoop, betyder det ikke, at vi kan begynde at glemme MapReduce.

MapReduce er i øjeblikket den eneste produktions-klare databehandlingsramme tilgængelig for Hadoop. Selvom andre rammer senere vil blive tilgængelige, har MapReduce næsten et decennium af modenhed under sit bælte (med næsten 4, 000 JIRA-problemer afsluttet, der involverer hundredvis af udviklere, hvis du holder styr på).

Der er ingen tvist: MapReduce er Hadops mest modne ramme for databehandling. Derudover er en betydelig mængde MapReduce-kode nu i brug, som ikke vil gå overalt snart. Lang historie kort: MapReduce er en vigtig del af Hadoop-historien.

Apache Hive og Apache Pig projekter er meget populære, fordi de er lettere adgangspunkter til databehandling på Hadoop. For mange problemer, især de typer, du kan løse med SQL, Hive og Pig er fremragende værktøjer.Men for en bredere opgave som statistisk behandling eller tekstudvinding, og især til behandling af ustrukturerede data, skal du bruge MapReduce.

MapReduces betydning i Hadoop - dummies

Valg af editor

Hvordan man laver en hurtig hundehus model i SketchUp - dummies

Hvordan man laver en hurtig hundehus model i SketchUp - dummies

Efter at du har installeret SketchUp er klar til at lave din første hurtige model. Følg disse trin for at opbygge et hundhus. På din computerskærm skal du se en række værktøjer på toppen af ​​dit modelvindue, en lille person og tre farvede modelleringsakser - røde, grønne og blå linjer.

Sådan gør du trapper i Google SketchUp 8 Brug af en kopieret profil - dummier

Sådan gør du trapper i Google SketchUp 8 Brug af en kopieret profil - dummier

Når du bygger En model i Google SketchUp, hvor man laver en trappe ved hjælp af en kopieret profil, er afhængig af at bruge Push / Pull til at oprette en 3D-formular fra et 2D-ansigt. I en nøddeskal tegner du profilen - sidebilledet, slags - af et enkelt trin, og kopier så mange trin som du har brug for, opret en ...

Hvordan man laver ekstruderede figurer i Google SketchUp 8 - dummies

Hvordan man laver ekstruderede figurer i Google SketchUp 8 - dummies

, Når man tilføjer ekstruderede former, som rynker og rækværk til dine Google SketchUp-modeller, bruger du værktøjet Follow Me. Meget af tiden, du vil bruge Follow Me til at skabe geometri (kanter og ansigter), der er knyttet til en anden del af din model. Når du bruger Følg mig til at ekstrudere et ansigt langs en ...

Valg af editor

Planlæg dit nye QuickBooks 2012-system - dummies

Planlæg dit nye QuickBooks 2012-system - dummies

Hvis du forstår et par store billedpunkter - hvad regnskab gør og hvad regnskabssystemer gør - fra starten vil du opdage, at QuickBooks 2012 Setup-processen giver en hel del mere mening. Hvilke regnskaber tænker på, hvad regnskab gør. Folk kan argumentere om de små detaljer, men de fleste ville ...

Principper for regnskabsføring for QuickBooks 2012 - dummies

Principper for regnskabsføring for QuickBooks 2012 - dummies

Regnskaber hviler på et ret lille sæt grundlæggende forudsætninger og principper, som du skal forstå, når du arbejder med QuickBooks 2012. Folk henviser ofte til disse grundlæggende principper som almindeligt anerkendte regnskabsprincipper. Regnskabsprincippet om indtægter Omsætningsprincippet, også kendt som realiseringsprincippet, hedder, at indtægterne er optjent, når salget er ...

QuickBooks 2006 Tastaturgenveje - dummies

QuickBooks 2006 Tastaturgenveje - dummies

Tastaturgenveje gør næsten enhver opgave hurtigere og nemmere. Følgende tabel viser de tastaturgenveje, du kan bruge i QuickBooks 2006. Tryk på denne pc genvej og QuickBooks Gør dette Ctrl + A Viser vinduet Diagram over konti Ctrl + C Kopierer dit valg til udklipsholderen Ctrl + F Viser Find-vinduet Ctrl + G Går til ...

Valg af editor

Hive CLI Client-dummies

Hive CLI Client-dummies

Den første Hive-klient er Hive-kommandolinjegrænsefladen (CLI). For at beherske de finere punkter i Hive CLI-klienten, kan det hjælpe med at gennemgå den (lidt travle) Hive-arkitektur. I den anden figur er arkitekturen strømlinet for kun at fokusere på de komponenter, der kræves, når du kører CLI. Disse er komponenterne ...

HBase Client Ecosystem - dummies

HBase Client Ecosystem - dummies

HBase er skrevet i Java, et elegant sprog til opbygning af distribuerede teknologier som HBase, men ansigt det - ikke alle, der ønsker at udnytte HBase-innovationer, er en Java-udvikler. Derfor er der et rigt HBase klientekosystem derude, hvis eneste formål er at gøre den store Java løft for dig og ...

MapReduces betydning i Hadoop - dummies

MapReduces betydning i Hadoop - dummies

For det meste af Hadops historie har MapReduce været det eneste spil i byen når det kommer til databehandling. Tilgængeligheden af ​​MapReduce har været årsagen til Hadops succes og samtidig en vigtig faktor i begrænsningen af ​​yderligere adoption. MapReduce gør det muligt for dygtige programmører at skrive distribuerede applikationer uden at skulle bekymre sig om ...