Hjem Personlig finansiering Sammenligning af Hadoop-distributioner - dummier

Sammenligning af Hadoop-distributioner - dummier

Video: PHP Tutorials | PHP For Beginners 2025

Video: PHP Tutorials | PHP For Beginners 2025
Anonim

Du finder, at Hadoop økosystemet har mange komponenter, som alle eksisterer som deres egne Apache-projekter. Fordi Hadoop er vokset betydeligt og står over for nogle betydelige yderligere ændringer, er forskellige versioner af disse komponenter i open source-fællesskabet måske ikke fuldt kompatible med andre komponenter. Dette giver betydelige vanskeligheder for folk, der ønsker at få en uafhængig start med Hadoop ved at downloade og kompilere projekter direkte fra Apache.

Red Hat er for mange mennesker en model for, hvordan man med held kan tjene penge på open source software-markedet. Hvad Red Hat har gjort er at tage Linux (et open source-operativsystem), bundle alle de nødvendige komponenter, bygge et simpelt installationsprogram og yde betalt support til alle kunder.

På samme måde som Red Hat har leveret en praktisk emballage til Linux, har en række virksomheder bragt Hadoop og nogle relaterede teknologier sammen i deres egne Hadoop-distributioner. Denne liste beskriver de mere fremtrædende:

  • Cloudera : Kanskje den mest kendte spiller i feltet, Cloudera kan hævde Doug Cutting, Hadops medstifter, som sin øverste arkitekt. Cloudera ses af mange mennesker som markedsleder i Hadoop-rummet, fordi det udgav den første kommercielle Hadoop-distribution og er en yderst aktiv bidragyder af kode til Hadoop-økosystemet.

    Cloudera Enterprise, et produkt placeret af Cloudera i centrum af det, det kalder "Enterprise Data Hub", omfatter Cloudera Distribution for Hadoop (CDH), en open source-baseret distribution af Hadoop og dets relaterede projekter som dens proprietære Cloudera Manager. Også inkluderet er et teknisk support abonnement for CDH's kerne komponenter.

    Clouderaers primære forretningsmodel har længe været baseret på dets evne til at udnytte sin populære CDH-distribution og levere betalte tjenester og support. I efteråret 2013 meddelte Cloudera formelt, at det fokuserer på at tilføje proprietære værditilsatte komponenter oven på open source Hadoop til at fungere som differentiator.

    Cloudera har også gjort det til en almindelig praksis at accelerere vedtagelsen af ​​alfa- og beta-niveau open source-kode til de nyere Hadoop-udgivelser. Dens tilgang er at tage komponenter, som den anser for at være modne og eftermontere dem i de eksisterende produktions-ready open source-biblioteker, der er inkluderet i dens distribution.

  • EMC : Pivotal HD, Apache Hadoop-distributionen fra EMC integrerer native EMC's massivt parallelle databehandlingsteknologi (tidligere kendt som Greenplum, og nu kendt som HAWQ) med Apache Hadoop.Resultatet er en højtydende Hadoop-distribution med ægte SQL-behandling for Hadoop. SQL-baserede forespørgsler og andre business intelligence værktøjer kan bruges til at analysere data, der er gemt i HDFS.

  • Hortonworks : En anden stor aktør på Hadoop-markedet, Hortonworks har det største antal kommittere og kode bidragsydere til Hadoop økosystemkomponenter. (Kommitterne er portvagter af Apache-projekter og har beføjelse til at godkende kodeændringer.)

    Hortonworks er et spin-off fra Yahoo!, som var den oprindelige virksomhedsleder af Hadoop-projektet, fordi det havde brug for en stor platform for at støtte sin søgemaskinevirksomhed. Af alle Hadoop-distributørleverandørerne er Hortonworks mest engagerede i open source-bevægelsen, baseret på det store omfang af udviklingsarbejdet, som det bidrager til samfundet, og fordi al dens udviklingsindsats (til sidst) foldes ind i open source-kodebase.

    Hortonworks forretningsmodel er baseret på dets evne til at udnytte sin populære HDP distribution og levere betalte tjenester og support. Dog sælger den ikke proprietær software. I stedet støtter virksomheden entusiastisk tanken om at arbejde inden for open source-samfundet for at udvikle løsninger, der opfylder virksomhedens krav til egenskaber (for eksempel hurtigere forespørgselsbehandling med Hive).

    Hortonworks har smedet en række relationer med etablerede virksomheder inden for datahåndteringsindustrien: for eksempel Teradata, Microsoft, Informatica og SAS. Selv om disse virksomheder ikke har egne Hadoop-tilbud, samarbejder de med Hortonworks for at levere integrerede Hadoop-løsninger med deres egne produktsæt.

    Hortonworks Hadoop-udbuddet er Hortonworks Data Platform (HDP), som omfatter Hadoop samt relaterede værktøjer og projekter. I modsætning til Cloudera udgiver Hortonworks kun HDP-versioner med produktionskode fra open source-fællesskabet.

  • IBM : Big Blue tilbyder en række Hadoop-tilbud, med fokus omkring værditilvækst på toppen af ​​Hadoop-stacken med open source.

  • Intel: Intel Distribution for Apache Hadoop (Intel Distribution) leverer distribueret databehandling og databehandling til virksomhedsapplikationer, der analyserer store data.

    Nøglefunktionerne omfatter fremragende ydeevne med optimeringer til Intel Xeon-processorer, Intel SSD-opbevaring og Intel 10GbE-netværk; datasikkerhed via kryptering og dekryptering i HDFS og rollebaseret adgangskontrol med granulering på celleplan i HBase; forbedret Hive forespørgsel ydeevne; støtte til statistisk analyse med et stik til R, den populære open source statistiske pakke; og analytisk grafik gennem Intel Graph Builder.

  • MapR : For en komplet distribution for Apache Hadoop og relaterede projekter, der er uafhængige af Apache Software Foundation, kan du ikke kigge mere end MapR. Idet der ikke er Java-afhængigheder eller afhængighed af Linux-filsystemet, bliver MapR forfremmet som den eneste Hadoop-distribution, der giver fuld databeskyttelse, ingen enkelte fejlfejl og betydelige brugervenlige fordele.

    Tre MapR udgaver er tilgængelige: M3, M5 og M7. M3 Edition er gratis og tilgængelig til ubegrænset produktionsbrug; MapR M5 er et tilbud på mellemniveau abonnementssoftware; og MapR M7 er en komplet distribution for Apache Hadoop og HBase, der omfatter Pig, Hive, Sqoop og meget mere.

Sammenligning af Hadoop-distributioner - dummier

Valg af editor

Mama Mia Meatball Pizza - dummies

Mama Mia Meatball Pizza - dummies

Denne kødboldspizza vil holde dine små børn tilfredse uden at forværre din hypertension, fordi hvem kan du ikke lide pizza? Denne hurtige og lette opskrift vil ikke tage meget tid i forberedelsen - bare smide det sammen, bage det op og spis! Selv om denne opskrift er lavet af gode ingredienser, er den også lidt højere.

ÆGte Ændringer i Ændringer - Dummies

ÆGte Ændringer i Ændringer - Dummies

Det er ikke svært at lave rene forandringer i livet, men de tager nogle gumption, udholdenhed og praksis. Når du laver en koncentreret indsats for at spise lavere i fødekæden, skal du bemærke, hvordan denne beslutning påvirker andre områder af dit liv. For at være vellykket, skal du tænke på mad og spise anderledes, som ...

Meatless mandag og bæredygtighed - dummies

Meatless mandag og bæredygtighed - dummies

Meatless Monday er et ret nyt koncept, der ofte nævnes på Facebook og Twitter. Alt det betyder er, at du en dag om ugen vælger at spise vegetarisk eller vegansk. Ikke kun kan Meatless Monday spare penge (fordi kød er dyre), men planen hjælper miljøet (fordi store oksekød, svinekød og kyllingfaciliteter skaber nitrat ...

Valg af editor

Syd Park og ateisme - dummies

Syd Park og ateisme - dummies

Den modige og risikable animerede serie South Park sprang fra nontheistiske hoveder - i dette tilfælde ateister Trey Parker og Matt Stone. For mange mennesker viser troende og ikke-troende hinanden, at South Park spiller en værdifuld rolle i at slå de store spørgsmål ned til overkommelig størrelse. South Park går efter sine mål ubarmhjertigt, sparsomt no ...

Kulten af ​​grund og ateisme - dummier

Kulten af ​​grund og ateisme - dummier

Kulten af ​​grund var et forsøg på at organisere en samfundsd religion uden guder , en slags ateisme, at erstatte kristendommen under den franske revolution. Centreret om menneskeheden i stedet for guddommelighed var målet for kulten af ​​grunden menneskehedens perfektion gennem stræben efter sandhed og frihed. Som de fleste radikale sociale eksperimenter var ...

Ateismens historie - dummier

Ateismens historie - dummier

Mange tror, ​​at ateisme er en ny ide. Men religiøs vantro har faktisk en lang og fascinerende historie. Ligesom en kristendommens studerende gerne vil vide om et par ret betydelige ting, der skete for 2 000 år siden, har en person, der ønsker en bedre forståelse af ateisme, også brug for at vide hvad ...

Valg af editor

Tips til et bedre testresultat på ASVAB Mekanisk Forståelse Subtest - Dummies

Tips til et bedre testresultat på ASVAB Mekanisk Forståelse Subtest - Dummies

Hvornår du tager undervurderingen af ​​ASVAB under Mekanisk forståelse, du kan muligvis ikke vide det korrekte svar på et spørgsmål, eller du kan ikke kende det involverede mekaniske princip. Du kan kende det mekaniske princip, men husk ikke den formel, du har brug for for at komme op med det rigtige svar. Aldrig frygter - du kan stadig ...

Tager ASVAB Test: Papir eller Computeriseret? - dummies

Tager ASVAB Test: Papir eller Computeriseret? - dummies

Findes mange versioner af ASVAB'en (selvom du sandsynligvis ikke får et valg af, hvilken man skal tage), men de koger primært ned til to grundlæggende forskelle: papirudgaven og den computerbaserede version. Hver version har fordele og ulemper. Hvis du tager ASVAB som en del af elevprogrammet i gymnasiet eller ...

Hvad er underprøverne på AFQT? - dummies

Hvad er underprøverne på AFQT? - dummies

AFQT er ikke en selvstændig test. Du kan ikke bare gå ind på en rekrutterings kontor og sige, at du vil tage AFQT. Du skal tage hele ASVAB, som består af ni separate subtests. Fire af disse underprøver udgør den score, der er kendt som AFQT-scoren. AFQT-scoren afgør, om du er ...