Hjem Personlig finansiering Opsæt Hadoop miljøet med Apache Bigtop - dummies

Opsæt Hadoop miljøet med Apache Bigtop - dummies

Indholdsfortegnelse:

Video: Technology Stacks - Computer Science for Business Leaders 2016 2025

Video: Technology Stacks - Computer Science for Business Leaders 2016 2025
Anonim

Hvis du er komfortabel med at arbejde med VM og Linux, er du velkommen til at installere Bigtop på en anden VM end hvad der anbefales. Hvis du er rigtig fed og har hardwaren, så prøv at installere Bigtop på en klynge af maskiner i fuldt distribueret tilstand!

Trin 1: Downloadning af en VM

Hadoop kører på alle populære Linux-distributioner, så du har brug for en Linux VM. Der er et frit tilgængeligt (og lovligt!) CentOS 6 billede tilgængeligt.

Du skal bruge et 64-bit operativsystem på din bærbare computer for at kunne køre denne VM. Hadoop har brug for et 64-bit miljø.

Når du har downloadet VM'en, skal du udpakke den fra den downloadede zip-fil i destinationsmappen. Sørg for at du har omkring 50 GB plads til rådighed som Hadoop, og dine prøvedata vil bruge det.

Hvis du ikke allerede har en VM-afspiller, kan du downloade en gratis.

Når du har konfigureret din VM-afspiller, skal du åbne afspilleren, gå til File → Open, og derefter gå til det bibliotek, hvor du hentede din Linux VM. Kig efter en fil, der hedder det, og vælg det. Du kan se oplysninger om, hvor mange processorer og hvor meget hukommelse det vil bruge. Find ud af, hvor meget hukommelse din computer har, og tildel halvdelen af ​​den til VM at bruge. Hadoop har brug for masser af hukommelse.

Når du er klar, skal du klikke på knappen Afspil, og din Linux-instans starter. Du får se mange meddelelser flyve forbi, da Linux starter, og du kommer til en login-skærm. Brugernavnet er allerede indstillet til "Tom. "Angiv adgangskoden som" tomtom "og log ind.

Trin 2: Download Bigtop

Højreklik på skærmen på din Linux VM, og vælg Åbn i Terminal fra den kontekstmenu, der vises. Dette åbner en Linux-terminal, hvor du kan køre kommandoer. Klik inde i terminalen, så du kan se markøren blinke og indtaste følgende kommando: su -

Du bliver bedt om dit kodeord, så skriv "tomtom" som du gjorde tidligere. Denne kommando skifter brugeren til root, som er hovedkontoen for en Linux-computer - du skal bruge dette for at kunne installere Hadoop.

Kør med din rodadgang (lad ikke strømmen komme i hovedet), Kør følgende kommando:

wget -O / etc / yum. repos. d / BigTop. repo 

// www. apache. org / dist / BigTop / bigtop-

0. 7. 0 / repos / centos6 / bigtop. repo

Kommandoen er i det væsentlige en webforespørgsel, som kræver en bestemt fil i den URL, du kan se og skriver den til en bestemt sti - i dette tilfælde er det /.

Trin 3: Installation af Bigtop

Genierne bag Linux har gjort livet ret nemt for folk, der skal installere store softwarepakker som Hadoop.Hvad du downloadede i sidste trin var ikke hele Bigtop-pakken og alle dens afhængigheder. Det var bare en arkivfil (med udvidelsen), der fortæller et installationsprogram, hvilke softwarepakker der er nødvendige for Bigtop-installationen.

Som enhver stor softwareprodukt har Hadoop mange forudsætninger, men du behøver ikke bekymre dig. En veldesignet fil vil pege på eventuelle afhængigheder, og installationsprogrammet er smart nok til at se, om de mangler på din computer og derefter download og installere dem.

Installatøren du bruger her kaldes yum, som du kommer til at se i aktion nu:

yum install hadoop * mahout * oozie * hbase * hive * hue * gris * zookeeper *

Bemærk at du 'picking og vælger Hadoop komponenter til at installere. Der findes en række andre komponenter i Bigtop, men det er de eneste, du vil bruge her. Siden VM er en frisk Linux-installation, skal du have mange afhængigheder, så du bliver nødt til at vente lidt.

Yuminstallatøren er ganske ordentlig, så du kan se præcis, hvad der downloades og installeres for at passere tiden. Når installationsprocessen er færdig, skal du se en meddelelse, der siger "Komplet! "

Trin 4: Start Hadoop

Inden du starter med at køre programmer på Hadoop, er der nogle få grundlæggende konfigurations- og opsætnings ting, du skal gøre. Her er de i orden:

  1. Hent og installer Java:

    yum install java-1. 7. 0-openjdk-devel. x86_64
    
  2. Formater NameNode:

    sudo / etc / init. d / hadoop-hdfs-namenode init
    
  3. Start Hadoop-tjenesterne til din pseudodistribuerede klynge:

    for jeg havde hadoop-hdfs-namenode hadoop-hdfs-datanode; gør sudo service $ jeg starter done
    
  4. Opret en underkatalogstruktur i HDFS:

    sudo / usr / lib / hadoop / libexec / init-hdfs. sh
    
  5. Start YARN-dæmonerne:

sudo service hadoop-garn-resourcemanager startsudo service hadoop-garn-nodemanager start

Og med det er du færdig. Tillykke! Du har installeret en fungerende Hadoop-implementering!

Trin 5: Hentning af stikprøvedatasættet

For at downloade prøvedatasættet skal du åbne Firefox-browseren fra VM'en og gå til dataexpo-siden.

Du behøver ikke hele datasættet, så start med et enkelt år, 1987. Når du er ved at downloade, skal du vælge indstillingen Open with Archive Manager.

Når din fil er downloadet, skal du udpakke filen i din hjemmekatalog, hvor du nemt kan finde den. Klik på knappen Uddrag, og vælg derefter skrivebordskataloget.

Trin 6: Kopiering af stikprøvedatasættet til HDFS

Husk at dine Hadoop-programmer kun kan arbejde med data, når de er gemt i HDFS. Så hvad du skal gøre nu, er at kopiere flydatafilen til 1987 i HDFS. Indtast følgende kommando:

hdfs dfs -copyFromLocal 1987. csv / user / root
Opsæt Hadoop miljøet med Apache Bigtop - dummies

Valg af editor

Landskabsfoto - Sanibel Sentinel - Dummies

Landskabsfoto - Sanibel Sentinel - Dummies

Florida's Sanibel Island er en skattekiste for naturfotografen. Ding Darling Refuge er fuld af fugle og andet indfødt dyreliv. Et blusteri Januar dagen, solen synkende lavt; med de høje skyer så det ud som om solnedgangen ville være spektakulært. Dette billede blev fotograferet et par minutter efter solnedgangen. Kamera indstillinger ...

Landskabsfoto - Solnedgang i Paradis - Dummies

Landskabsfoto - Solnedgang i Paradis - Dummies

Dette landskabsbillede blev taget i Caspersen Beach i Venedig, Florida. Dette billede blev fotograferet om vinteren. Vinter i Florida er et hårdt arbejde, men nogen skal gøre det. Kameraindstillinger ISO-indstilling 100: Der var masser af lys, så fotografen gik med en lav ISO-indstilling. Eksponeringskompensation -1/3 EV: Underexposing solnedgange ...

Landskabsfoto - Tag den høje trail - dummies

Landskabsfoto - Tag den høje trail - dummies

Dette billede blev fotograferet i Myakka River State Park nær Sarasota, Florida. Parken er smuk med mange miles af stier. Denne sti slingrer gennem en frodig eng med prikker med dejlige træer. Solen synkende lavt og dejlige skyer var i himlen. Et polariserende filter blev føjet til linsen, mørkere bluesen ...

Valg af editor

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Excel 2013 gør det nemt at oprette en nyt pivottabel ved hjælp af en dataliste valgt i dit regneark med dets nye Quick Analysis-værktøj. For at forhåndsvise forskellige typer af pivottabeller, som Excel kan oprette til dig på stedet, bruger indtastningerne i en dataliste, som du har åbnet i en Excel ...

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Et problem, du kan løbe ind, når du importerer data til Excel, er at dine tekstetiketter måske ikke ser rigtigt ud. Du kan holde dine data rene med følgende tekstfunktioner. FIND-funktionen FIND-funktionen finder starttekstpositionen for en tekststreng i en anden tekststreng. For eksempel, hvis du ...

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Funktionerne DSTDEV og DSTDEVP i Excel beregner en standardafvigelse. DSTDEV beregner standardafvigelsen for en prøve. DSTDEVP beregner standardafvigelsen for en population. Som med andre databasestatistiske funktioner, er den unikke og virkelig nyttige funktion af DSTDEV og DSTDEVP, at du kan angive, at du kun vil have listeoptegnelser, der ...

Valg af editor

Basic Photoshop CS5-kommandoer - dummies

Basic Photoshop CS5-kommandoer - dummies

Bliver fortrolig med Photoshop CS5-programvinduet er en god måde at få din kuglelejer på. før du dyker ind i Photoshops værktøjer og kommandoer. Her er et par grundlæggende tips: Start Photoshop ved at klikke på Start-menuen eller et ikon på proceslinjen (Windows) eller klikke på Photoshop-ikonet på Dock (Mac). Du kan også ...

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop har flere filtre, som du kan bruge på stort set ethvert billede, der skal forbedres eller finesse det. De fleste billeder, for eksempel, drage fordel af mindst en smule skarphed for at forbedre detaljerne i billedet. I nogle tilfælde vil du reducere den synlige detalje i et billede på nogle områder til ...

Værktøjskasse Genveje i Photoshop 6 - dummier

Værktøjskasse Genveje i Photoshop 6 - dummier

For at hjælpe dig med at manipulere billeder, Photoshop 6 tilbyder en værktøjskasse med en hel masse nyttige værktøjer. Du klikker på Photoshop-ikonet og nogle gange en anden nøgle eller to for at få adgang til værktøjerne, der gør arbejde og afspilning med Photoshop 6 så sjovt. Nedenstående tabel viser værktøjskassebillederne og deres genvejstaster. Hvis du ...