Hjem Personlig finansiering Styring af filer med Hadoop filsystemkommandoer - dummies

Styring af filer med Hadoop filsystemkommandoer - dummies

Video: Styring af synkronisering af filer fra OneDrive tech til pc 2017 2025

Video: Styring af synkronisering af filer fra OneDrive tech til pc 2017 2025
Anonim

HDFS er en af ​​de to hovedkomponenter i Hadoop-rammen; den anden er det beregningsmæssige paradigme, der er kendt som MapReduce. Et distribueret filsystem er et filsystem, som styrer lagring på tværs af en netværksklynge af maskiner.

HDFS gemmer data i blokke , enheder, hvis standardstørrelse er 64 MB. Filer, som du vil have gemt i HDFS, skal opdeles i blokstørrelsesbiter, som derefter gemmes uafhængigt i hele klyngen. Du kan bruge kommandoen fsck line til at liste de blokke, der udgør hver fil i HDFS, som følger:

% hadoop fsck / -files -blocks

Da Hadoop er skrevet i Java, administreres alle interaktioner med HDFS via Java API. Husk dog, at du ikke behøver at være en Java-guru til at arbejde med filer i HDFS. Flere Hadoop-grænseflader bygget oven på Java-API'et er nu i almindelig brug (og skjul Java), men den enkleste er kommandolinjegrænsefladen; brug kommandolinjen til at interagere med HDFS i de givne eksempler.

Du får adgang til Hadoop filsystem shell ved at køre en form for hadoop kommandoen. Alle hadoop kommandoer påberåbes af bin / hadoop script. (For at hente en beskrivelse af alle hadoop-kommandoer skal du køre Hadoop-scriptet uden at angive nogen argumenter.) Hadoop-kommandoen har syntaxen

hadoop [--config confdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]

config confdir-opsætningen overskriver standardkonfigurationsmappen ($ HADOOP_HOME / conf), så du nemt kan tilpasse Hadoop-miljøkonfigurationen. De generiske valgmuligheder og kommandoindstillinger er et fælles sæt indstillinger, som understøttes af flere kommandoer.

Hadoop-filsystemskallekommandoer (for kommandolinjegrænseflader) tager ensartede ressourceidentifikatorer (URI'er) som argumenter. En URI er en streng af tegn, der bruges til at identificere et navn eller en webressource.

Strengen kan indeholde et skema navn - en kvalifikation for datakildens art. For HDFS er systemnavnet hdfs, og for det lokale filsystem er ordningsnavnet fil. Hvis du ikke angiver et skema navn, er standard det skema navn, der er angivet i konfigurationsfilen. En fil eller en mappe i HDFS kan specificeres på en fuldt kvalificeret måde, som i dette eksempel:

hdfs: // namenodehost / parent / child

Eller det kan simpelthen være / forælder / barn, hvis konfigurationsfilen peger til hdfs: // namenodehost.

Hadoop-filsystemskallekommandoerne, som ligner Linux-filkommandoer, har følgende generelle syntaks:

hadoop hdfs dfs - file_cmd

Læsere med en tidligere Hadoop-oplevelse kan spørge: "Men hvad om hadoop fs kommandoen?"Fs-kommandoen udskilles i Hadoop 0. 2-udgivelsesserien, men det virker stadig i Hadoop 2. Brug hdfs dfs i stedet.

Som du måske forventer, bruger du kommandoen mkdir til at oprette en mappe i HDFS, ligesom du ville gøre på Linux eller på Unix-baserede operativsystemer. Selvom HDFS har en standard arbejdskatalog, / bruger / $ USER, hvor $ USER er dit login brugernavn, skal du oprette det selv ved at bruge syntaksen

$ hadoop hdfs dfs -mkdir / user / login_user_name

For at oprette en mappe med navnet "joanna" skal du køre denne mkdir-kommando:

$ hadoop hdfs dfs -mkdir / user / joanna

Brug kommandoen Hadoop put til at kopiere en fil fra dit lokale filsystem til HDFS:

$ hadoop hdfs dfs -put filnavn / bruger / login_user_name

For eksempel at kopiere en fil, der hedder data. txt til denne nye mappe, kør følgende sæt kommando:

$ hadoop hdfs dfs -put data. txt / user / joanna

Kør kommandoen ls for at hente en HDFS-filliste:

$ hadoop hdfs dfs -ls. Fundet 2 emner drwxr-xr-x - joanna supergroup 0 2013-06-30 12: 25 / bruger / joanna -rw-r - r-- 1 joanna supergroup 118 2013-06-30 12: 15 / bruger / joanna / data. txt

Filfortegnelsen brydes ned som beskrevet i denne liste:

  • Kolonne 1 viser filtilstand ("d" for mappe og "-" for normal fil efterfulgt af tilladelserne). De tre tilladelsestyper - læs (r), skriv (w) og udfør (x) - er de samme som i Linux- og Unix-baserede systemer. Den tilladte tilladelse til en fil ignoreres, fordi du ikke kan udføre en fil på HDFS. Tilladelserne grupperes af ejer, gruppe og offentlighed (alle andre).

  • Kolonne 2 viser replikationsfaktoren for filer. (Begrebet replikation gælder ikke for mapper.) De blokke, der udgør en fil i HDFS, replikeres for at sikre fejltolerance. replikationsfaktoren, eller antallet af replikaer, der holdes for en bestemt fil, kan konfigureres. Du kan angive replikeringsfaktoren, når filen oprettes eller senere, via din applikation.

  • Kolonner 3 og 4 viser filen ejer og gruppen . Supergruppe er navnet på gruppen af ​​superusere, og en superbruger er brugeren med samme identitet som NameNode-processen. Hvis du starter NameNode, er du superbrugeren for nu. Dette er en særlig gruppe - faste brugere vil have deres brugergrupper tilhørende en gruppe uden særlige egenskaber - en gruppe, der simpelthen er defineret af en Hadoop-administrator.

  • Kolonne 5 viser filens størrelse, i byte eller 0, hvis det er en mappe.

  • Kolonne 6 og 7 viser dato og klokkeslæt for den sidste modifikation.

  • Kolonne 8 viser det ukvalificerede navn (hvilket betyder, at ordnets navn ikke er angivet) i filen eller mappen.

Brug Hadoop get-kommandoen til at kopiere en fil fra HDFS til dit lokale filsystem:

$ hadoop hdfs dfs -get filnavn / bruger / login_user_name

Brug Hadoop rm kommando for at slette en fil eller en tom mappe:

$ hadoop hdfs dfs -rm filnavn / bruger / login_user_name

Brug kommandoen hadoop hdfs dfs -help til at få detaljeret hjælp til alle mulighed.

Styring af filer med Hadoop filsystemkommandoer - dummies

Valg af editor

Landskabsfoto - Sanibel Sentinel - Dummies

Landskabsfoto - Sanibel Sentinel - Dummies

Florida's Sanibel Island er en skattekiste for naturfotografen. Ding Darling Refuge er fuld af fugle og andet indfødt dyreliv. Et blusteri Januar dagen, solen synkende lavt; med de høje skyer så det ud som om solnedgangen ville være spektakulært. Dette billede blev fotograferet et par minutter efter solnedgangen. Kamera indstillinger ...

Landskabsfoto - Solnedgang i Paradis - Dummies

Landskabsfoto - Solnedgang i Paradis - Dummies

Dette landskabsbillede blev taget i Caspersen Beach i Venedig, Florida. Dette billede blev fotograferet om vinteren. Vinter i Florida er et hårdt arbejde, men nogen skal gøre det. Kameraindstillinger ISO-indstilling 100: Der var masser af lys, så fotografen gik med en lav ISO-indstilling. Eksponeringskompensation -1/3 EV: Underexposing solnedgange ...

Landskabsfoto - Tag den høje trail - dummies

Landskabsfoto - Tag den høje trail - dummies

Dette billede blev fotograferet i Myakka River State Park nær Sarasota, Florida. Parken er smuk med mange miles af stier. Denne sti slingrer gennem en frodig eng med prikker med dejlige træer. Solen synkende lavt og dejlige skyer var i himlen. Et polariserende filter blev føjet til linsen, mørkere bluesen ...

Valg af editor

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Hvordan man bruger Excel 2013 Quick Analysis Tool - dummies

Excel 2013 gør det nemt at oprette en nyt pivottabel ved hjælp af en dataliste valgt i dit regneark med dets nye Quick Analysis-værktøj. For at forhåndsvise forskellige typer af pivottabeller, som Excel kan oprette til dig på stedet, bruger indtastningerne i en dataliste, som du har åbnet i en Excel ...

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Hvordan man bruger FIND, FIXED og LEFT tekstfunktioner til at rydde data i Excel - dummies

Et problem, du kan løbe ind, når du importerer data til Excel, er at dine tekstetiketter måske ikke ser rigtigt ud. Du kan holde dine data rene med følgende tekstfunktioner. FIND-funktionen FIND-funktionen finder starttekstpositionen for en tekststreng i en anden tekststreng. For eksempel, hvis du ...

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Sådan bruges DSTDEV- og DSTDEVP-funktionerne i Excel - dummies

Funktionerne DSTDEV og DSTDEVP i Excel beregner en standardafvigelse. DSTDEV beregner standardafvigelsen for en prøve. DSTDEVP beregner standardafvigelsen for en population. Som med andre databasestatistiske funktioner, er den unikke og virkelig nyttige funktion af DSTDEV og DSTDEVP, at du kan angive, at du kun vil have listeoptegnelser, der ...

Valg af editor

Basic Photoshop CS5-kommandoer - dummies

Basic Photoshop CS5-kommandoer - dummies

Bliver fortrolig med Photoshop CS5-programvinduet er en god måde at få din kuglelejer på. før du dyker ind i Photoshops værktøjer og kommandoer. Her er et par grundlæggende tips: Start Photoshop ved at klikke på Start-menuen eller et ikon på proceslinjen (Windows) eller klikke på Photoshop-ikonet på Dock (Mac). Du kan også ...

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop-filtre, du virkelig har brug for - dummier

Photoshop har flere filtre, som du kan bruge på stort set ethvert billede, der skal forbedres eller finesse det. De fleste billeder, for eksempel, drage fordel af mindst en smule skarphed for at forbedre detaljerne i billedet. I nogle tilfælde vil du reducere den synlige detalje i et billede på nogle områder til ...

Værktøjskasse Genveje i Photoshop 6 - dummier

Værktøjskasse Genveje i Photoshop 6 - dummier

For at hjælpe dig med at manipulere billeder, Photoshop 6 tilbyder en værktøjskasse med en hel masse nyttige værktøjer. Du klikker på Photoshop-ikonet og nogle gange en anden nøgle eller to for at få adgang til værktøjerne, der gør arbejde og afspilning med Photoshop 6 så sjovt. Nedenstående tabel viser værktøjskassebillederne og deres genvejstaster. Hvis du ...