Hjem Personlig finansiering Pig Latin Application Flow i Hadoop-dummies

Pig Latin Application Flow i Hadoop-dummies

Video: Pig Latin Data Model 2024

Video: Pig Latin Data Model 2024
Anonim

Pig Latin er et dataflow -sprog, hvor du definerer en datastrøm og en række transformationer, der anvendes til dataene, som det strømmer gennem din ansøgning. Dette er i modsætning til et kontrolflow sprog (som C eller Java), hvor du skriver en række instruktioner.

I kontrolflowsprogene bruger du konstruktioner som sløjfer og betinget logik (som en if-sætning). Du vil ikke finde løkker og hvis udsagn i gris latin.

Hvis du har brug for overbevisende om at arbejde med gris er en væsentlig lettere række til at hakke end at skulle skrive kort og reducere programmer, skal du starte med at kigge på en ægte Pig-syntaks:

A = LOAD 'data_file. txt ';. B = GRUPPE …; … C = FILTER …;. DUMP B;. OPBEVAR C TIL 'RESULTATER';

Nogle af teksterne i dette eksempel ligner faktisk engelsk, ikke? Ikke for skræmmende, i det mindste på dette tidspunkt. Når man ser på hver linje igen, kan man se den grundlæggende strøm af et Pig-program. (Bemærk at denne kode enten kan være en del af et script eller udstedt på den interaktive shell kaldet Grunt.)

  1. Belastning: Du skal først indlæse (LOAD) de data, du vil manipulere.

    Som i et typisk MapReduce-job gemmes disse data i HDFS. For et griseprogram at få adgang til dataene, skal du først fortælle Pig, hvilke filer eller filer der skal bruges. Til den opgave bruger du kommandoen LOAD 'data_file'.

    Her kan 'data_file' angive enten en HDFS-fil eller en mappe. Hvis en mappe er angivet, er alle filer i den pågældende mappe indlæst i programmet.

    Hvis dataene gemmes i et filformat, der ikke er tilgængeligt for gris, kan du eventuelt tilføje USING-funktionen til LOAD-sætningen for at angive en brugerdefineret funktion, der kan læses ind (og fortolke) dataene.

  2. Transform: Du kører dataene gennem et sæt transformationer, der, langt under emhætten og langt fjernet fra alt, hvad du skal bekymre dig om, oversættes til et sæt kort- og formindskelsesopgaver.

    Transformationslogikken er, hvor al datamanipulation sker. Her kan du FILTER ud rækker, der ikke er interessante, FØD med to sæt datafiler, GROUP data for at opbygge aggregater, ORDER resultater og gøre meget, meget mere.

  3. Dump: Dump (DUMP) resultaterne til skærmen

    eller

    Store (STORE) resultaterne i en fil et eller andet sted.

    Du vil typisk bruge DUMP-kommandoen til at sende output til skærmen, når du fejler dine programmer. Når dit program går i produktion, ændrer du simpelthen DUMP-opkaldet til et STORE-opkald, så alle resultater fra at køre dine programmer gemmes i en fil til videre behandling eller analyse.

Pig Latin Application Flow i Hadoop-dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...