Hjem Personlig finansiering Hvad er Hadoop? - dummies

Hvad er Hadoop? - dummies

Video: Hvad er data sampling? 2025

Video: Hvad er data sampling? 2025
Anonim

Hadoop er et open source databehandlingsværktøj, der blev udviklet af Apache Software Foundation. Hadoop er i øjeblikket go-to-programmet til håndtering af store mængder og datatyper, fordi det var designet til at gøre computere i stor skala mere overkommelige og fleksible. Med Hadops ankomst er massedatabearbejdning blevet introduceret til betydeligt flere mennesker og flere organisationer.

Hadoop kan tilbyde dig en fantastisk løsning til at håndtere, behandle og gruppere massestrømme af strukturerede, semistrukturerede og ustrukturerede data. Ved at oprette og implementere Hadoop får du en forholdsvis overkommelig måde at begynde at bruge og tegne indsigt fra alle dine organisations data i stedet for at fortsætte med at stole udelukkende på det transaktionsdatasæt, du sidder over i et gammelt datalager et eller andet sted.

Hadoop er et af de mest populære programmer til rådighed til storskalige computerkrav. Hadoop leverer et map-og-reducere lag, der er i stand til at håndtere databehandlingskravene i de fleste store dataprojekter.

Sommetider bliver dataene for store og hurtige, så selv Hadoop kan håndtere. I disse tilfælde vender organisationer i stedet for alternative, mere tilpassede MapReduce-implementeringer.

Hadoop bruger klynger af råvarehardware til lagring af data. Hardware i hver klynge er forbundet, og denne hardware består af vare servere - billige og lavpresterende generiske servere, der tilbyder kraftige computerkapacitet, når de kører parallelt på tværs af en delt klynge. Disse råvareservere kaldes også noder . Commoditized computing reducerer dramatisk omkostningerne i forbindelse med håndtering og lagring af store data.

En distribueret procesramme:

  • Hadoop bruger Hadoop MapReduce som sin distribuerede behandlingsramme. Igen er en distribueret behandlingsramme en kraftfuld ramme, hvor behandlingsopgaver fordeles på tværs af knudepunkter, så store datamængder kan behandles meget hurtigt på tværs af systemet som helhed. Et distribueret filsystem:

  • Hadoop bruger Hadoop Distributed File System (HDFS) som det distribuerede filsystem. Arbejdsbyrden af ​​applikationer, der kører på Hadoop, er opdelt i nodene i Hadoop-klyngen, og derefter gemmes udgangen på HDFS. Hadoop-klyngen kan bestå af tusindvis af noder. For at holde omkostningerne ved input / output (I / O) processer lave, blev Hadoop MapReduce-job udført så tæt på dataene som muligt.

Dette betyder, at processorer med reducere opgaver placeres så tæt som muligt på de udgående kortopgaver, der skal behandles. Dette design letter deling af beregningsmæssige krav i stor databehandling.

Hadoop støtter også hierarkisk organisation. Nogle af dets noder klassificeres som masternoder, og andre er kategoriseret som slaver. Mestertjenesten, kendt som

JobTracker , er designet til at styre flere slave-tjenester. Slave-tjenester (også kaldet TaskTrackers ) distribueres til hver knude. JobTracker kontrollerer TaskTrackers og tildeler Hadoop MapReduce opgaver til dem. I en nyere version af Hadoop, kendt som Hadoop 2, blev en ressource manager kaldet Hadoop YARN tilføjet. Med hensyn til MapReduce i Hadoop fungerer YARN som et integreret system, der udfører ressourcehåndtering og planlægningsfunktioner.

Hadoop behandler data i batch. Hvis du arbejder med real-time streaming data, kan du derfor ikke bruge Hadoop til at håndtere dine store data problemer. Dette sagt, det er meget nyttigt for at løse mange andre typer af store dataproblemer.

Hvad er Hadoop? - dummies

Valg af editor

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvordan man opretter en ny arbejdsbog i Excel 2010 - dummies

Hvis du arbejder i Microsoft Excel 2010 og vil begynde at arbejde i en ny Excel-workbook-fil, kan du nemt oprette en ny projektmappe. For at gøre det kan du bruge en kommando på fanen Filer eller en tastaturgenvej. Klik på fanen Filer. Excel viser Backstage-visning, hvor du kan få adgang til filrelaterede kommandoer. ...

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

Hvordan man opretter en ny brugerordbog i Excel 2010 - dummies

I Excel 2010 Opret brugerdefinerede ordbøger, der skal bruges, når du stavekontrollerer dine regneark. Du bruger knappen Tilføj til ordbog i dialogboksen Staveord til at tilføje ukendte ord til en brugerdefineret ordbog. Som standard tilføjer Excel disse ord til en brugerdefineret ordbog fil med navnet CUSTOM. DIC, men du kan oprette en ny brugerdefineret ...

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

Hvordan du opretter og formaterer et pivotdiagram i Excel 2010 - dummies

, Når du opretter en pivottabel i Excel 2010, kan du oprette et pivotdiagram for at vise sine sammendragsværdier grafisk. Du kan også formatere et pivotdiagram for at forbedre udseendet. Du kan bruge en af ​​de diagramtyper, der er tilgængelige med Excel, når du opretter et pivotdiagram. Opret et pivotdiagram Følg disse ...

Valg af editor

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Hvordan du ændrer layoutet på dit Ning-netværkets hovedside - dummier

Du kan flytte funktioner rundt på hovedsiden på dit Ning-netværk via siden Tilføj funktioner til dit netværk, ændrer layoutet, indtil det bare er det, du vil have. For at komme til denne side skal du klikke på linket Administrer i din navigation og derefter klikke på Funktioner under Dit netværk. Tilføj funktioner til dit netværk ...

Sådan vælger du et sprog med Ning Language Editor - dummies

Sådan vælger du et sprog med Ning Language Editor - dummies

Ning Language Editor er et af de mest kraftfulde værktøjer til din rådighed for at tilpasse dit netværk til det maksimale. Ning Language Editor hjælper dig med at lave din netværksgrænseflade (menuer, knapper, overskrifter, legender osv.), Og læs præcis som du vil have det til. Sprogeditoren giver dig mulighed for at vælge et bestemt sprog:

Hvordan man vælger et tema til dit Ning-netværk - dummies

Hvordan man vælger et tema til dit Ning-netværk - dummies

Du kan køre dit netværk på Ning uden at være en meget vellykket designer - og Ning's temaer lader dig få det til at ligne en million dollars! Folkene i Ning har taget godt af det og tilbyder dig mere end 50 flotte skabeloner (de kalder dem temaer), som du kan bruge med minimal indsats:

Valg af editor

Forstå kamphandlinger i rutefilter - dummier

Forstå kamphandlinger i rutefilter - dummier

De kamphandlinger, der er tilgængelige for rutefiltre, er identiske med dem, der er tilgængelige for andre routing politikker i Junos. Du kan acceptere ruter, afvise ruter, ændre attributter, der tilhører en rute, eller udføre flow kontrol type funktioner. Langt de mest almindelige handlinger, der skal bruges med rutefiltre, accepteres og afvises. Normalt vil du ...

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Brug god sikkerhedspraksis ved installation af netværksudstyr - dummies

Vigtigheden af ​​at følge sikkerhedsprotokoller kan ikke være overvurderet. Hvis der ikke træffes passende forholdsregler, kan der opstå alvorlig skade for personale eller apparatet. Følg disse retningslinjer for at sikre din sikkerhed og beskytte enheden mod skade. Vær altid opmærksom og udøv god dømmekraft. Bemærk: Kun uddannet og kvalificeret personale skal installere enheden. Brug ...

Forstå matchtyper i rutefilter - dummies

Forstå matchtyper i rutefilter - dummies

Rutefilter matcher bestemte IP-adresser eller præfiksintervaller. I lighed med andre routingpolitikker indeholder de nogle matchkriterier og tilsvarende kamphandlinger. En vigtig forskel mellem rutefiltre og andre politiske matchforhold er, hvordan flere filtre håndteres. Hvis du har mere end en matchtilstand, behandles betingelserne som ...