Hjem Personlig finansiering Hvad er Hadoop? - dummies

Hvad er Hadoop? - dummies

Video: Hvad er data sampling? 2024

Video: Hvad er data sampling? 2024
Anonim

Hadoop er et open source databehandlingsværktøj, der blev udviklet af Apache Software Foundation. Hadoop er i øjeblikket go-to-programmet til håndtering af store mængder og datatyper, fordi det var designet til at gøre computere i stor skala mere overkommelige og fleksible. Med Hadops ankomst er massedatabearbejdning blevet introduceret til betydeligt flere mennesker og flere organisationer.

Hadoop kan tilbyde dig en fantastisk løsning til at håndtere, behandle og gruppere massestrømme af strukturerede, semistrukturerede og ustrukturerede data. Ved at oprette og implementere Hadoop får du en forholdsvis overkommelig måde at begynde at bruge og tegne indsigt fra alle dine organisations data i stedet for at fortsætte med at stole udelukkende på det transaktionsdatasæt, du sidder over i et gammelt datalager et eller andet sted.

Hadoop er et af de mest populære programmer til rådighed til storskalige computerkrav. Hadoop leverer et map-og-reducere lag, der er i stand til at håndtere databehandlingskravene i de fleste store dataprojekter.

Sommetider bliver dataene for store og hurtige, så selv Hadoop kan håndtere. I disse tilfælde vender organisationer i stedet for alternative, mere tilpassede MapReduce-implementeringer.

Hadoop bruger klynger af råvarehardware til lagring af data. Hardware i hver klynge er forbundet, og denne hardware består af vare servere - billige og lavpresterende generiske servere, der tilbyder kraftige computerkapacitet, når de kører parallelt på tværs af en delt klynge. Disse råvareservere kaldes også noder . Commoditized computing reducerer dramatisk omkostningerne i forbindelse med håndtering og lagring af store data.

En distribueret procesramme:

  • Hadoop bruger Hadoop MapReduce som sin distribuerede behandlingsramme. Igen er en distribueret behandlingsramme en kraftfuld ramme, hvor behandlingsopgaver fordeles på tværs af knudepunkter, så store datamængder kan behandles meget hurtigt på tværs af systemet som helhed. Et distribueret filsystem:

  • Hadoop bruger Hadoop Distributed File System (HDFS) som det distribuerede filsystem. Arbejdsbyrden af ​​applikationer, der kører på Hadoop, er opdelt i nodene i Hadoop-klyngen, og derefter gemmes udgangen på HDFS. Hadoop-klyngen kan bestå af tusindvis af noder. For at holde omkostningerne ved input / output (I / O) processer lave, blev Hadoop MapReduce-job udført så tæt på dataene som muligt.

Dette betyder, at processorer med reducere opgaver placeres så tæt som muligt på de udgående kortopgaver, der skal behandles. Dette design letter deling af beregningsmæssige krav i stor databehandling.

Hadoop støtter også hierarkisk organisation. Nogle af dets noder klassificeres som masternoder, og andre er kategoriseret som slaver. Mestertjenesten, kendt som

JobTracker , er designet til at styre flere slave-tjenester. Slave-tjenester (også kaldet TaskTrackers ) distribueres til hver knude. JobTracker kontrollerer TaskTrackers og tildeler Hadoop MapReduce opgaver til dem. I en nyere version af Hadoop, kendt som Hadoop 2, blev en ressource manager kaldet Hadoop YARN tilføjet. Med hensyn til MapReduce i Hadoop fungerer YARN som et integreret system, der udfører ressourcehåndtering og planlægningsfunktioner.

Hadoop behandler data i batch. Hvis du arbejder med real-time streaming data, kan du derfor ikke bruge Hadoop til at håndtere dine store data problemer. Dette sagt, det er meget nyttigt for at løse mange andre typer af store dataproblemer.

Hvad er Hadoop? - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...