Hjem Personlig finansiering Hvorfor skal du bruge Hadoop til store data? - dummies

Hvorfor skal du bruge Hadoop til store data? - dummies

Video: Kenneth Cukier: Big data is better data 2025

Video: Kenneth Cukier: Big data is better data 2025
Anonim

Søgemaskinerne som Yahoo! og Google blev konfronteret med et mose data problem. De var nødt til at finde en måde at forstå for de massive mængder data, som deres motorer indsamlede. Disse virksomheder havde brug for både at forstå, hvilke oplysninger de samlede, og hvordan de kunne tjene penge på disse data til støtte for deres forretningsmodel.

Hadoop blev udviklet, fordi den repræsenterede den mest pragmatiske måde at lade virksomhederne håndtere store mængder data nemt. Hadoop tillod store problemer at blive opdelt i mindre elementer, så analysen kunne gøres hurtigt og omkostningseffektivt.

Ved at bryde det store dataproblem i små stykker, der kunne behandles parallelt, kan du behandle oplysningerne og omgruppere de små stykker for at præsentere resultaterne.

Hadoop blev oprindeligt bygget af en Yahoo! ingeniør ved navn Doug Cutting og er nu et open source projekt administreret af Apache Software Foundation. Den stilles til rådighed under Apache License v2. 0.

Hadoop er en grundlæggende byggesten i vores ønske om at indfange og behandle store data. Hadoop er designet til at parallelisere databehandling på tværs af computernoder for at fremskynde beregninger og skjule latens. I kernen har Hadoop to primære komponenter:

  • Hadoop distribueret filsystem: En pålidelig, højbåndsbredt, billigt datalagringskluster, der letter håndteringen af ​​relaterede filer på tværs af maskiner.

  • MapReduce engine: En højtydende parallel / distribueret databehandling implementering af MapReduce algoritmen.

Hadoop er designet til at behandle enorme mængder af strukturerede og ustrukturerede data (terabyte til petabytes) og implementeres på racks af råvareservere som en Hadoop-klynge. Servere kan tilføjes eller fjernes fra klyngen dynamisk, fordi Hadoop er designet til at være "selvhelbredende. "Hadoop kan med andre ord opdage ændringer, herunder fejl, og tilpasse sig disse ændringer og fortsætte med at fungere uden afbrydelse.

Hvorfor skal du bruge Hadoop til store data? - dummies

Valg af editor

A + eksamener og netværkskortet (NIC) - dummies

A + eksamener og netværkskortet (NIC) - dummies

Er bekendt med netværksgrænsefladen kort (NIC) til A + eksamenerne og forstå fordelene herfor. Netværksinterfacekortet (almindeligvis benævnt et netværkskort) er ansvarlig for at forbinde computeren eller enheden til netværket. Endnu vigtigere er netværkskortet på afsendelsescomputeren ansvarlig for at konvertere digitale data til en ...

Enhedsrelaterede fejl du behøver at vide - dummies

Enhedsrelaterede fejl du behøver at vide - dummies

Når du forfølger din compTIA A + -certificering, skal du vide om enhedsrelaterede fejl og hvad man skal gøre, når du støder på dem. Det er uheldigt, at enhederne og deres drivere, der tillader folk at udføre så meget af deres daglige arbejde med computere, er også en af ​​de største faktorer ved ikke at kunne ...

A + Certificering Alt-i-One til Dummies Cheat Sheet - dummies

A + Certificering Alt-i-One til Dummies Cheat Sheet - dummies

A + Certification All -in-One For Dummies online snydeark giver dig hurtige fakta at huske på testdagen for at hjælpe dig med at besvare spørgsmål, der findes på A + Certification Exams. Før A + eksamenerne vil du gennemgå nogle af de store Windows-begreber som boot-filer, gendannelsesværktøjer, RAID-typer og fejlfinding af værktøjer. Du ...

Valg af editor

Hvordan man definerer ordforråddefinitioner for SAT-dummierne

Hvordan man definerer ordforråddefinitioner for SAT-dummierne

Du kan komme igennem ordforrådssektionen af SAT med flyvende farver, hvis du kan forberede dig til testen ved at gruppere ord i logiske klynger. Under testen kan du finde ud af orddefinitioner fra orddele og bruge kontekst til at give dig spor til et ords betydning. Overvejer konnotationsklynger Medmindre du har ...

Valg af editor

Outlook 2013 Task Home Tab - dummies

Outlook 2013 Task Home Tab - dummies

Du kan planlægge og spore personlige projekter og professionelle projekter i Outlook 2013. Knapper og ikoner på fanen Opgaver Startside i Outlook 2013-båndet er de værktøjer, der hjælper med at håndtere din arbejdsbyrde. Outlook 2013 tilbyder forskellige visninger - Afsluttet, i dag og næste 7 dage - for at hjælpe dig med at prioritere.

Outlook 2007 Business Contact Manager til Dummies Cheat Sheet - dummies

Outlook 2007 Business Contact Manager til Dummies Cheat Sheet - dummies

Outlook 2007 Business Contact Manager (BCM ) er lige hvad du har brug for, hvis du er en sælger eller en forretningschef. Sammen med de normale, hjælpsomme Outlook-funktioner tilbyder BCM værktøjer, der hjælper dig med at holde dig i top af dit forretningsliv.

Vedligeholdelse af en glad og sund kontaktperson mappe i Outlook - dummies

Vedligeholdelse af en glad og sund kontaktperson mappe i Outlook - dummies

I patologi, som er undersøgelsen af sygdomme og hvordan de overføres, er en kontaktperson en person, der overleverer en smitsom sygdom, men i Outlook er en kontaktperson, som du holder information om. Oplysninger om kontaktpersoner gemmes i mappen Kontakter. Denne mappe er en superdrevet adressebog. Det har steder ...