Hjem Personlig finansiering Grafikbehandling i Hadoop - dummies

Grafikbehandling i Hadoop - dummies

Indholdsfortegnelse:

Video: Hadoop Processing Frameworks 2024

Video: Hadoop Processing Frameworks 2024
Anonim

En af de mere spændende nye NoSQL teknologier indebærer lagring og behandling af grafdata. Du tror måske, at denne erklæring er gammel nyhed, fordi computerforskere har udviklet grafanalyse teknikker i årtier. Hvad du siger kan godt være sandt, men hvad er nyt er, at ved at bruge Hadoop, kan du gøre grafanalyse i stor skala.

Hvad er grafdata?

A graf i datat termer er simpelthen en repræsentation af individuelle enheder og deres forhold. En grafs enheder kaldes noder (eller hjørner ), og relationerne mellem enheder i en graf kaldes kanter (eller forbindelser >). At repræsentere datasæt i en graf i modsætning til traditionelle rækker og kolonner gør det meget nemmere at behandle dine data på en måde, der gør forholdet mellem objekter krystalklar. Typiske grafberegninger er repræsenteret af den korteste stiafstand mellem flere knudepunkter i din graf eller blot ved hvor mange knudepunkter der er forbindelser af en bestemt type til en bestemt knude.

Ansøgninger til grafanalyse

Den mest velkendte ansøgning til grafdatabaser er Googles PageRank-algoritme, som beregner forbindelsesforholdene mellem alle kendte websider. Google repræsenterer nettet som en kæmpe graf, hvor websiderne er noder, og linkene fra den ene side til den anden er repræsenteret som kanter. (Google delte rigdom ved at offentliggøre et dokument, der beskriver sit grafanalyseprojekt - mærket Pregel-back i 2010.) Den grafbehandling, som Google var interesseret i, involverede beregning af antallet af indgående forbindelser for hver webside.

Facebook lavede en betydelig splash i 2013, da den meddelte, at den brugte Apache Giraph (baseret på Pregel-papiret), en grafbehandlingsmaskine designet til at behandle grafer lagret i HDFS. Det viste Giraphs magt ved at vise en graf, der repræsenterer alle Facebooks brugere (over 1 mia.) Og deres venskaber (milliarder!), Som i alt har over 1 billionskanter. Denne skala er svimlende: Hvis du er Facebook, og du skal lave beregninger som ven anbefalinger, hvad bedre værktøj til brug end en graf behandlingsmotor? Det er ikke overraskende, at en distribueret grafdatabase ligger i kernen i alle andre bemærkelsesværdige sociale medier, herunder Twitter, LinkedIn, OkCupid og Pinterest.

En grafbehandlingsmotor kan nemt besvare mange praktiske spørgsmål til sociale medier. To eksempler er, hvordan LinkedIn viser graden af ​​adskillelse mellem dig og en anden bruger er den korteste vejberegning (hvad er den nærmeste forbindelse mellem to noder?) og hvordan OkCupid viser brugere med fælles interesser er et sæt samarbejdende filtreringsberegninger (hvad er de mest almindelige forbindelser til et bestemt sæt af noder?).

Grafanalyse i Hadoop

Fra foråret 2014 forbliver grafanalyse på Hadoop i sine tidlige stadier. Med fremkomsten af ​​Garn i Hadoop 2 vil grafanalyse og andre specialiserede behandlingsteknikker blive stadig mere populære på Hadoop. Mange af de sociale websteder, der er nævnt i denne artikel, bruger deres egne grafiske databaser og behandlingsmotorer, men Facebook er en fremtrædende bruger af Giraph. Fordi Facebooks (stiltiende) godkendelsesmærke er Giraph blevet et populært valg til grafanalyse på Hadoop, men det har nogle begrænsninger. Det er udelukkende en behandlingsmotor, fordi den indlæser data som en graf i klyngens hukommelse, og den er optimeret til batch-orienterede forespørgsler.

En anden grafbehandling løsning kommer fra Aurelius, et firma, der har udgivet et sæt open source grafanalyseværktøjer til Hadoop. Kernen i sine tilbud er Titan, en grafdatabase, der bruger HBase som et persistenslag, der er optimeret til interaktive forespørgsler, og Faunus, en grafbehandlingsmotor, der lagrer et øjebliksbillede af en graf fra Titan i HDFS og kører MapReduce jobs imod det. For både de interaktive (Titan) og batch (Faunus) applikationer har Aurelius den fælles graf-traversale API ved navn Gremlin.

Endelig har Apache Spark-projektet GraphX-offshooten, som gør det muligt at generere grafdata og derefter behandle alt inden for Spark-rammerne.

Grafikbehandling i Hadoop - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...