Hjem Personlig finansiering Faktorer, der øger omfanget af statistisk analyse i Hadoop - dummies

Faktorer, der øger omfanget af statistisk analyse i Hadoop - dummies

Video: Clash of Clans - Clash Talk Q&A - Episode 2 2025

Video: Clash of Clans - Clash Talk Q&A - Episode 2 2025
Anonim

Grunden folk prøver deres data, før de kører statistisk analyse i Hadoop, at denne type analyse ofte kræver betydelige databehandlingsressourcer. Det handler ikke kun om datamængder: der er fem hovedfaktorer, der påvirker omfanget af statistisk analyse:

  • Denne er let, men vi skal nævne det: mængden af ​​data, som du skal udføre analysen på, bestemmer bestemt omfanget af analysen.

  • Antallet af transformationer, der er nødvendige på datasættet, før der anvendes statistiske modeller, er helt sikkert en faktor.

  • Antallet af parvise korrelationer, du skal beregne spiller en rolle.

  • Graden af ​​kompleksitet i de statistiske beregninger, der skal anvendes, er en faktor.

  • Antallet af statistiske modeller, der skal anvendes på dit datasæt spiller en væsentlig rolle.

Hadoop tilbyder en vej ud af dette dilemma ved at give en platform til at udføre massivt parallelle behandlingsberegninger på data i Hadoop.

På den måde kan den vende det analytiske datastrømme; I stedet for at flytte dataene fra dets depot til analyseserveren leverede Hadoop analytics direkte til dataene. Mere specifikt giver HDFS dig mulighed for at gemme dine bjerge af data og derefter bringe beregningen (i form af MapReduce-opgaver) til slavenoderne.

Den fælles udfordring som følge af at flytte fra traditionelle symmetriske multibearbejdningsstatistiske systemer (SMP) til Hadoop-arkitekturen er datalokaliteten. På traditionelle SMP-platforme deler flere processorer adgang til en enkelt hovedhukommelsesressource.

I Hadoop replikerer HDFS partitioner af data på tværs af flere noder og maskiner. Også statistiske algoritmer, der var designet til behandling af data i hukommelsen, skal nu tilpasse sig datasæt, der spænder over flere noder / stativer og ikke kunne håbe at passe i en enkelt blok af hukommelse.

Faktorer, der øger omfanget af statistisk analyse i Hadoop - dummies

Valg af editor

Mama Mia Meatball Pizza - dummies

Mama Mia Meatball Pizza - dummies

Denne kødboldspizza vil holde dine små børn tilfredse uden at forværre din hypertension, fordi hvem kan du ikke lide pizza? Denne hurtige og lette opskrift vil ikke tage meget tid i forberedelsen - bare smide det sammen, bage det op og spis! Selv om denne opskrift er lavet af gode ingredienser, er den også lidt højere.

ÆGte Ændringer i Ændringer - Dummies

ÆGte Ændringer i Ændringer - Dummies

Det er ikke svært at lave rene forandringer i livet, men de tager nogle gumption, udholdenhed og praksis. Når du laver en koncentreret indsats for at spise lavere i fødekæden, skal du bemærke, hvordan denne beslutning påvirker andre områder af dit liv. For at være vellykket, skal du tænke på mad og spise anderledes, som ...

Meatless mandag og bæredygtighed - dummies

Meatless mandag og bæredygtighed - dummies

Meatless Monday er et ret nyt koncept, der ofte nævnes på Facebook og Twitter. Alt det betyder er, at du en dag om ugen vælger at spise vegetarisk eller vegansk. Ikke kun kan Meatless Monday spare penge (fordi kød er dyre), men planen hjælper miljøet (fordi store oksekød, svinekød og kyllingfaciliteter skaber nitrat ...

Valg af editor

Syd Park og ateisme - dummies

Syd Park og ateisme - dummies

Den modige og risikable animerede serie South Park sprang fra nontheistiske hoveder - i dette tilfælde ateister Trey Parker og Matt Stone. For mange mennesker viser troende og ikke-troende hinanden, at South Park spiller en værdifuld rolle i at slå de store spørgsmål ned til overkommelig størrelse. South Park går efter sine mål ubarmhjertigt, sparsomt no ...

Kulten af ​​grund og ateisme - dummier

Kulten af ​​grund og ateisme - dummier

Kulten af ​​grund var et forsøg på at organisere en samfundsd religion uden guder , en slags ateisme, at erstatte kristendommen under den franske revolution. Centreret om menneskeheden i stedet for guddommelighed var målet for kulten af ​​grunden menneskehedens perfektion gennem stræben efter sandhed og frihed. Som de fleste radikale sociale eksperimenter var ...

Ateismens historie - dummier

Ateismens historie - dummier

Mange tror, ​​at ateisme er en ny ide. Men religiøs vantro har faktisk en lang og fascinerende historie. Ligesom en kristendommens studerende gerne vil vide om et par ret betydelige ting, der skete for 2 000 år siden, har en person, der ønsker en bedre forståelse af ateisme, også brug for at vide hvad ...

Valg af editor

Tips til et bedre testresultat på ASVAB Mekanisk Forståelse Subtest - Dummies

Tips til et bedre testresultat på ASVAB Mekanisk Forståelse Subtest - Dummies

Hvornår du tager undervurderingen af ​​ASVAB under Mekanisk forståelse, du kan muligvis ikke vide det korrekte svar på et spørgsmål, eller du kan ikke kende det involverede mekaniske princip. Du kan kende det mekaniske princip, men husk ikke den formel, du har brug for for at komme op med det rigtige svar. Aldrig frygter - du kan stadig ...

Tager ASVAB Test: Papir eller Computeriseret? - dummies

Tager ASVAB Test: Papir eller Computeriseret? - dummies

Findes mange versioner af ASVAB'en (selvom du sandsynligvis ikke får et valg af, hvilken man skal tage), men de koger primært ned til to grundlæggende forskelle: papirudgaven og den computerbaserede version. Hver version har fordele og ulemper. Hvis du tager ASVAB som en del af elevprogrammet i gymnasiet eller ...

Hvad er underprøverne på AFQT? - dummies

Hvad er underprøverne på AFQT? - dummies

AFQT er ikke en selvstændig test. Du kan ikke bare gå ind på en rekrutterings kontor og sige, at du vil tage AFQT. Du skal tage hele ASVAB, som består af ni separate subtests. Fire af disse underprøver udgør den score, der er kendt som AFQT-scoren. AFQT-scoren afgør, om du er ...