Hjem Personlig finansiering Hadoop som et forespørgselsarkiv for Cold Warehouse Data - dummies

Hadoop som et forespørgselsarkiv for Cold Warehouse Data - dummies

Video: Big data. Ciutadans sota control 2024

Video: Big data. Ciutadans sota control 2024
Anonim

En lang række undersøgelser viser, at de fleste data i et enterprise data warehouse sjældent forespørges. Databaseleverandører har reageret på sådanne observationer ved at implementere deres egne metoder til at sortere ud, hvilke data der placeres hvor.

En metode ordner dataluften til betegnelser for varmt, varmt eller koldt, hvor hot data (til tider kaldes aktiv data) bruges ofte, bruges varm data fra tid til anden, og kolde data anvendes sjældent. Den foreslåede løsning for mange leverandører er at gemme de kolde data på langsommere diske i datalagringskablerne eller at skabe klare caching-strategier for bl.a. at holde de varme data i hukommelsen.

Problemet med denne tilgang er det, selvom langsommere opbevaring er brugt, er det stadig dyrt at opbevare kolde, sjældent anvendte data i et lager. Omkostningerne her stammer fra begge hardware og software licens. Samtidig arkiveres kolde og sovende data ofte til bånd.

Denne traditionelle model for arkivering af data brydes ned, når du ønsker at søge alle kolde data på en omkostningseffektiv og forholdsvis effektiv måde - uden at skulle anmode gamle bånd med andre ord.

Hvis du ser på omkostningerne og driftsegenskaberne hos Hadoop, ser det ud til at det er meningen, at det bliver den nye backup tape. Hadoop er billig, hovedsagelig fordi Hadoop-systemer er designet til at bruge en lavere kvalitet af hardware end det, der normalt anvendes i datalagringssystemer. En anden betydelig omkostningsbesparelse er softwarelicenser.

Commercial Hadoop-distributionslicenser kræver en brøkdel af prisen på licenser til relationsdatabase-software, som er berygtede for at være dyre. Fra et operationelt perspektiv er Hadoop designet til nemt at skalere ved blot at tilføje yderligere slave noder til en eksisterende klynge. Og som slaveknude er tilføjet og datasæt vokser i volumen, har Hadops databehandlingsrammer mulighed for, at dine applikationer håndterer den øgede arbejdsbyrde problemfrit.

Hadoop repræsenterer en simpel, fleksibel og billig måde at skubbe behandling på tværs af bogstaveligt tusindvis af servere.

Med sin skalerbare og billig arkitektur synes Hadoop at være et perfekt valg til arkivering af lagerdata … bortset fra et lille spørgsmål: Det meste af IT-verdenen kører på SQL, og SQL alene spiller ikke godt med Hadoop.

Jo mere, den mere Hadoop-venlige NoSQL-bevægelse er i live og godt, men de fleste strømbrugere bruger nu SQL ved hjælp af almindelige værktøjsværktøjer, der genererer SQL-forespørgsler under emhætten - produkter som Tableau, Microsoft Excel, og IBM Cognos BI.

Det er rigtigt, at Hadoop-økosystemet indeholder Hive, men Hive understøtter kun en delmængde af SQL, og selvom resultaterne forbedres (sammen med SQL-support), er det ikke så hurtigt at svare på mindre forespørgsler, som relationelle systemer er. For nylig har der været store fremskridt omkring SQL-adgang til Hadoop, som har banet vejen for Hadoop at blive den nye destination for online-datalagringsarkiver.

Afhængigt af Hadoop-sælgeren bliver SQL-programmer (eller SQL-lignende) API'er tilgængelige, så de mere almindelige rapporterings- og analyseværktøjer til rådighed for hylde kan problemfrit udstede SQL, der udføres på data, der er gemt i Hadoop. For eksempel har IBM sin Big SQL API, Cloudera har Impala, og Hive selv, via Hortonworks Stinger-initiativet, bliver mere og mere SQL-kompatibel.

Selvom der er forskellige synspunkter (nogle har til formål at forbedre Hive, nogle, for at udvide Hive og andre, for at give et alternativ), forsøger alle disse løsninger at løse to problemer: MapReduce er en dårlig løsning til at udføre mindre forespørgsler, og SQL-adgang er - indtil nu - nøglen til at gøre det muligt for it-arbejdere at bruge deres eksisterende SQL-færdigheder til at få værdi ud af data, der er gemt i Hadoop.

Hadoop som et forespørgselsarkiv for Cold Warehouse Data - dummies

Valg af editor

Hvad er nyt i Microsoft Word 2016? - dummies

Hvad er nyt i Microsoft Word 2016? - dummies

Udgivelsen af ​​Microsoft Word i 2016 er funktionel pakket og kan prale af evnen til at forenkle arbejdsgange og forene arbejdsgrupper. Hvad det betyder for dig er, at det er et meget lettere produkt at bruge i forhold til tidligere versioner. Med funktionelle ændringer, der er indbygget i knapper og faner af Word 2016s båndformede proceslinje, har den ...

Word 2010 Tastaturgenveje - Dummies

Word 2010 Tastaturgenveje - Dummies

Word 2010 tilbyder en række nyttige tastaturgenveje til hurtigt at udføre opgaver. Her er nogle genveje til almindelig Word-formatering, redigering og fil- og dokumentopgaver. Word 2010 Formatering Genveje Kommando Genvej Bånd Placering Fed Ctrl + B Startside Fane, Skrifttype Gruppe Kursiv Ctrl + I Startside, Skriftgruppe Understrege Ctrl + U Startside Fane, Skriftgruppe Center Ctrl + E ...

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 For Dummies Cheat Sheet - dummies

Word 2007 ser anderledes ud, men tilbyder stadig de praktiske Word hæfteklammer som f.eks. tastaturgenveje til at hjælpe dig med at oprette, formatere, indsætte ting i og flytte gennem dine Word-dokumenter. Og Word 2007 tilbyder også et par nye funktioner, der hjælper dig med at håndtere din tekstbehandling med lethed.

Valg af editor

ASVAB Montering af objekter Subtest: Shapes - dummies

ASVAB Montering af objekter Subtest: Shapes - dummies

Mange mennesker kan finde den anden type montering af objekter problem på ASVAB lettere end forbindelsesproblemerne. Denne type problem er meget som et puslespil, medmindre det ikke resulterer i et billede af Frihedsgudinden eller et kort over USA. Der er også en heck of a ...

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

ASVAB Aritmetisk Reasoning Subtest: Viser Sammenligninger med Ratioer - Dummies

Du skal vide, hvordan du arbejde med forhold for den aritmetiske begrundelse subtest af ASVAB. Et forhold viser et forhold mellem to ting. For eksempel, hvis Margaret investerede i hendes tatoveringslokale i forholdet 2: 1 (eller 2 til 1) til hendes forretningspartner Julie, satte Margaret $ 2 for hver ...

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

ASVAB Auto & Shop Information Undertest: Drilling, Punching og Gouging Tools - dummies

Nej, det handler ikke om hånd-til-hånd kamp træning fra grundlæggende træning. Imidlertid vil ASVAB teste din viden om, hvor praktisk du er med boring, stansning og gouging-værktøjer. Masters i butikskunst gør ofte huller i det materiale, de arbejder med for at opbygge det perfekte fuglehus (eller hvad de arbejder på). ...

Valg af editor

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

EMT-eksamen: Sådan arbejder du med et team under et nødsituation

Arbejder helt alene som en EMT er ekstremt sjælden. Selv under disse omstændigheder vil du sandsynligvis interagere med andre sundhedspleje- og offentlige sikkerhedsudbydere på et eller andet tidspunkt under et opkald. Mere sandsynligt vil du fungere som medlem af et hold. Det kan være en enkelt partner, et brandmandsbesætningsmedlem eller endda en nødsituation ...

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

EMT-eksamen: Sådan dokumenterer du dine tilfælde - dummier

Til eksamen og i feltet EMT er forpligtet til at dokumentere, hvad du observerede om patienten og miljøet, de resultater, du vurderede, den omhu du gav, og eventuelle ændringer i patientens tilstand, mens du var i din pleje. Dokumentation kan ske enten på papirformularer eller elektronisk med en computer, bærbar computer, ...