Hjem Personlig finansiering Hadoop som et forespørgselsarkiv for Cold Warehouse Data - dummies

Hadoop som et forespørgselsarkiv for Cold Warehouse Data - dummies

Video: Big data. Ciutadans sota control 2025

Video: Big data. Ciutadans sota control 2025
Anonim

En lang række undersøgelser viser, at de fleste data i et enterprise data warehouse sjældent forespørges. Databaseleverandører har reageret på sådanne observationer ved at implementere deres egne metoder til at sortere ud, hvilke data der placeres hvor.

En metode ordner dataluften til betegnelser for varmt, varmt eller koldt, hvor hot data (til tider kaldes aktiv data) bruges ofte, bruges varm data fra tid til anden, og kolde data anvendes sjældent. Den foreslåede løsning for mange leverandører er at gemme de kolde data på langsommere diske i datalagringskablerne eller at skabe klare caching-strategier for bl.a. at holde de varme data i hukommelsen.

Problemet med denne tilgang er det, selvom langsommere opbevaring er brugt, er det stadig dyrt at opbevare kolde, sjældent anvendte data i et lager. Omkostningerne her stammer fra begge hardware og software licens. Samtidig arkiveres kolde og sovende data ofte til bånd.

Denne traditionelle model for arkivering af data brydes ned, når du ønsker at søge alle kolde data på en omkostningseffektiv og forholdsvis effektiv måde - uden at skulle anmode gamle bånd med andre ord.

Hvis du ser på omkostningerne og driftsegenskaberne hos Hadoop, ser det ud til at det er meningen, at det bliver den nye backup tape. Hadoop er billig, hovedsagelig fordi Hadoop-systemer er designet til at bruge en lavere kvalitet af hardware end det, der normalt anvendes i datalagringssystemer. En anden betydelig omkostningsbesparelse er softwarelicenser.

Commercial Hadoop-distributionslicenser kræver en brøkdel af prisen på licenser til relationsdatabase-software, som er berygtede for at være dyre. Fra et operationelt perspektiv er Hadoop designet til nemt at skalere ved blot at tilføje yderligere slave noder til en eksisterende klynge. Og som slaveknude er tilføjet og datasæt vokser i volumen, har Hadops databehandlingsrammer mulighed for, at dine applikationer håndterer den øgede arbejdsbyrde problemfrit.

Hadoop repræsenterer en simpel, fleksibel og billig måde at skubbe behandling på tværs af bogstaveligt tusindvis af servere.

Med sin skalerbare og billig arkitektur synes Hadoop at være et perfekt valg til arkivering af lagerdata … bortset fra et lille spørgsmål: Det meste af IT-verdenen kører på SQL, og SQL alene spiller ikke godt med Hadoop.

Jo mere, den mere Hadoop-venlige NoSQL-bevægelse er i live og godt, men de fleste strømbrugere bruger nu SQL ved hjælp af almindelige værktøjsværktøjer, der genererer SQL-forespørgsler under emhætten - produkter som Tableau, Microsoft Excel, og IBM Cognos BI.

Det er rigtigt, at Hadoop-økosystemet indeholder Hive, men Hive understøtter kun en delmængde af SQL, og selvom resultaterne forbedres (sammen med SQL-support), er det ikke så hurtigt at svare på mindre forespørgsler, som relationelle systemer er. For nylig har der været store fremskridt omkring SQL-adgang til Hadoop, som har banet vejen for Hadoop at blive den nye destination for online-datalagringsarkiver.

Afhængigt af Hadoop-sælgeren bliver SQL-programmer (eller SQL-lignende) API'er tilgængelige, så de mere almindelige rapporterings- og analyseværktøjer til rådighed for hylde kan problemfrit udstede SQL, der udføres på data, der er gemt i Hadoop. For eksempel har IBM sin Big SQL API, Cloudera har Impala, og Hive selv, via Hortonworks Stinger-initiativet, bliver mere og mere SQL-kompatibel.

Selvom der er forskellige synspunkter (nogle har til formål at forbedre Hive, nogle, for at udvide Hive og andre, for at give et alternativ), forsøger alle disse løsninger at løse to problemer: MapReduce er en dårlig løsning til at udføre mindre forespørgsler, og SQL-adgang er - indtil nu - nøglen til at gøre det muligt for it-arbejdere at bruge deres eksisterende SQL-færdigheder til at få værdi ud af data, der er gemt i Hadoop.

Hadoop som et forespørgselsarkiv for Cold Warehouse Data - dummies

Valg af editor

Financial Freedom Tilbydes af Bitcoin - Dummies

Financial Freedom Tilbydes af Bitcoin - Dummies

Bitcoin tilbyder sine brugere mange fordele, men måske er den vigtigste en hidtil uset niveau af frihed. Og denne frihed kommer på mange forskellige måder: finansiel frihed fra at være nødt til at stole på eksisterende infrastruktur, men også den mentale frihed til at være i kontrol med egne midler og teknologi. Flyt mod ...

Indsætte lydfiler i et PowerPoint Slide-dummies

Indsætte lydfiler i et PowerPoint Slide-dummies

For at afspille lyd i en PowerPoint 2007-præsentation, indsætter du en lydfil i et dias. Hvordan og når lyden høres, er op til dig. Du kan gøre lydfilen automatisk afspilning, når diaset vises eller begynder at afspille, når du klikker. Før du indsætter din lydfil på et dias, spørg ...

Er dit Excel Dashboard eller rapport nøjagtigt? - dummies

Er dit Excel Dashboard eller rapport nøjagtigt? - dummies

Intet dræber et Excel-dashboard eller rapporterer hurtigere end den opfattelse, at dens data er unøjagtige. Inden du sender dit færdige Excel dashboard eller rapport, skal du sørge for at kontrollere din rapporteringsmekanisme. Dit omdømme er på linjen! Her er tre faktorer, der fastslår, at et dashboard er korrekt: Overensstemmelse med autoritative ...

Valg af editor

Annoncer på Facebook - dummies

Annoncer på Facebook - dummies

Facebook er gratis for dig at bruge. I stedet for at opkræve sine brugere penge betaler Facebook regningerne ved at sælge annoncer. Disse annoncer vises derefter til dig. Så på en måde ser du på annoncer, hvordan du betaler for at bruge Facebook. Facebook har en række forskellige måder, hvorpå det vælger hvilke annoncer der skal ...

Automatisk fotoalbum på Facebook - dummies

Automatisk fotoalbum på Facebook - dummies

Det meste af tiden, hvor du laver et fotoalbum i Facebook, du bestemmer hvad du skal title det og hvilke fotos går ind i det. Der er nogle få undtagelser fra denne regel. Facebook samler visse typer billeder i album på dine vegne. Vigtigste, hver gang du ændrer dit profilbillede eller omslagsfoto, ...

Hvem kan se ting på din Facebook-tidslinje? - dummies

Hvem kan se ting på din Facebook-tidslinje? - dummies

Der er forskel på at tilføje ting til dit Facebook-tidslinje, som de foregående indstillinger kontrollerer, og blot kigger på dit tidslinje, som indstillingerne i dette afsnit styrer. Tre indstillinger her vedrører, hvad folk ser, når de ser på din profil. Gennemgå, hvad andre mennesker ser på din tidslinje. Dette er ikke så meget en indstilling ...

Valg af editor

Beskyt Excel-regneark og låseceller i Office 2011 til Mac-dummies

Beskyt Excel-regneark og låseceller i Office 2011 til Mac-dummies

, Når du laver formularer I Excel 2011 til Mac skifter du ofte regnearkbeskyttelse til og fra. Du skal slukke for regnearkbeskyttelse, når du vil opbygge en formular. Slukning af arkbeskyttelse gør det muligt at bruge formularkontrolerne på fanen Udvikler i båndet og giver dig mulighed for at redigere regnearket ...

Arbejder med Excel-arktyper i Office 2011 til Mac-dummies

Arbejder med Excel-arktyper i Office 2011 til Mac-dummies

Hvis du arbejder i Office 2011 til Mac, finder du, at Excel-ark kan være generelle eller dedikeret til et bestemt formål. Du behøver ikke være ekspert i Excel 2011 til Mac til at bruge de forskellige arktyper, men du bør kende deres navne og hver arktype formål. Du kan blande forskellige ...

Udfyldning af et formular med en grafik i Office 2011 til Mac - dummies

Udfyldning af et formular med en grafik i Office 2011 til Mac - dummies

I Office 2011 for Mac-programmer, former kan fyldes med et billede fra en fil eller fyldes med en af ​​flere teksturer fra en menu ved hjælp af fanen Billede eller tekstur i dialogboksen Formatformat. Mønstre er geometriske design, der bruger to farver, og de er tilgængelige fra fanen Mønster i ...