Hjem Personlig finansiering Alternative Big Data Solutions - dummies

Alternative Big Data Solutions - dummies

Indholdsfortegnelse:

Video: The State of Modern Big Data Solutions: Are There Alternatives to Hadoop? | Webinars at Pythian 2025

Video: The State of Modern Big Data Solutions: Are There Alternatives to Hadoop? | Webinars at Pythian 2025
Anonim

Ser forbi Hadoop, kan du se alternative store dataløsninger på horisonten. Disse løsninger gør det muligt at arbejde med store data i realtid eller bruge alternative databaseteknologier til at håndtere og behandle det. Her introduceres du i real-time-behandlingsrammerne, derefter platformene for massivt parallelforarbejdning (MPP) og endelig NoSQL-databaserne, der giver dig mulighed for at arbejde med store data uden for Hadoop-miljøet.

Du bør være opmærksom på noget, der er omtalt som ACID-overholdelse, kort for A tomicity, C onsistency, I og D overholdelse af brugervenlighed. ACID-overholdelse er en standard, som garanterer nøjagtige og pålidelige databasetransaktioner.

I store dataløsninger er de fleste databasesystemer ikke AC-kompatible, men dette udgør ikke nødvendigvis et stort problem. Det skyldes, at de fleste store datasystemer bruger Decision Support Systems (DSS), at batchprocesdata før dataene læses ud. DSS er informationssystemer, der bruges til organisatorisk beslutningstøtte. Ikke-transaktionsbaseret DSS viser ingen reelle ACID-overholdelseskrav.

Beregningsrammer i realtid

Nogle gange kan du muligvis forespørge store datastrømme i realtid … og du kan bare ikke gøre denne slags ting ved hjælp af Hadoop. I disse tilfælde skal du bruge en realtidsbehandling i stedet. En realtidsbehandlingsramme er - som navnet antyder - en ramme, der kan behandle data i realtid (eller i nærheden af ​​realtid) som datastrømmene og strømmer ind i systemet. Væsentligste behandlingsrammer i realtid er antitese af de batchbehandlingsrammer, som du ser implementeret i Hadoop.

Real-time-behandlingsrammer kan klassificeres i følgende to-kategorier:

  • Rammer der sænker overhead for MapReduce-opgaver for at øge systemets samlede tidseffektivitet: Løsninger i denne kategori omfatter Apache Storm og Apache Spark til nær-real-time stream behandling.

  • Rammer der anvender innovative forespørgselsmetoder til at lette forespørgsler i realtid af store data: Nogle løsninger i denne kategori omfatter Googles Dremel, Apache Drill, Shark for Apache Hive og Cloudera's Impala.

Real-time strømforarbejdningsrammer er ret nyttige i en lang række brancher - fra aktie- og finansmarkedsanalyser til e-handelsoptimeringer og fra realtidssvindelopdagelse til optimeret orderlogistik. Uanset hvilken industri du arbejder i, hvis din virksomhed påvirkes af datastrømmer i realtid, der genereres af mennesker, maskiner eller sensorer, vil en realtidsbehandling ramme være til gavn for dig i at optimere og generere værdi for din organisation.

Platforme til massivt parallelforarbejdning (MPP)

Platforme for massiv parallelbehandling (MPP) kan bruges i stedet for MapReduce som en alternativ tilgang til distribueret databehandling. Hvis dit mål er at implementere parallelbehandling på et traditionelt datalager, så kan en MPP være den perfekte løsning.

For at forstå, hvordan MPP sammenligner med en standard MapReduce parallelbehandling ramme, overveje følgende. MPP kører parallel computing opgaver på dyre, brugerdefineret hardware, mens MapReduce kører dem på billige råvareservere. Derfor er MPP-processorkompetencerne omkostningsbegrænsende. Dette sagt, MPP er hurtigere og lettere at bruge end standard MapReduce job. Det skyldes, at MPP kan forespørges ved hjælp af Structured Query Language (SQL), men native MapReduce-jobs styres af det mere komplicerede Java-programmeringssprog.

Kendte MPP-leverandører og produkter omfatter den gamle skole Teradata platform plus nyere løsninger som EMC 2 s Greenplum DCA, HP's Vertica, IBMs Netezza og Oracle Exadata.

Introduktion af NoSQL-databaser

Traditionelle relationsdatabasestyringssystemer (RDBMS) er ikke udstyret til at håndtere store datakrav. Det skyldes, at traditionelle relationelle databaser er designet til at håndtere kun relationelle datasæt, der er konstrueret af data, der er lagret i rene rækker og kolonner, og dermed kan forespørges via Structured Query Language (SQL).

RDBM-systemer er ikke i stand til at håndtere ustrukturerede og semistrukturerede data. Desuden har RDBM-systemer simpelthen ikke de behandlings- og håndteringsfunktioner, der er nødvendige for at opfylde store datamængder og hastighedskrav.

Det er her, hvor NoSQL kommer ind. NoSQL databaser, som MongoDB, er ikke-relationelle, distribuerede databasesystemer, der var designet til at stige til den store dataudfordring. NoSQL databaser træder ud over den traditionelle relationsdatabase arkitektur og tilbyder en langt mere skalerbar, effektiv løsning.

NoSQL-systemer letter ikke-SQL-forespørgsel af ikke-relationelle eller skemafrie, semistrukturerede og ustrukturerede data. På denne måde kan NoSQL-databaser håndtere de strukturerede, semistrukturerede og ustrukturerede datakilder, der er almindelige i store datasystemer.

NoSQL tilbyder fire kategorier af ikke-relationelle databaser - grafdatabaser, dokumentdatabaser, nøgleværdisbutikker og kolonnefamilieforretninger. Da NoSQL tilbyder indbygget funktionalitet til hver af disse separate typer datastrukturer, tilbyder den meget effektiv lagrings- og hentningsfunktionalitet til de fleste typer ikke-relationelle data. Denne tilpasningsevne og effektivitet gør NoSQL til et stadig mere populært valg til håndtering af store data og for at overvinde procesudfordringer, der følger med det.

Der er noget af en debat om betydningen af ​​navnet NoSQL. Nogle hævder, at NoSQL står for Ikke kun SQL , mens andre hævder at akronym repræsenterer Ikke-SQL-databaser . Argumentet er ret komplekst, og der er ikke noget ægte snit og tørt svar.For at holde tingene enkle skal du bare tænke på NoSQL som en klasse af ikke-relationelle databasehåndteringssystemer, der ikke falder inden for frekvensområdet af RDBM-systemer, der forespørges ved hjælp af SQL.

Alternative Big Data Solutions - dummies

Valg af editor

Bygg dit eget sociale fællesskab for handel - dummies

Bygg dit eget sociale fællesskab for handel - dummies

På et velproduceret forretningswebsted, du Se ofte et link til et socialt samfundsområde, hvilket også kan føre offsite til sociale medier. Dette område er hvor kundeservice og FAQs sider lever. Du kan også finde et kunde-til-kunde-fællesskab, der tilskynder deltagelse fra dem, der besøger forretningssiden. Uanset om du vælger ...

Bedste praksis til e-mailmarkedsføring - dummies

Bedste praksis til e-mailmarkedsføring - dummies

Emnet for din sociale medievirksomhed e -mails skal være om at opfylde dine kunders interesser. Du kender dine kunder bedre end nogen. Hvis de vil have opskrifter, skal du f.eks. Have en opskrift i din e-mail. Har indhold, der vedrører din virksomhed og kundens behov. Bygg på loyalitetsforslaget og lav ...

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Bygg online indtjening gennem links på Amazon og Social Media - dummies

Sælger gennem billeder og indhold, du deler på populære sociale medier, er en fantastisk måde at nå ud til kunderne. Du kan gøre mere end blot at linke til produkter - find ud af hvordan du kan tjene penge på dit oprindelige indhold, du udgiver. Du genererer indtægter på din hjemmeside og sociale medier via annoncer og links. Hvis du producerer ...

Valg af editor

Hvordan man bruger f-distributioner i Excel - dummies

Hvordan man bruger f-distributioner i Excel - dummies

F-distributioner er sandsynlighedsfordelinger i Excel, der sammenligner forholdet i variationer af prøver trukket fra forskellige populationer. Denne sammenligning giver en konklusion om, hvorvidt afvigelserne i de underliggende populationer ligner hinanden. F. DIST: Left-tailed f-distribution sandsynlighed F. DIST-funktionen returnerer den venstre-tailed sandsynlighed for at observere et forhold på to samples 'variationer så store ...

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Sådan bruges logaritmisk skalering til Excel-dataanalyse - dummier

Logaritmer og logaritmisk skalering er værktøjer, som du vil bruge i dine Excel-diagrammer, fordi de gør det muligt for dig at gøre noget meget kraftfuldt. Ved logaritmisk skalering af din værdi-akse kan du sammenligne den relative ændring (ikke den absolutte ændring) i datareserværdier. For eksempel, sig at du vil sammenligne salget ...

Sådan bruges Flash Fill in Excel 2016 - dummies

Sådan bruges Flash Fill in Excel 2016 - dummies

Excel 2016s handy Flash Fill-funktion giver dig evnen at tage en del af de data, der er indtastet i en kolonne i et regnearktabell, og indtast bare disse data i en ny tabelkolonne ved kun at bruge et par tastetryk. Serien af ​​indgange vises i den nye kolonne, bogstaveligt talt i en flash (således ...

Valg af editor

ØGe din blog med bedre indhold - dummier

ØGe din blog med bedre indhold - dummier

Som du tænker på måder at generere buzz på din blog, du kan også forbedre kvaliteten af ​​din blog ved at fokusere på dine bogføringsteknikker. Disse tip kan give dig nogle gode promoveringsideer: Skriv om aktuelle eller kontroversielle problemer. Denne ide virker som en no-brainer, men det er nemt at glemme. Betal ...

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Opbygge et XML-sitemap og forbedre din blogs SEO-design - dummies

Søgemaskineoptimering ) handler om at øge din blogs synlighed i søgemaskiner som Google. Forbedre din WordPress blogs SEO gennem smarte design valg. Antag for eksempel at du skriver et indlæg om planlægning af en superhelt fødselsdagsfest. Du vil gerne have, at posten vises i søgeresultater, når nogen skriver "superheltefødselsdagsfest" i ...

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mærke dit WordPress-mobilwebsted med gratis blogdesign - dummies

Mest WordPress mobile plug- ins for din blogs design kan tilpasses. Du tilpasser en mobil plugin til din blog ved at ændre farver og temaer, tilføje et brugerdefineret logoikon og indstille en brugerdefineret hjemmeside. Med WPtouch mobile plug-in kan du tilføje branding som supplerer din blogs design og gør det nemmere at navigere. Før du ...