Hjem Personlig finansiering Dokument Databaser i et Big Data Environment - dummies

Dokument Databaser i et Big Data Environment - dummies

Indholdsfortegnelse:

Video: Chris watts documentary (FULL MOVIE) 2025

Video: Chris watts documentary (FULL MOVIE) 2025
Anonim

Du finder to slags dokumentdatabaser til store dataprojekter. Den ene er ofte beskrevet som et lager for fuld dokumentformat indhold. Den anden er en database til lagring af dokumentkomponenter til permanent lagring som en statisk enhed eller til dynamisk samling af dele af et dokument. Dokumenternes struktur og deres dele leveres af JavaScript Object Notation (JSON) og / eller Binary JSON (BSON).

Dokumentdatabaser er mest nyttige, når du skal producere mange rapporter, og de skal dynamisk samles fra elementer, der ændrer sig ofte.

JSON er et data-udvekslingsformat baseret på en delmængde af JavaScript-programmeringssproget. Selv om det er en del af et programmeringssprog, er det tekstmæssigt og meget nemt at læse og skrive. Det har også den fordel, at det er nemt at få computere til at håndtere. Der findes to grundlæggende strukturer i JSON, og de understøttes af mange, om ikke alle, moderne programmeringssprog.

Den første grundlæggende struktur er en samling af navn / værdi par, og de er repræsenteret programmatisk som objekter, optegnelser, nøgleord og så videre. Den anden grundlæggende struktur er en ordnet liste over værdier, og de er repræsenteret programmatisk som arrayer, lister eller sekvenser. BSON er en binær serialisering af JSON strukturer designet til at øge ydeevnen og skalerbarheden.

MongoDB for store data

MongoDB er projektnavnet til "hu (mongo) us database" -systemet. Det opretholdes af et firma kaldet 10gen som open source og er frit tilgængelig under GNU AGPL v3. 0 licens. Kommercielle licenser med fuld support er tilgængelige fra 10gen.

MongoDB består af databaser indeholdende "samlinger. "En samling består af" dokumenter ", og hvert dokument er sammensat af felter. Ligesom i relationelle databaser kan du indeksere en samling.

Hvis du gør det, øges dataudviklingen. I modsætning til andre databaser returnerer MongoDB imidlertid noget, der hedder en "markør", som tjener som en peger på dataene. Dette er en meget nyttig funktion, fordi den giver mulighed for at tælle eller klassificere dataene uden at udvinde det. MongoDB støtter indbygget BSON, den binære implementering af JSON-dokumenter.

MongoDB er også et økosystem bestående af følgende elementer:

  • Højtilgængelighed og replikeringstjenester til skalering på tværs af lokale og store netværk.

  • Et gitterbaseret filsystem, der gør det muligt at lagre store objekter ved at dele dem mellem flere dokumenter.

  • MapReduce for at understøtte analyser og aggregering af forskellige samlinger / dokumenter.

  • En sharding-tjeneste, der distribuerer en enkelt database på tværs af en klynge af servere i en enkelt eller i flere datacentre. Tjenesten drives af en shard-nøgle. Shard-tasten bruges til at distribuere dokumenter intelligent på tværs af flere forekomster.

  • En forespørgselsservice, der understøtter ad hoc-forespørgsler, distribuerede forespørgsler og fuldtekstsøgning.

Effektive MongoDB implementeringer omfatter

  • Styring af indhold i høj volumen

  • Social networking

  • Arkivering

  • Realtidsanalyse

CouchDB til store data

En anden meget populær ikke-relationel database er CouchDB. Som MongoDB er CouchDB open source. Den opretholdes af Apache Software Foundation og stilles til rådighed under Apache License v2. 0. I modsætning til MongoDB blev CouchDB designet til at efterligne nettet i alle henseender.

CouchDB er f.eks. Elastisk til netværksudfald og vil fortsætte med at fungere smukt i områder, hvor netværksforbindelsen er plettet. Det er også hjemme på en smartphone eller i et datacenter. Det hele kommer med et par trade-offs. På grund af den underliggende webmimicry er CouchDB høj latens, hvilket resulterer i en præference for lokal datalagring.

CouchDB er ikke velegnet til mindre implementeringer. Du skal afgøre, om disse afvejninger kan ignoreres, når du begynder din store dataimplementering.

CouchDB databaser består af dokumenter, der består af felter og vedhæftede filer samt en "beskrivelse" af dokumentet i form af metadata, som automatisk vedligeholdes af systemet. Den underliggende teknologi har alle ACID-muligheder. Fordelen i CouchDB over relational er, at dataene er pakket og klar til manipulation eller opbevaring i stedet for spredt over rækker og tabeller.

CouchDB er også et økosystem med følgende muligheder:

  • Komprimering: Databaserne komprimeres for at eliminere spildt plads, når et vist tomrum er nået. Dette hjælper ydeevne og effektivitet for vedholdenhed.

  • Vis model: En mekanisme til filtrering, organisering og rapportering af data ved hjælp af et sæt definitioner, der er gemt som dokumenter i databasen. Du finder et et-til-mange forhold mellem databaser til visninger, så du kan oprette mange forskellige måder at repræsentere de data, du har "skåret og krydset. "

  • Replikation og distribuerede tjenester: Dokumentlager er designet til at give tovejsreplikation. Delvise replikaer kan opretholdes for at understøtte kriteriebaseret distribution eller migration til enheder med begrænset tilslutning. Native replikation er peer-baseret, men du kan implementere Master / Slave, Master / Master og andre typer replikationsmodaliteter.

Effektive CouchDB implementeringer inkluderer

  • Styring af høj lydstyrke

  • Skalering fra smartphone til datacenter

  • Programmer med begrænset eller langsom netværkstilslutning

Dokument Databaser i et Big Data Environment - dummies

Valg af editor

Sådan tager du et portræt ved brug af kort belysning - dummier

Sådan tager du et portræt ved brug af kort belysning - dummier

Når du bruger kort belysning, skal du dreje dit motivs hoved, så hans eller hendes ansigt ikke stirrer direkte ind i kameraet. Den vigtigste lyskilde i kort belysning kommer fra den side af ansigtet rettet væk fra kameraet. Nogle gange betegnes smal belysning, er kort belysning en værdifuld belysning ...

Sådan får du bedre feriebilleder - dummies

Sådan får du bedre feriebilleder - dummies

Et par enkle tricks og retningslinjer kan forbedre dine feriebilleder eller lave dine rejsebilleder er mere unikke. Når du rejser med dit digitalkamera, vil du jo tage billeder, der fortæller historien om din rejse, enten at dele dine oplevelser med andre eller at bringe dine egne minder tilbage fra ...

Hvordan man tager digitale billeder i tidlig morgen eller sent på eftermiddagen - dummies

Hvordan man tager digitale billeder i tidlig morgen eller sent på eftermiddagen - dummies

Tiden af dagen påvirker, hvordan du kan tage billeder med dit digitalkamera. Den tidlige morgen og den sene eftermiddags sol kræver en vis tilgang til billedoptagelse. Morgen og eftermiddagssol er nær horisonten og skaber fotografiske skygger, du kan drage fordel af.

Valg af editor

Elektronik: 555 Timer som en Astable Multivibrator - Dummies

Elektronik: 555 Timer som en Astable Multivibrator - Dummies

555 Kan opføre sig som en astabil multivibrator eller oscillator. Ved at forbinde komponenter til chippen i din elektronik, kan du konfigurere 555 til at producere en kontinuerlig serie af spændingsimpulser, som automatisk veksler mellem lavt (0 volt) og højt (den positive forsyningsspænding, VCC). Du kan beregne de lave og høje tidsintervaller ...

Elektronisk projektplan Trin 3: Prototype dine kredsløbsdummier

Elektronisk projektplan Trin 3: Prototype dine kredsløbsdummier

Inden du forpligter dit elektroniske kredsløb til en permanent printkort, vil du gerne sørge for at det virker. Den nemmeste måde at gøre det på er at opbygge kredsløbet på et loddefrit brødbræt. Det loddefrie brødbræt giver dig mulighed for hurtigt at samle komponenterne i dit kredsløb uden at lodde noget. I stedet skubber du bare baren ...

Elektronisk projektplan Trin 2: Design kretsdummierne

Elektronisk projektplan Trin 2: Design kretsdummierne

, Når du har en ide om en elektronisk projekt, det næste skridt er at designe et kredsløb, som opfylder projektets behov. I første omgang finder du det meget svært at designe dine egne kredsløb, så du kan vende dig til bøger eller til internettet for at finde andres kredsløbsdesign. Med en smule Google ...

Valg af editor

Læge assistent eksamen praksis sundhed vedligeholdelse og medicinsk etik spørgsmål - dummies

Læge assistent eksamen praksis sundhed vedligeholdelse og medicinsk etik spørgsmål - dummies

Disse praksis spørgsmål er ens til de egentlige spørgsmål, du måtte se på den lægeassistenteksamen (PANCE) eksamen, der har at gøre med forebyggende medicin, epidemiologi, vold i hjemmet og etik. Eksempel PANCE Spørgsmål Du ser en 19-årig kvinde, der har været seksuelt aktiv i de sidste to år. Du bruger meget af kontoret ...

Lægeassistenteksamen Øvelsesspørgsmål om fordøjelsessystemet - dummies

Lægeassistenteksamen Øvelsesspørgsmål om fordøjelsessystemet - dummies

En masse patologi vedrører fordøjelseskanalen system og du kan satse der vil være spørgsmål om dem på Lægeassistenteksamen (kendt som PANCE). Her er nogle livlige spørgsmål om GI-systemet. Eksempel PANCE Spørgsmål Hvilket af følgende udsagn angående tyktarmscancer screening er korrekt? ? (A) Efter alderen af ​​...

Lægeassistenteksamen: skulderfrakturer - dummies

Lægeassistenteksamen: skulderfrakturer - dummies

Stort set alle ved, hvordan det er at gøre ondt i skulderen eller overdelen arm, så det er vigtigt at kende til lægeassistenteksamen (PANCE). At gøre meget af noget kan være svært, især hvis smerten eller skaden påvirker den dominerende arm. Du bør vide om forskellige forskydninger af skulder og overarm, nemlig ...