Administrere virtualisering til store data - dummier

Video: VMware Tutorial for Beginners | VMware Administration Tutorial | VMware Admin Online Training Demo 2024

Virtualisering adskiller ressourcer og tjenester fra den underliggende fysisk leveringsmiljø, så du kan oprette mange virtuelle systemer inden for et enkelt fysisk system. En af de primære årsager til, at virksomheder har implementeret virtualisering, er at forbedre effektiviteten af behandlingen af en forskellig blanding af arbejdsbyrder.

Den store datahypervisor

I en ideel verden vil du ikke bekymre dig om de underliggende operativsystem og den fysiske hardware. En hypervisor er teknologien ansvarlig for at sikre, at ressourcedeling foregår på en ordnet og repeterbar måde.

Hypervisoren sidder på de laveste niveauer af hardware miljøet og bruger et tyndt lag kode for at muliggøre dynamisk ressourcedeling. Hypervisoren gør det tilsyneladende, at hvert operativsystem har de fysiske ressourcer til sig selv.

I verden af store data må du muligvis støtte mange forskellige driftsmiljøer. Hypervisoren bliver en ideel leveringsmekanisme til teknologikomponenterne i den store datastabel. Hypervisoren lader dig vise den samme applikation på mange systemer uden at skulle fysisk kopiere applikationen til hvert system.

Som en ekstra fordel kan den på grund af hypervisorarkitekturen indlæse forskellige operativsystemer, som om de kun var en anden applikation. Så hypervisor er en meget praktisk måde at få tingene virtualiseret hurtigt og effektivt på.

Gæsteoperativsystemerne er de operativsystemer, der kører på de virtuelle maskiner. Med virtualiseringsteknologi kan du oprette hypervisoren for at dele den fysiske computers ressourcer. Ressourcer kan deles mellem 50/50 eller 80/20 mellem to gæsteoperativsystemer.

Skønheden i dette arrangement er, at hypervisoren gør alt tungt løft. Gæsteoperativsystemet er ligeglad med, at det kører i en virtuel partition; Den mener, at den har en computer til sig selv.

Du finder grundlæggende to typer hypervisorer:

Type 1 hypervisors kører direkte på hardwareplatformen. De opnår højere effektivitet, fordi de kører direkte på platformen.
Type 2 hypervisors kører på værtsoperativsystemet. De bruges ofte, når der er et behov for at understøtte en bred vifte af I / O-enheder.

Abstraktion og stor data virtualisering

For IT-ressourcer og tjenester, der skal virtualiseres, adskilles de fra det underliggende fysiske leveringsmiljø.Betegnelsen for denne adskillelsesret kaldes abstraktion. Abstraktion er et nøglekoncept i store data. MapReduce og Hadoop distribueres computermiljøer, hvor alt er abstraheret. Detaljerne er abstraheret, så udvikleren eller analytikeren ikke behøver at være bekymret over, hvor dataelementerne er placeret.

Abstraktion minimerer kompleksiteten af noget ved at gemme detaljerne og kun give de relevante oplysninger. For eksempel, hvis du skulle hente nogen, som du aldrig har mødt før, kan han måske fortælle dig, hvor han skal møde ham, og hvad han vil have på. Han behøver ikke at fortælle dig, hvor han blev født, hvor mange penge han har i banken, hans fødselsdato osv.

Det er ideen med abstraktion - det drejer sig om at levere en specifikation på højt niveau i stedet for at gå ind i masser af detaljer om, hvordan noget virker.

Implementér virtualisering til at arbejde med store data

Virtualisering hjælper gør dit IT-miljø smart nok til at håndtere stor dataanalyse. Ved at optimere alle elementer i din infrastruktur, herunder hardware, software og opbevaring, får du den effektivitet, der er nødvendig for at behandle og styre store mængder struktureret og ustruktureret data. Med store data skal du få adgang til, administrere og analysere strukturerede og ustrukturerede data i et distribueret miljø.

Store data forudsætter distribution. I praksis vil enhver form for MapReduce fungere bedre i et virtualiseret miljø. Du har brug for evnen til at flytte arbejdsbyrder rundt på baggrund af krav til beregning af strøm og lagring.

Virtualisering vil gøre det muligt for dig at løse større problemer, der endnu ikke er scoped. Du kan ikke vide på forhånd, hvor hurtigt du skal skala.

Virtualisering gør det muligt for dig at understøtte en række operative store datalagre. For eksempel kan en grafdatabase spindes op som et billede.

Den mest direkte fordel ved virtualisering er at sikre, at MapReduce-motorer fungerer bedre. Virtualisering vil resultere i bedre skala og ydeevne for MapReduce. Hver af kort- og reduktionsopgaverne skal udføres uafhængigt. Hvis MapReduce-motoren er paralleliseret og konfigureret til at køre i et virtuelt miljø, kan du reducere administrationsomkostningerne og tillade udvidelser og sammentrækninger i opgavebelastningen.

MapReduce er i sig selv parallel og distribueret. Ved at indkapsle MapReduce-motoren i en virtuel container, kan du køre det, du har brug for, når du har brug for det. Med virtualisering øger du din udnyttelse af de aktiver, du allerede har betalt, ved at gøre dem til generiske puljer af ressourcer.