Video: Essential Scale-Out Computing by James Cuff 2025
Der findes mange kombinationer af implementerings- og leveringsmodeller til store data i skyen. For eksempel kan du bruge en offentlig sky IaaS eller en privat sky IaaS. Så hvad betyder det for store data, og hvorfor er skyen en god ide til det? Nå, store data kræver distribuerede klynger af beregningskraft, hvilket er hvordan skyen er bygget.
Faktisk gør en række cloud-karakteristika det til en vigtig del af det store datakosystem:
-
Skalerbarhed: Skalbarhed med hensyn til hardware refererer til evnen til at gå fra små til store mængder processorkraft med samme arkitektur. Med hensyn til software refererer det til konsistensen af ydeevne pr. Enhedsenhed, som hardware ressourcer øges. Skyen kan skala til store datamængder.
Distribueret computing, en integreret del af skymodellen, arbejder virkelig på en "splittelse og erobre" -plan. Så hvis du har enorme mængder data, kan de deles på tværs af sky servere. En vigtig egenskab ved IaaS er, at den kan dynamisk skalere. Det betyder, at hvis du lukker mere brug for ressourcer end forventet, kan du få dem. Dette binder ind i begrebet elasticitet.
-
Elasticitet: Elasticitet refererer til evnen til at udvide eller reducere databehandlingsbehovet i realtid baseret på behov. En af fordelene ved skyen er, at kunderne har potentiale til at få adgang til så meget af en tjeneste som de har brug for. Dette kan være nyttigt til store dataprojekter, hvor du muligvis skal udvide mængden af computerressourcer, du har brug for til at håndtere dataene.
-
Ressource pooling: Cloud arkitekturer muliggør effektiv oprettelse af grupper af delte ressourcer, der gør skyen økonomisk rentabel.
-
Med selvbetjening kan brugeren af en cloud ressource bruge en browser eller en portalgrænseflade til at erhverve de nødvendige ressourcer, f.eks. At køre et stort prædiktivt model. Dette er dramatisk anderledes end, hvordan du kan få ressourcer fra et datacenter, hvor du skal anmode om ressourcerne fra it-operationer. Ofte lave upfront-omkostninger:
-
Hvis du bruger en cloud-udbyder, kan opkøbsudgifter ofte reduceres, fordi du ikke køber store mængder hardware eller udlejer nyt rum til at håndtere dine store data. Ved at udnytte de stordriftsfordele, der er forbundet med skymiljøer, kan skyen se attraktiv ud. Pay as you go:
-
En typisk faktureringsindstilling til en cloud-udbyder er Pay as You Go, hvilket betyder at du faktureres for de anvendte ressourcer baseret på eksempelprisfastsættelse.Dette kan være nyttigt, hvis du ikke er sikker på, hvilke ressourcer du har brug for til dit store dataprojekt. Fejltolerance:
-
Cloud-tjenesteudbydere bør have fejltolerance indbygget i deres arkitektur, hvilket giver uafbrudte tjenester på trods af, at et eller flere af systemets komponenter ikke fungerer. Det er klart, at skyens natur er det ideelle computermiljø for store data. Så hvordan kan du bruge store data sammen med skyen? Her er nogle eksempler:
IaaS i en offentlig sky:
-
I dette scenario bruger du en offentlig cloud-udbyder infrastruktur til dine store datatjenester, fordi du ikke vil bruge din egen fysiske infrastruktur. IaaS kan skabe oprettelsen af virtuelle maskiner med næsten grænseløs opbevaring og beregning af strøm. Du kan vælge det operativsystem du ønsker, og du har fleksibilitet til dynamisk at skala miljøet for at opfylde dine behov. PaaS i en privat sky:
-
PaaS er en hel infrastrukturpakke, så den kan bruges til at designe, implementere og implementere applikationer og tjenester i et offentligt eller privat skymiljø. PaaS gør det muligt for en organisation at udnytte centrale middleware-tjenester uden at skulle håndtere kompleksiteten ved at styre individuelle hardware- og softwareelementer. PaaS-leverandører begynder at indarbejde store datateknologier som Hadoop og MapReduce i deres PaaS-tilbud. For eksempel kan du bygge en specialiseret applikation til analyse af store mængder medicinske data. Ansøgningen ville gøre brug af både realtid og ikke-realtidsdata. Det vil kræve Hadoop og MapReduce til opbevaring og forarbejdning.
SaaS i en hybrid cloud:
-
Her kan du analysere "kundens stemme" -data fra flere kanaler. Mange virksomheder er blevet klar over, at en af de vigtigste datakilder er, hvad kunden tænker og siger om deres firma. At få adgang til kundens data kan give uvurderlig indsigt i adfærd og handlinger. I stigende grad er kunderne "vocalizing" på offentlige websteder. Værdien af kundernes input kan forbedres betydeligt ved at inkorporere disse offentlige data i din analyse.