Indholdsfortegnelse:
- Amazon's Public Elastic Compute Cloud til store data
- Googles store datatjenester
- Microsoft Azure til store data
- OpenStack til store data
Video: The Third Industrial Revolution: A Radical New Sharing Economy 2025
Cloud-udbydere kommer i alle former og størrelser og tilbyder mange forskellige produkter til store data. Nogle er husstandsnavne, mens andre for nylig er på vej. Nogle af de cloud-udbydere, der tilbyder IaaS-tjenester, der kan bruges til store data, omfatter Amazon. com, AT & T, GoGrid, Joyent, Rackspace, IBM og Verizon / Terremark.
Amazon's Public Elastic Compute Cloud til store data
I øjeblikket er en af de mest profilerede IaaS-udbydere Amazon Web Services med sin Elastic Compute Cloud (Amazon EC2). Amazon startede ikke med en vision om at opbygge en stor infrastrukturvirksomhed.
I stedet byggede virksomheden en massiv infrastruktur til støtte for sin egen detailvirksomhed og opdagede, at dens ressourcer var underudnyttet. I stedet for at lade dette aktiv sidde tomgang, besluttede det at udnytte denne ressource, mens den blev tilføjet til bundlinjen. Amazonas EC2-service blev lanceret i 2006 og fortsætter med at udvikle sig.
Amazon EC2 tilbyder skalerbarhed under brugerens kontrol, hvor brugeren betaler for ressourcer pr. Time. Anvendelsen af udtrykket elastisk i betegnelsen af Amazons EC2 er signifikant. Her refererer elasticitet til den evne, som EC2-brugerne skal øge eller formindske de infrastrukturressourcer, der er tildelt for at opfylde deres behov.
Amazon tilbyder også andre store datatjenester til kunderne i sin Amazon web Services portefølje. Disse omfatter følgende:
-
Amazon Elastic MapReduce: Målrettet til behandling af store mængder data. Elastic MapReduce udnytter en hosted Hadoop-ramme, der kører på EC2 og Amazon Simple Storage Service (Amazon S3). Brugere kan nu køre HBase.
-
Amazon DynamoDB: En fuldt administreret, ikke kun SQL (NoSQL) database service. DynamoDB er en fejltolerant, yderst tilgængelig datalagringstjeneste, der tilbyder selvbetjening, gennemsigtig skalerbarhed og enkel administration. Det implementeres på SSD'er (solid state disks) for større pålidelighed og høj ydeevne.
-
Amazon Simple Storage Service (S3): En web-skala service designet til at gemme enhver mængde data. Styrken i sit designcenter er ydeevne og skalerbarhed, så det er ikke så længe som andre datalager. Data gemmes i "buckets", og du kan vælge en eller flere globale regioner til fysisk opbevaring for at tage hensyn til latens eller regulatoriske behov.
-
Amazon High Performance Computing: Afstemt til specialiserede opgaver, denne service giver lavt latensindstillede computere med høj ydeevne. HPC er oftest brugt af videnskabsfolk og akademikere i mainstream på grund af tilbuddet fra Amazon og andre HPC-udbydere.Amazon HPC-klynger er specialbygget til specifikke arbejdsbyrder og kan omkonfigureres nemt til nye opgaver.
-
Amazon RedShift: RedShift er tilgængelig i begrænset forhåndsvisning, og er en petabyte-skala datalagringstjeneste bygget på en skalerbar MPP-arkitektur. Administreret af Amazon, tilbyder det et sikkert og pålideligt alternativ til interne data warehouses og er kompatibelt med flere populære business intelligence værktøjer.
Googles store datatjenester
Google, internet-søgegiganten, tilbyder også en række sky-tjenester rettet mod store data. Disse omfatter følgende:
-
Google Compute Engine: En cloudbaseret kapacitet til virtuel maskincomputering tilbyder Google Compute Engine et sikkert, fleksibelt computermiljø fra energieffektive datacentre. Google tilbyder også arbejdsbestyringsløsninger fra flere teknologipartnere, der har optimeret deres produkter til Google Compute Engine.
-
Google Big Query: Gør det muligt at køre SQL-lignende forespørgsler med høj hastighed mod store datasæt af potentielt milliarder af rækker. Selvom det er godt at forespørge data, kan data ikke ændres, når det er i det. Overvej Google Big Query en slags OLAP-system (Online Analytical Processing) til store data. Det er godt for ad hoc rapportering eller sonderende analyse.
-
Google Prediction API: Prediction er i stand til at identificere mønstre i data, og derefter huske dem, et cloud-baseret maskinværktøj til store mængder data. Det kan lære mere om et mønster hver gang det bruges. Mønstrene kan analyseres til en række forskellige formål, herunder bedrageri detektion, churn analyse, og kunde sentiment.
Microsoft Azure til store data
Microsoft har baseret på Windows og SQL abstraktioner, produceret et sæt udviklingsværktøjer, virtuel maskine support, management og medietjenester og mobile enheds tjenester i et PaaS-tilbud. For kunder med dyb ekspertise i. Net, SQLServer og Windows er vedtagelsen af Azure-baserede PaaS ligefrem.
For at imødekomme de nye krav til integration af store data i Windows Azure-løsninger, har Microsoft også tilføjet Windows Azure HDInsight. Bygget på Hortonworks Data Platform (HDP), som ifølge Microsoft tilbyder 100 procent kompatibilitet med Apache Hadoop, understøtter HDInsight forbindelse med Microsoft Excel og andre Business Intelligence (BI) værktøjer. Udover Azure HDInsight kan også implementeres på Windows Server.
OpenStack til store data
Startet af Rackspace og NASA, implementerer OpenStack en åben cloud platform rettet mod offentlige eller private skyer. Mens organisationen er styret af Rackspace, flyttede den til et separat OpenStack-fundament. Selvom virksomheder kan udnytte OpenStack til at skabe proprietære implementeringer, kræver OpenStack-betegnelsen overensstemmelse med en standard implementering af tjenester.
OpenStacks mål er at levere en massivt skaleret, multitenant cloud-specifikation, der kan køre på en hvilken som helst hardware. OpenStack bygger et stort økosystem for partnere, der er interesserede i at vedtage sin cloud platform, herunder Dell, HP, Intel, Cisco, Red Hat og IBM, sammen med mindst 100 andre, der bruger OpenStack som grundlag for deres cloud tilbud.
I hovedsagen er OpenStack et open source IaaS-initiativ bygget på Ubuntu, et operativsystem baseret på Debian Linux-distributionen. Det kan også køre på Red Hats version af Linux.
OpenStack tilbyder en række tjenester, herunder beregning, objektopbevaring, katalog og lager, dashboarding, identitet og netværk. Med hensyn til store data meddelte Rackspace og Hortonworks (en udbyder af en open source data management platform baseret på Apache Hadoop), at Rackspace vil frigive en OpenStack offentlig skybaseret Hadoop-tjeneste, som vil blive valideret og understøttet af Hortonworks og vil gøre det muligt for kunder at hurtigt oprette et stort datamiljø.