Video: How to start a Database Administrator Career in India ? - Skills required, Job opportunities 2025
Er store data virkelig nye eller er det en udvikling i datahåndteringsturen? Det er faktisk begge. Som med andre bølger i datahåndtering er store data bygget oven på udviklingen af datahåndteringspraksis i løbet af de sidste fem årtier. Hvad er nyt er, at prisen for beregning af cyklusser og oplagring for første gang har nået et tippested. Hvorfor er dette vigtigt?
For nogle få år siden ville organisationer typisk kompromittere ved at lagre snapshots eller undergrupper af vigtige oplysninger, fordi omkostningerne ved opbevaring og forarbejdning begrænsninger forbød dem at gemme alt, hvad de ønskede at analysere.
I mange situationer fungerede dette kompromis fint. For eksempel kunne et fremstillingsfirma have indsamlet maskindata hvert andet minut for at bestemme systemernes helbred. Der kan imidlertid være situationer, hvor øjebliksbillede ikke ville indeholde oplysninger om en ny type defekt, og det kan gå ubemærket i måneder.
Med store data er det nu muligt at virtualisere data, så det kan opbevares effektivt og også udnytte skybaseret lagring mere omkostningseffektivt. Derudover har forbedringer i netværkshastighed og pålidelighed fjernet andre fysiske begrænsninger for at kunne håndtere massive datamængder med et acceptabelt tempo.
Tilføj til dette virkningen af ændringer i prisen og sofistikeret computerhukommelse. Med alle disse teknologiovergaver er det nu muligt at forestille sig, hvordan virksomheder kan udnytte data, som kun kunne være utænkelige for kun fem år siden.
Men ingen teknologisk overgang sker isoleret. det sker, når der er et vigtigt behov, der kan opfyldes ved tilgængelighed og modning af teknologi. Mange af de teknologier, der er kernen i store data, såsom virtualisering, parallelbehandling, distribuerede filsystemer og in-memory-databaser, har eksisteret i årtier.
Avanceret analyse har også eksisteret i årtier, selvom de ikke altid har været praktiske. Andre teknologier som Hadoop og MapReduce har kun været på scenen i kun få år. Denne kombination af teknologiske fremskridt kan nu løse væsentlige forretningsproblemer. Virksomheder vil gerne kunne få indsigt og brugbare resultater fra mange forskellige slags data til den rigtige hastighed.
Hvis virksomhederne kan analysere dataoverførsler (svarende til 20 millioner fire skuffeskuffer fyldt med tekstfiler eller 13. 3 års HDTV-indhold) med acceptabel ydeevne for at skelne mellem mønstre og uregelmæssigheder, kan virksomheder begynde at give mening på nye måder.Flytningen til store data handler ikke kun om virksomheder.
Videnskab, forskning og offentlige aktiviteter har også bidraget til at drive det fremad. Tænk bare på at analysere det menneskelige genom eller behandle alle de astronomiske data indsamlet på observatorier for at fremme vores forståelse af verden omkring os. Overvej mængden af data, regeringen indsamler i sine antiterroristaktiviteter, og du får ideen om, at store data ikke kun handler om forretning.
Der findes forskellige metoder til håndtering af data. Data i bevægelse ville blive brugt, hvis en virksomhed er i stand til at analysere kvaliteten af sine produkter under fremstillingsprocessen for at undgå dyre fejl. Data i hvile vil blive brugt af en forretningsanalytiker til bedre at forstå kundernes nuværende købsmønstre baseret på alle aspekter af kundeforholdet, herunder salg, sociale medier og kundeserviceinteraktioner.
Husk, at virksomhederne stadig er i et tidligt stadium i at udnytte enorme datamængder for at få et 360-graders syn på virksomheden og forudse skift og ændringer i kundernes forventninger. De teknologier, der kræves for at få svarene til forretningsbehovet, er stadig isoleret fra hinanden.
Store data handler ikke kun om et værktøj eller en teknologi. Det handler om, hvordan alle disse teknologier kommer sammen for at give de rette indsigter til det rigtige tidspunkt baseret på de rigtige data - om det genereres af mennesker, maskiner eller internettet.