Hjem Personlig finansiering Streaming af data - dummier

Streaming af data - dummier

Video: Data Stream 2025

Video: Data Stream 2025
Anonim

Når data strømmer i enorme beløb, lagring det hele kan være svært eller endog umuligt. Faktisk kan opbevaring af det hele ikke engang være nyttigt. Her er nogle tal på, hvad du kan forvente at ske inden for et enkelt minut på internettet:

  • 150 millioner e-mails sendt
  • 350, 000 nye tweets sendt på Twitter
  • 2. 4 millioner forespørgsler forespurgt på Google
  • 700.000 mennesker logget ind på deres konto på Facebook

I betragtning af sådanne mængder synes akkumulering af data hele dagen for inkremental analyse måske ikke at være effektiv. Du gemmer det blot et eller andet sted og analyserer det på følgende eller på en senere dag (som er den udbredte arkivstrategi, der er typisk for databaser og datalagre). Men brugbare datasøgninger har tendens til at spørge om de seneste data i strømmen, og data bliver mindre nyttige, når det er aldre (i nogle sektorer, som f.eks. Økonomisk, kan en dag være meget tid).

Desuden kan du forvente endnu flere data at ankomme i morgen (mængden af ​​data stiger dagligt) og det gør det svært, om ikke umuligt at trække data fra lagre, mens du trykker på nye data. At trække gamle data fra repositorier efterhånden som friske data henter, er beslægtet med straffen af ​​Sisyphus. Sisyphus, som en græsk myte fortæller, modtog en frygtelig straf fra gud Zeus: At blive tvunget til evigt at rulle en enorm klods op på toppen af ​​en bakke, for kun at se den rulle ned igen hver gang.

Nogle gange gør det endnu mere umuligt at håndtere ting, så data kan komme så hurtigt og i så store mængder, at det ikke er muligt at skrive det til disken. Ny information kommer hurtigere end den tid, der kræves for at skrive den til harddisk. Dette er et problem, der er typisk for partikeleksperimenter med partikelacceleratorer, såsom Large Hadron Collider, der kræver, at forskere bestemmer, hvilke data der skal opbevares. Selvfølgelig kan du kødata for en tid, men ikke for længe, ​​fordi køen hurtigt vokser og bliver umulig at vedligeholde. Hvis der f.eks. Bliver gemt i hukommelsen, vil kødata snart føre til en fejl i hukommelsen.

Fordi nye datastrømme kan gøre den tidligere behandling af gamle data forældede, og udsættelse ikke er en løsning, har folk udtænkt flere strategier til øjeblikkelig behandling af massive og foranderlige datamængder. Folk bruger tre måder at håndtere store mængder data på:

  • Gemt: Nogle data gemmes, fordi det kan hjælpe med at svare på uklare spørgsmål senere. Denne metode er afhængig af teknikker til at gemme den med det samme og analysere det senere meget hurtigt, uanset hvor massiv det er.
  • Opsummeret: Nogle data er opsummeret, fordi man holder alt som det er, giver ingen mening; kun de vigtige data opbevares.
  • Forbrugt: De resterende data forbruges, fordi brugen er forudbestemt. Algoritmer kan øjeblikkeligt læse, fordøje og omdanne dataene til information. Derefter glemmer systemet for evigt.

Når du taler om massive data, der ankommer til et computersystem, vil du ofte høre det i forhold til vand: streaming data, datastrømme, dataslamslang.

Du opdager, hvordan datastrømme er som forbrug af ledningsvand: Ved åbning af vandhanen kan du opbevare vandet i kopper eller drikkeflasker, eller du kan bruge det til madlavning, skrubning af mad, rengøringsplader eller vaskehænder. Under alle omstændigheder er det meste eller hele vandet væk, men det viser sig meget nyttigt og meget vigtigt.

Streaming af data - dummier

Valg af editor

Microsoft Project 2010 Genvejstaster - dummies

Microsoft Project 2010 Genvejstaster - dummies

Microsoft Project 2010 maksimerer effektiviteten, når du administrerer projekter - men også genvejstaster i Project 2010 din tid på tastaturet: Her er nogle genvejstaster, du vil bruge hele tiden, når du bygger og arbejder med en projektplan. Indtastning af tastetryk Indsæt Indsætter ny opgave Ctrl + K Indsætter hyperlink F7 Starter stavekontrol Alt + F10 Tildeler ressourcer ...

Hvordan man ændrer gridlines i Project 2016 - dummies

Hvordan man ændrer gridlines i Project 2016 - dummies

Flere visninger i Project 2016 inkluderer gridlines for at angive visse elementer, f.eks. en pause mellem uger eller status dato (det vil sige den dato, hvor der er sporet fremskridt på et projekt). Disse linjer hjælper en person med at læse planen for at skelne mellem tidsintervaller eller brud på information; For eksempel kan netlinjer være ...

Projekt 2016 AutoFilter-funktion - dummier

Projekt 2016 AutoFilter-funktion - dummier

Projekt 2016 AutoFilter-funktionen er som standard tændt for alle nye tidsplanfiler. Pile vises i kolonneoverskrifterne i det viste ark. Når du klikker på pilen i kolonnen Ressourcenavne, er navnet på hver ressource, der er tildelt opgaver i projektet, angivet i alfabetisk rækkefølge sammen med ...

Valg af editor

Netværksadministration: Windows Command Omdirigering og piping - dummies

Netværksadministration: Windows Command Omdirigering og piping - dummies

Omdirigering og piping af Windows-kommandoer er relaterede teknikker. Omdirigering giver dig mulighed for at angive en alternativ destination for output, der vil blive vist med en kommando eller en alternativ kilde til input, der skal indtastes i en kommando. Du kan f.eks. Gemme resultaterne af en kommando ipconfig / all til en fil ved navn myconfig. txt ...

Netværksadministration: VPN Security - dummies

Netværksadministration: VPN Security - dummies

Udtrykket tunnel er nogle gange brugt til at beskrive en VPN, fordi VPN'en skaber en sikker tunnel mellem to steder, som kun kan indtastes fra begge ender. De data, der bevæger sig gennem tunnelen fra den ene ende til den anden, er sikre, så længe det er inden for tunnelen - det vil sige inden for ...

Netværksadministration: Windows Miljøvariabler - dummies

Netværksadministration: Windows Miljøvariabler - dummies

Windows-kommandoskallen giver flere miljøvariabler til kommandoer. Miljøvariabler begynder og slutter med procent tegn. Du kan bruge en miljøvariabel overalt i en kommando. For eksempel viser C:> echo% OS%, der kører på% PROCESSOR_IDENTIFIER% en linje som denne: Windows_NT kører på en x86 Familie 15 Model 2 Stepping 8, ...

Valg af editor

Sådan bruger du arv i PHP med objektorienteret programmering - dummier

Sådan bruger du arv i PHP med objektorienteret programmering - dummier

Objektorienteret programmering i PHP har en anden funktion, der gør det meget nyttigt til store projekter. Mange objekter er relateret til hinanden, og du kan bruge et familietræforhold til at forenkle din programmering. Hvordan man bygger en critter baseret på en anden critter Der er en ny critter i byen. Denne har den samme grundlæggende ...

Sådan bruges PHP til at lave en switch til HTML5 og CSS3 Programmering - dummies

Sådan bruges PHP til at lave en switch til HTML5 og CSS3 Programmering - dummies

Du kører ofte over en situation i HTML5 og CSS3 programmering, hvor du har et udtryk, der kan have mange mulige værdier. Du kan altid bruge strukturen til at klare denne situation, men PHP leverer en anden interessant mulighed. Koden til dette program anvender omskifterstrukturen. Tag et kig på, hvordan det er gjort: