Video: Kenneth Cukier: Big data is better data 2025
Store data har gjort det muligt at udvikle højt kvalificerede online søgemaskiner. En søgemaskine, der finder websider baseret på søgeord, kræver avancerede algoritmer og evnen til at behandle et svimlende antal anmodninger. Her er fire af de mest brugte søgemaskiner:
-
Google
-
Microsoft Bing
-
Yahoo!
-
Spørg
Brugen af Google dværge sine konkurrenter. Fra februar 2015 anslås Google at modtage 1. 1 milliard unikke besøgende hver måned. Bing er et fjernt sekund med 350 millioner; Yahoo! får 300 millioner, og spørg 245 millioner. Selv om Google ikke er den ældste søgemaskine, er det blevet langt den mest populære. Den mængde data, som Google håndterer hver dag, anslås til at være ca. 20 petabytes (2,0 x 10 16 bytes). Al denne trafik er rentabel for Google - hovedparten af indtægterne kommer fra reklame.
Google leverer også edb-tjenester til organisationer, der ikke har deres egen kapacitet til at behandle store data. Google introducerede for nylig Google Cloud Dataflow, som gør det muligt for organisationer at gemme, analysere og behandle store mængder data.