Video: GOTO 2013 • HTML-Single-Page-Apps med AngularJS • Anders Hessellund Jensen 2025
Det kan forekomme mærkeligt at nævne søgemaskiner og NoSQL sammen, men mange af dagens søgemaskiner bruger en arkitektur, der ligner meget NoSQL databaser. Deres indeks og forespørgselsbehandling er meget fordelt. Mange søgemaskiner er endda i stand til at fungere som en nøgleværdi eller dokumentbutik i deres egen ret.
NoSQL-databaser bruges ofte til at gemme ustruktureret data, dokumenter eller data, der kan lagres i forskellige strukturer, såsom sociale medier eller websider. Strukturerne i denne indekserede data varierer meget.
Dokumentdatabaser er også relevante i tilfælde, hvor systemadministratorer eller udviklere ofte ikke har kontrol over strukturerne. Denne situation er almindelig ved udgivelse, hvor en butikskonference modtager feeds af nye bøger og deres metadata fra mange udgivere.
Selv om udgivere bruger lignende standarder som PDF og ePub for dokumenter og ONIX XML-filer til metadata, producerer de alle dokumenter på lidt forskellige måder. Som følge heraf er det svært at konsekvent håndtering af data, og udgivelse er en stor anvendelsesform for en dokumentdatabase.
Lignende problemer opstår i forsvars- og efterretningsområderne. Et agentur kan modtage data fra en allieret eller en terrorist harddisk i en række forskellige formater. At vente seks måneder til at udvikle et revideret relationsdatabaseskema til at håndtere en ny type mål er ikke levedygtig! Her kan dokument NoSQL databaser bruges.
Hvis du lagrer mange strukturer i en enkelt database, er det nødvendigt at give en standard forespørgselsmekanisme over alt indhold. Søgemaskiner er gode til det formål. Overvej søgning som et vigtigt krav til ustruktureret datahåndtering med NoSQL Document databaser.
Søgeteknologi adskiller sig fra traditionel forespørgselsdatabase-grænseflade teknologi. SQL er ikke en søgeteknologi; det er et forespørgselssprog. Søgning omhandler ufuldkomne kampe og relevans scoring, mens forespørgsel omhandler boolsk eksakt matchende logik (det vil sige alle resultater af en forespørgsel er lige relevante).