Video: Apache Drill Introduction 2025
Apache Drill er et kandidatprojekt i Apache-inkubatoren. Apache Drill er dog ikke særlig syg. Apache Software Foundation (ASF) kandidat teknologier begynder som inkubatorprojekter, før de bliver officielle ASF teknologier. Du kan læse om Apache-inkubatoren. Du kan læse om Drill.
Inspireret af Googles Dremel-teknologi er det angivne resultatmål for Drill at aktivere SQL-forespørgsler mod en petabyte eller flere data fordelt på 10.000-plus-servere. Figuren illustrerer arkitekturen af Apache Drill.
Du kan se, at nøglen til Drill-arkitekturen er DrillBit-serverne implementeret på hver datadode. Bemærk, at hver server indeholder en forespørgselsparser, kompilator, optimizer og runtime, men der er en master DrillBit-server nomineret af Zookeeper-servere, som overvåger udførelsen af forespørgsler og ser på opgaven at samle de foreløbige resultatsæt sammen i en enkelt sæt af output.
Som Dremel kan Borre eksistere sammen med og supplere MapReduce, men MapReduce er ikke vant til at opfylde forespørgsler, som med Apache Hive. I stedet er udførelsesmotorer kaldet Drillbits blevet udviklet af medlemmer af Drill-samfundet.
Dette fællesskab har til formål at give lavt ventende forespørgsler til applikationer som real-time business intelligence dashboards, svindel afsløring og andre tidsfølsomme brugssager. Drill understøtter indlejrede datatyper som f.eks. Avro, JSON og Google Protocol buffere. Disse indlejrede datatyper giver mulighed for meget store denormaliserede tabeller.
Udviklingsholdet Drill arbejder også på at yde omfattende SQL-support ved at målrette SQL2003-overholdelse. Endelig bemærk at boreholdet yder HBase-support, så brugerne vil kunne spørge HBase-tabeller med SQL.