Video: Beeline Vs Hive CLI when using Ranger 2025
Den første Hive-klient er Hive kommandolinjegrænsefladen (CLI). For at beherske de finere punkter i Hive CLI-klienten, kan det hjælpe med at gennemgå den (lidt travle) Hive-arkitektur.
I den anden figur er arkitekturen strømlinet for kun at fokusere på de komponenter, der kræves, når du kører CLI.
Dette er komponenterne i Hive, der er nødvendige, når du kører CLI på en Hadoop-klynge. Her kører du Hive i lokal tilstand, der bruger lokal opbevaring, snarere end HDFS, til dine data.
For at køre Hive CLI udfører du kommandoen hive og angiver CLI som den tjeneste, du vil køre. I den følgende liste kan du se den kommando, der kræves, samt nogle af vores første HiveQL-udsagn. (En trinannotation ved hjælp af A-B-C-modellen er inkluderet i noteringen for at rette din opmærksomhed på nøglekommandoerne.)
(A) $ $ HIVE_HOME / bin hive - service cli (B) hive> sæt hive. cli. Print. nuværende. db = true; (C) hive (standard)> CREATE DATABASE ourfirstdatabase; OK Tid taget: 3.756 sekunder (D) Hive (standard)> BRUG onsfirstdatabase; OK Tid taget: 0. 039 sekunder (E) Hive (vores første database)> CREATE TABLE our_first_table (> Fornavn STRING,> Efternavn STRING,> EmployeeId INT); OK Tid taget: 0. 043 sekunder hive (vores første database)> Afslut; (F) $ ls / home / biadmin / Hive / warehouse / ourfirstdatabase. db our_first_table
Den første kommando (se trin A) starter Hive CLI ved hjælp af $ HIVE_HOME miljøvariablen. Alternativet Cli-kommandolinje-styring styrer Hive-systemet for at starte kommandolinjegrænsefladen, selv om du kunne have valgt andre servere.
Næste, i trin B fortæller du Hive CLI at udskrive din nuværende arbejdsdatabase, så du ved, hvor du er i navneområdet. (Denne sætning vil give mening, når vi forklarer hvordan man bruger den næste kommando, så hold fast.)
I trin C bruger du HiveQLs dataversionssprog (DDL) til at oprette din første database. (Husk at databaser i Hive er simpelthen navneområder, hvor bestemte tabeller befinder sig; fordi et sæt af tabeller kan tænkes som en database eller et skema, kunne du have brugt udtrykket SCHEMA i stedet for DATABASE for at opnå det samme resultat.).
Du bruger specifikt DDL til at fortælle systemet om at oprette en database kaldet ourfirstdatabase og derefter for at gøre denne database til standard for efterfølgende HiveQL DDL-kommandoer ved hjælp af kommandoen USE i trin D. I trin E opretter du din første bord og giv det (helt passende) navn our_first_table.
(Indtil nu har du måske troet, at det ligner SQL, med måske nogle få mindre forskelle i syntaxen, afhængigt af hvilken RDBMS du er vant til - og du ville have haft det rigtige.) Den sidste kommando i Trin F, udfører en katalogoversigt over dit valgte Hive warehouse bibliotek, så du kan se, at vores_first_table faktisk er gemt på disk.
Du indstiller bikuperen. metastore. lager. dir-variabel for at pege på den lokale mappe / home / biadmin / Hive / warehouse i din Linux virtuelle maskine i stedet for at bruge HDFS som du ville på en ordentlig Hadoop-klynge.
Når du har lavet et bord, er det interessant at se tabelens metadata. I produktionsmiljøer har du måske dusinvis af tabeller eller mere, så det er nyttigt at kunne gennemgå bordstrukturen fra tid til anden. Du c en brug en HiveQL-kommando til at gøre dette ved hjælp af Hive CLI, men Hive Web Interface (HWI) Server giver en nyttig grænseflade til denne type operation.
Brug af HWI Server i stedet for CLI kan også være mere sikker. Der skal udvises omhyggelig overvejelse ved brug af CLI i produktionsmiljøer, fordi maskinen, der kører CLI, skal have adgang til hele Hadoop-klyngen.
Derfor installerer systemadministratorer typisk værktøjer som den sikre shell (ssh) for at give kontrolleret og sikker adgang til maskinen, der kører CLI, samt at levere netværkskryptering. Men når HWI-serveren er ansat, kan en bruger kun få adgang til Hive-data, der er tilladt af HWI-serveren via hans eller hendes webbrowser.