Was ist Apache Hive? Die Data-Warehouse-Software Apache Hive erleichtert das Abfragen und Verwalten großer Datensätze, die sich in verteilten Speichern befinden. Hive bietet einen Mechanismus, um eine Struktur auf diese Daten zu projizieren und die Daten mit einer SQL-ähnlichen Sprache namens HiveQL abzufragen. Lesen Sie mehr auf der offiziellen Website
Diese Anleitung hilft Ihnen, Apache Hive auf CentOS/RHEL mit Hadoop in einfachen Schritten zu installieren.
Schritt 1:Java und Hadoop installieren
Apache Hive erforderte Java 6 oder eine neuere Version. Wir müssen auch zuerst Hadoop installieren, bevor wir Apache Hive auf unserem System installieren. Verwenden Sie die folgenden Links, um sie zu installieren
Schritte zum Installieren von JAVA auf CentOS und RHEL 7/6/5
Schritte zum Installieren von Hadoop unter Linux
Schritt 2:Hive-Archiv herunterladen
Nachdem Sie Hadoop erfolgreich auf Ihrem Linux-System konfiguriert haben. Beginnen wir mit dem Hive-Setup. Laden Sie zuerst den neuesten Hive-Quellcode herunter und extrahieren Sie das Archiv mit den folgenden Befehlen.
# cd /home/hadoop# wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz# tar xzf hive-0.12.0 -bin.tar.gz# mv hive-0.12.0-bin hive# chown -R hadoop hive
Schritt 3:Umgebungsvariablen einrichten
Wechseln Sie nach dem Extrahieren der Hive-Archivdatei zum Hadoop-Benutzer und richten Sie die folgenden Umgebungsvariablen ein.
# su - hadoop$ export HADOOP_HOME=/home/hadoop/hadoop$ export HADOOP_PREFIX=/home/hadoop/hadoop$ export HIVE_HOME=/home/hadoop/hive$ export PATH=$HIVE_HOME/bin:$PATHSchritt 4:Hive starten
Bevor wir hive ausführen, müssen wir /tmp erstellen und /user/hive/warehouse und setzen Sie sie chmod g+w in HDFS, bevor Sie eine Tabelle in Hive erstellen. Verwenden Sie die folgenden Befehle.
$ cd /home/hadoop/hive$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse$ $HADOOP_HOME/bin/hadoop fs -chmod g +w /tmp$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouseBeginnen wir mit der Verwendung von Hive mit dem folgenden Befehl.
$ bin/hiveLogging initialisiert mit Konfiguration in jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.propertieshive>Schritt 5:Demotabelle erstellen und testen
Zu diesem Zeitpunkt haben Sie Hive erfolgreich installiert. Lassen Sie uns mit dem folgenden Befehl eine Beispieltabelle erstellen
hive> CREATE TABLE demo1 (id int, name string);OKDauer:6,565 SekundenZeigen Sie die erstellten Tabellen mit dem folgenden Befehl an.
hive> SHOW TABLES;OKdemo1Gebrauchte Zeit:0,231 Sekunden, abgerufen:1 Zeile(n)Löschen Sie die Tabelle mit dem folgenden Befehl.
hive> DROP TABLE demo1;OKDauer:2,393 SekundenLesen Sie mehr über SQL-Operationen auf Hive auf der offiziellen Seite von Apache Hive.