GNU/Linux >> LINUX-Kenntnisse >  >> Ubuntu

So installieren Sie Apache Hive mit Hadoop auf CentOS, Ubuntu und LinuxMint

Was ist Apache Hive? Die Data-Warehouse-Software Apache Hive erleichtert das Abfragen und Verwalten großer Datensätze, die sich in verteilten Speichern befinden. Hive bietet einen Mechanismus, um eine Struktur auf diese Daten zu projizieren und die Daten mit einer SQL-ähnlichen Sprache namens HiveQL abzufragen. Lesen Sie mehr auf der offiziellen Website

Diese Anleitung hilft Ihnen, Apache Hive auf CentOS/RHEL mit Hadoop in einfachen Schritten zu installieren.

Schritt 1:Java und Hadoop installieren

Apache Hive erforderte Java 6 oder eine neuere Version. Wir müssen auch zuerst Hadoop installieren, bevor wir Apache Hive auf unserem System installieren. Verwenden Sie die folgenden Links, um sie zu installieren

Schritte zum Installieren von JAVA auf CentOS und RHEL 7/6/5
Schritte zum Installieren von Hadoop unter Linux

Schritt 2:Hive-Archiv herunterladen

Nachdem Sie Hadoop erfolgreich auf Ihrem Linux-System konfiguriert haben. Beginnen wir mit dem Hive-Setup. Laden Sie zuerst den neuesten Hive-Quellcode herunter und extrahieren Sie das Archiv mit den folgenden Befehlen.

# cd /home/hadoop# wget http://archive.apache.org/dist/hive/hive-0.12.0/hive-0.12.0-bin.tar.gz# tar xzf hive-0.12.0 -bin.tar.gz# mv hive-0.12.0-bin hive# chown -R hadoop hive

Schritt 3:Umgebungsvariablen einrichten

Wechseln Sie nach dem Extrahieren der Hive-Archivdatei zum Hadoop-Benutzer und richten Sie die folgenden Umgebungsvariablen ein.

# su - hadoop$ export HADOOP_HOME=/home/hadoop/hadoop$ export HADOOP_PREFIX=/home/hadoop/hadoop$ export HIVE_HOME=/home/hadoop/hive$ export PATH=$HIVE_HOME/bin:$PATH 

Schritt 4:Hive starten

Bevor wir hive ausführen, müssen wir /tmp erstellen und /user/hive/warehouse und setzen Sie sie chmod g+w in HDFS, bevor Sie eine Tabelle in Hive erstellen. Verwenden Sie die folgenden Befehle.

$ cd /home/hadoop/hive$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse$ $HADOOP_HOME/bin/hadoop fs -chmod g +w /tmp$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse

Beginnen wir mit der Verwendung von Hive mit dem folgenden Befehl.

$ bin/hiveLogging initialisiert mit Konfiguration in jar:file:/home/hadoop/hive/lib/hive-common-0.12.0.jar!/hive-log4j.propertieshive>

Schritt 5:Demotabelle erstellen und testen

Zu diesem Zeitpunkt haben Sie Hive erfolgreich installiert. Lassen Sie uns mit dem folgenden Befehl eine Beispieltabelle erstellen

hive> CREATE TABLE demo1 (id int, name string);OKDauer:6,565 Sekunden

Zeigen Sie die erstellten Tabellen mit dem folgenden Befehl an.

hive> SHOW TABLES;OKdemo1Gebrauchte Zeit:0,231 Sekunden, abgerufen:1 Zeile(n)

Löschen Sie die Tabelle mit dem folgenden Befehl.

hive> DROP TABLE demo1;OKDauer:2,393 Sekunden

Lesen Sie mehr über SQL-Operationen auf Hive auf der offiziellen Seite von Apache Hive.


Ubuntu
  1. So installieren Sie die Ghost Blog-Software mit Apache und SSL unter Ubuntu 16.04

  2. So installieren Sie Apache Hadoop unter CentOS 7, Ubuntu 18.04 und Debian 9

  3. So installieren Sie Apache Maven unter Ubuntu 18.04 und 16.04

  4. So installieren Sie Apache Hadoop unter Ubuntu 14.04

  5. So installieren Sie Apache Hadoop auf Ubuntu 18.04 LTS

So installieren und konfigurieren Sie das mod_pagespeed-Modul mit Apache unter Ubuntu 20.04 LTS

So installieren Sie die Ghost Blog-Software mit Apache und SSL unter Ubuntu 15.10

So installieren Sie PrestaShop auf Ubuntu 20.04 mit Apache

So installieren und konfigurieren Sie Hadoop unter Ubuntu 20.04

So installieren Sie Drupal mit Apache auf Debian und Ubuntu

So installieren Sie Django 3.2 auf Ubuntu 20.04 mit Apache und WSGI