GNU/Linux >> LINUX-Kenntnisse >  >> Linux

So sehen Sie den Inhalt von Hive-Orc-Dateien unter Linux

Aktualisierte Antwort im Jahr 2020 :

Laut @Owens Antwort ist ORC als eigenes Apache-Projekt erwachsen und gereift. Eine vollständige Liste der ORC-Anwender zeigt, wie weit verbreitet es jetzt von vielen Arten von Big-Data-Technologien unterstützt wird.

Vielen Dank an @Owen und das ORC-Apache-Projektteam, die ORC-Projektwebsite verfügt über eine vollständig gepflegte, aktuelle Dokumentation zur Verwendung des eigenständigen Java- oder C++-Tools für ORC-Dateien, die auf einem lokalen Linux-Dateisystem gespeichert sind. Was die Fackel für die ursprüngliche Hive+ORC-Apache-Wiki-Seite weiterführte.

Ursprüngliche Antwort vom:May 30 '14 at 16:27

Das ORC-Datei-Dump-Dienstprogramm wird mit Hive (0.11 oder höher) geliefert:

hive --orcfiledump <hdfs-location-of-orc-file>

Quelllink


Es ist auch in der Lage, den Inhalt einer ORC-Datei von einer Desktop-Anwendung anzuzeigen, die unter Linux ausgeführt wird.

Es gibt eine Desktop-Anwendung, um Parquet und auch andere Binärformatdaten wie ORC und AVRO anzuzeigen. Es ist eine reine Java-Anwendung, die unter Linux, Mac und auch Windows ausgeführt werden kann. Weitere Informationen finden Sie im Bigdata File Viewer.

Es unterstützt komplexe Datentypen wie Array, Map, Struct usw.


Es gibt jetzt auch eine native ausführbare Datei für Linux und MacOS, die den Inhalt der orc-Datei in JSON druckt. Sehen Sie sich das ORC-Projekt (http://orc.apache.org/) an und erstellen Sie die C++-Tools.

% orc-contents examples/TestOrcFile.test1.orc

Es gibt auch ein natives Metadaten-Tool:

% orc-metadata ../examples/TestOrcFile.test1.orc

Das ORC-Projekt hat auch ein eigenständiges Uber-Jar, das dasselbe von Java aus tun kann.

% java -jar orc-tools-1.2.3-uber.jar data myfile.orc

Linux
  1. So konvertieren Sie Dateien in UTF-8-Codierung unter Linux

  2. So zeigen Sie den Inhalt komprimierter Dateien unter Linux an

  3. So zeigen oder ändern Sie die ACL in Linux-Dateien

  4. So extrahieren Sie .gz- und .tar.gz-Dateien unter Linux

  5. So verwenden Sie Netcat zum Übertragen von Dateien unter Linux

So kürzen Sie (leere) Dateien in Linux

So benennen Sie eine Datei (en) in Linux um

So entpacken Sie die gz-Dateien unter Linux

So finden Sie Dateien basierend auf dem Zeitstempel in Linux

So löschen Sie Dateien, die in einer anderen Datei unter Linux aufgeführt sind

So komprimieren Sie eine Datei unter Linux