GNU/Linux >> LINUX-Kenntnisse >  >> Linux

Wie Hexdump funktioniert

Hexdump ist ein Dienstprogramm, das den Inhalt von Binärdateien im Hexadezimal-, Dezimal-, Oktal- oder ASCII-Format anzeigt. Es ist ein Dienstprogramm zur Inspektion und kann für Datenwiederherstellung, Reverse Engineering und Programmierung verwendet werden.

Die Grundlagen lernen

Hexdump bietet eine Ausgabe mit sehr geringem Aufwand Ihrerseits, und je nach Größe der Datei, die Sie sich ansehen, kann es eine Menge Ausgabe geben. Erstellen Sie für diesen Artikel eine 1x1-PNG-Datei. Sie können dies mit einer Grafikanwendung wie GIMP oder Mtpaint tun, oder Sie können es in einem Terminal mit ImageMagick erstellen.

Hier ist ein Befehl zum Generieren eines 1x1-Pixel-PNG mit ImageMagick:

$ convert -size 1x1 canvas:black pixel.png

Sie können mit der Datei bestätigen, dass es sich bei dieser Datei um eine PNG-Datei handelt Befehl:

$ file pixel.png
pixel.png: PNG image data, 1 x 1, 1-bit grayscale, non-interlaced

Sie fragen sich vielleicht, wie die Datei Befehl kann feststellen, um welche Art von Datei es sich handelt. Zufälligerweise ist das hexdump wird enthüllen. Im Moment können Sie Ihre Ein-Pixel-Grafik im Bildbetrachter Ihrer Wahl anzeigen (sie sieht so aus: . ), oder Sie können den Inhalt der Datei mit hexdump anzeigen :

$ hexdump pixel.png
0000000 5089 474e 0a0d 0a1a 0000 0d00 4849 5244
0000010 0000 0100 0000 0100 0001 0000 3700 f96e
0000020 0024 0000 6704 4d41 0041 b100 0b8f 61fc
0000030 0005 0000 6320 5248 004d 7a00 0026 8000
0000040 0084 fa00 0000 8000 00e8 7500 0030 ea00
0000050 0060 3a00 0098 1700 9c70 51ba 003c 0000
0000060 6202 474b 0044 dd01 138a 00a4 0000 7407
0000070 4d49 0745 07e3 081a 3539 a487 46b0 0000
0000080 0a00 4449 5441 d708 6063 0000 0200 0100
0000090 21e2 33bc 0000 2500 4574 7458 6164 6574
00000a0 633a 6572 7461 0065 3032 3931 302d 2d37
00000b0 3532 3254 3a30 3735 353a 2b33 3231 303a
00000c0 ac30 5dcd 00c1 0000 7425 5845 6474 7461
00000d0 3a65 6f6d 6964 7966 3200 3130 2d39 3730
00000e0 322d 5435 3032 353a 3a37 3335 312b 3a32
00000f0 3030 90dd 7de5 0000 0000 4549 444e 42ae
0000100 8260
0000102

Was Sie sehen, ist der Inhalt der Beispiel-PNG-Datei durch eine Linse, die Sie vielleicht noch nie zuvor verwendet haben. Es sind genau dieselben Daten, die Sie in einem Bildbetrachter sehen, codiert auf eine Weise, die Ihnen wahrscheinlich nicht vertraut ist.

Extrahieren vertrauter Strings

Nur weil der Standard-Datendump bedeutungslos erscheint, bedeutet das nicht, dass er keine wertvollen Informationen enthält. Sie können diese Ausgabe oder zumindest die Teile, die tatsächlich übersetzt werden, mit --canonical in einen vertrauteren Zeichensatz übersetzen Möglichkeit:

$ hexdump --canonical foo.png 
00000000  89 50 4e 47 0d 0a 1a 0a  00 00 00 0d 49 48 44 52  |.PNG........IHDR|
00000010  00 00 00 01 00 00 00 01  01 00 00 00 00 37 6e f9  |.............7n.|
00000020  24 00 00 00 04 67 41 4d  41 00 00 b1 8f 0b fc 61  |$....gAMA......a|
00000030  05 00 00 00 20 63 48 52  4d 00 00 7a 26 00 00 80  |.... cHRM..z&...|
00000040  84 00 00 fa 00 00 00 80  e8 00 00 75 30 00 00 ea  |...........u0...|
00000050  60 00 00 3a 98 00 00 17  70 9c ba 51 3c 00 00 00  |`..:....p..Q<...|
00000060  02 62 4b 47 44 00 01 dd  8a 13 a4 00 00 00 07 74  |.bKGD..........t|
00000070  49 4d 45 07 e3 07 1a 08  39 35 87 a4 b0 46 00 00  |IME.....95...F..|
00000080  00 0a 49 44 41 54 08 d7  63 60 00 00 00 02 00 01  |..IDAT..c`......|
00000090  e2 21 bc 33 00 00 00 25  74 45 58 74 64 61 74 65  |.!.3...%tEXtdate|
000000a0  3a 63 72 65 61 74 65 00  32 30 31 39 2d 30 37 2d  |:create.2019-07-|
000000b0  32 35 54 32 30 3a 35 37  3a 35 33 2b 31 32 3a 30  |25T20:57:53+12:0|
000000c0  30 ac cd 5d c1 00 00 00  25 74 45 58 74 64 61 74  |0..]....%tEXtdat|
000000d0  65 3a 6d 6f 64 69 66 79  00 32 30 31 39 2d 30 37  |e:modify.2019-07|
000000e0  2d 32 35 54 32 30 3a 35  37 3a 35 33 2b 31 32 3a  |-25T20:57:53+12:|
000000f0  30 30 dd 90 e5 7d 00 00  00 00 49 45 4e 44 ae 42  |00...}....IEND.B|
00000100  60 82                                             |`.|
00000102

In der rechten Spalte sehen Sie die gleichen Daten wie in der linken, aber als ASCII dargestellt. Wenn Sie genau hinschauen, können Sie einige nützliche Informationen heraussuchen, wie z. B. das Format der Datei (PNG) und – weiter unten – das Datum und die Uhrzeit, zu der die Datei erstellt und zuletzt geändert wurde. Die Punkte stellen Symbole dar, die im ASCII-Zeichensatz nicht vorhanden sind, was zu erwarten ist, da Binärformate nicht auf alltägliche Buchstaben und Zahlen beschränkt sind.

Die Datei Befehl weiß aus den ersten 8 Bytes, was diese Datei ist. Die libpng-Spezifikation weist Programmierer darauf hin, wonach sie suchen müssen. Sie können sehen, dass sich in den ersten 8 Byte dieser Bilddatei insbesondere die Zeichenfolge PNG befindet . Diese Tatsache ist bedeutsam, weil sie zeigt, wie die Datei Befehl weiß, welche Art von Datei gemeldet werden soll.

Sie können auch steuern, wie viele Bytes Hexdump sind angezeigt, was bei Dateien nützlich ist, die größer als ein Pixel sind:

$ hexdump --length 8 pixel.png 
0000000 5089 474e 0a0d 0a1a
0000008

Sie müssen Hexdump nicht einschränken in PNG- oder Grafikdateien. Sie können hexdump ausführen gegen Binärdateien, die Sie auch täglich ausführen, wie ls, rsync oder ein beliebiges Binärformat, das Sie überprüfen möchten.

Katze mit Hexdump implementieren

Das Linux-Terminal

  • Die 7 besten Terminalemulatoren für Linux
  • 10 Befehlszeilentools für die Datenanalyse unter Linux
  • Jetzt herunterladen:SSH-Spickzettel
  • Spickzettel für fortgeschrittene Linux-Befehle
  • Linux-Befehlszeilen-Tutorials

Wenn Sie die PNG-Spezifikation lesen, stellen Sie möglicherweise fest, dass die Daten in den ersten 8 Bytes anders aussehen als der Hexdump bietet. Eigentlich sind es die gleichen Daten, aber sie werden mit einer anderen Konvertierung dargestellt. Also die Ausgabe von hexdump ist wahr, aber nicht immer direkt nützlich für Sie, je nachdem, wonach Sie suchen. Aus diesem Grund hexdump hat Optionen zum Formatieren und Konvertieren der ausgegebenen Rohdaten.

Die Konvertierungsoptionen können komplex werden, daher ist es hilfreich, zuerst mit etwas Trivialem zu üben. Hier ist eine sanfte Einführung in die Formatierung von Hexdump Ausgabe durch Neuimplementierung von cat Befehl. Führen Sie zuerst hexdump aus auf eine Textdatei, um ihre Rohdaten zu sehen. Normalerweise finden Sie eine Kopie der GNU General Public License (GPL)-Lizenz irgendwo auf Ihrer Festplatte, oder Sie können jede Textdatei verwenden, die Sie zur Hand haben. Ihre Ausgabe kann unterschiedlich sein, aber so finden Sie eine Kopie der GPL auf Ihrem System (oder zumindest einen Teil davon):

$ find /usr/share/doc/ -type f -name "COPYING" | tail -1
/usr/share/doc/libblkid-devel/COPYING

Führen Sie hexdump aus dagegen:

$ hexdump /usr/share/doc/libblkid-devel/COPYING
0000000 6854 7369 6c20 6269 6172 7972 6920 2073
0000010 7266 6565 7320 666f 7774 7261 3b65 7920
0000020 756f 6320 6e61 7220 6465 7369 7274 6269
0000030 7475 2065 7469 6120 646e 6f2f 0a72 6f6d
0000040 6964 7966 6920 2074 6e75 6564 2072 6874
0000050 2065 6574 6d72 2073 666f 7420 6568 4720
0000060 554e 4c20 7365 6573 2072 6547 656e 6172
0000070 206c 7550 6c62 6369 4c0a 6369 6e65 6573
0000080 6120 2073 7570 6c62 7369 6568 2064 7962
[...]

Wenn die Ausgabe der Datei sehr lang ist, verwenden Sie die --length (oder -n kurz) um es für sich handhabbar zu machen.

Die Rohdaten sagen Ihnen wahrscheinlich nichts, aber Sie wissen bereits, wie man sie in ASCII umwandelt:

hexdump --canonical /usr/share/doc/libblkid-devel/COPYING
00000000  54 68 69 73 20 6c 69 62  72 61 72 79 20 69 73 20  |This library is |
00000010  66 72 65 65 20 73 6f 66  74 77 61 72 65 3b 20 79  |free software; y|
00000020  6f 75 20 63 61 6e 20 72  65 64 69 73 74 72 69 62  |ou can redistrib|
00000030  75 74 65 20 69 74 20 61  6e 64 2f 6f 72 0a 6d 6f  |ute it and/or.mo|
00000040  64 69 66 79 20 69 74 20  75 6e 64 65 72 20 74 68  |dify it under th|
00000050  65 20 74 65 72 6d 73 20  6f 66 20 74 68 65 20 47  |e terms of the G|
00000060  4e 55 20 4c 65 73 73 65  72 20 47 65 6e 65 72 61  |NU Lesser Genera|
00000070  6c 20 50 75 62 6c 69 63  0a 4c 69 63 65 6e 73 65  |l Public.License|
[...]

Diese Ausgabe ist hilfreich, aber unhandlich und schwer zu lesen. Um Hexdump zu formatieren verwenden Sie --format, um die Ausgabe von über das hinauszugehen, was die eigenen Optionen bieten (oder -e ) zusammen mit speziellen Formatierungscodes. Die für die Formatierung verwendete Abkürzung ähnelt der von printf Befehl verwendet, also wenn Sie mit printf vertraut sind Anweisungen finden Sie möglicherweise hexdump Formatierung leichter zu erlernen.

Im Hexdump , die Zeichenfolge %_p sagt hexdump um ein Zeichen im Standardzeichensatz Ihres Systems zu drucken. Alle Formatierungsnotationen für das --Format Option muss in einfache Anführungszeichen eingeschlossen werden :

$ hexdump -e'"%_p"' /usr/share/doc/libblkid-devel/COPYING
This library is fre*
 software; you can redistribute it and/or.modify it under the terms of the GNU Les*
er General Public.License as published by the Fre*
 Software Foundation; either.version 2.1 of the License, or (at your option) any later.version..*
The complete text of the license is available in the..*
/Documentation/licenses/COPYING.LGPL-2.1-or-later file..

Diese Ausgabe ist besser, aber immer noch unbequem zu lesen. Traditionell gehen UNIX-Textdateien von einer Ausgabebreite von 80 Zeichen aus (denn Monitore passten vor langer Zeit nur auf 80 Zeichen).

Während diese Ausgabe nicht an eine Formatierung gebunden ist, können Sie Hexdump erzwingen 80 Bytes auf einmal verarbeiten mit zusätzlichen Optionen. Genauer gesagt, indem Sie 80 durch eins dividieren, können Sie hexdump erkennen um 80 Bytes als eine Einheit zu behandeln:

$ hexdump -e'80/1 "%_p"' /usr/share/doc/libblkid-devel/COPYING
This library is free software; you can redistribute it and/or.modify it under the terms of the GNU Lesser General Public.License as published by the Free Software Foundation; either.version 2.1 of the License, or (at your option) any later.version...The complete text of the license is available in the.../Documentation/licenses/COPYING.LGPL-2.1-or-later file..

Jetzt wird die Datei in 80-Byte-Blöcken verarbeitet, aber sie hat jegliches Gefühl für neue Zeilen verloren. Sie können Ihre eigenen mit \n hinzufügen Zeichen, das in UNIX einen Zeilenumbruch darstellt:

$ hexdump -e'80/1 "%_p""\n"'
This library is free software; you can redistribute it and/or.modify it under th
e terms of the GNU Lesser General Public.License as published by the Free Softwa
re Foundation; either.version 2.1 of the License, or (at your option) any later.
version...The complete text of the license is available in the.../Documentation/
licenses/COPYING.LGPL-2.1-or-later file..

Sie haben jetzt (ungefähr) die Katze implementiert Befehl mit hexdump Formatierung.

Steuerung der Ausgabe

Formatieren ist realistisch gesehen, wie Sie Hexdump erstellen nützlich. Nun, da Sie zumindest im Prinzip mit hexdump vertraut sind formatieren, können Sie die Ausgabe von hexdump -n 8 machen passen Sie die Ausgabe des PNG-Headers an, wie von der offiziellen libpng beschrieben spez.

Zuerst wissen Sie, dass Sie Hexdump wollen um die PNG-Datei in 8-Byte-Blöcken zu verarbeiten. Außerdem wissen Sie vielleicht durch Ganzzahlerkennung, dass die PNG-Spezifikation dezimal dokumentiert ist, was durch %d dargestellt wird nach dem Hexdump Dokumentation:

$ hexdump -n8 -e'8/1 "%d""\n"' pixel.png
13780787113102610

Sie können die Ausgabe perfektionieren, indem Sie nach jeder Ganzzahl ein Leerzeichen einfügen:

$ hexdump -n8 -e'8/1 "%d ""\n"' pixel.png
137 80 78 71 13 10 26 10

Die Ausgabe entspricht jetzt perfekt der PNG-Spezifikation.

Hexdumping für Spaß und Profit

Hexdump ist ein faszinierendes Tool, das Ihnen nicht nur mehr darüber beibringt, wie Computer Informationen verarbeiten und konvertieren, sondern auch, wie Dateiformate und kompilierte Binärdateien funktionieren. Sie sollten versuchen, hexdump auszuführen den ganzen Tag über zufällig auf Dateien zugreifen, während Sie arbeiten. Sie wissen nie, welche Art von Informationen Sie finden und wann diese Erkenntnisse nützlich sein können.


Linux
  1. Verwendung des Linux-Hexdump-Befehls mit praktischen Beispielen

  2. Funktionsweise des Befehls oc debug in OpenShift

  3. So überprüfen Sie, ob ein Socks5-Proxy funktioniert

  4. Wie öffne ich ein neues Terminal im aktuellen Verzeichnis?

  5. Einfache Erklärung, wie Dirty COW funktioniert?

So suchen Sie in Nano

So installieren Sie OmniOS ce

Funktionsweise des Ping-Programms unter Linux

Wie Fail2ban auf Plesk funktioniert

Was ist DHCP und wie funktioniert DHCP? (DHCP-Grundlagen erklärt)

Verstehen, wie ein E-Mail-System funktioniert