GNU/Linux >> LINUX-Kenntnisse > >> Linux

Wie scanne ich auf Gedit nach ungültigen Zeichen?

Ich habe ein Dilemma, ob ich eine Javascript-Datei bearbeiten soll oder nicht. Wenn ich es mit gedit öffne, zeigt es die folgende Warnung:

Die geöffnete Datei enthält einige ungültige Zeichen. Wenn Sie diese Datei
weiter bearbeiten, könnten Sie dieses Dokument beschädigen. Sie können auch
eine andere Zeichenkodierung wählen und es erneut versuchen.

Die aktuelle Kodierung ist UTF-8. Da die Datei über 100.000 Codezeilen enthält, gibt es eine schnelle Möglichkeit, nach ungültigen Zeichen zu suchen?

Akzeptierte Antwort:

Da die Datei UTF-8 ist, könnten Sie isutf8 ausführen. Ein zusätzliches utils-Paket.
Es gibt Ihnen sowohl line, char und offset für fehlerhafte Bytes.

Verwenden Sie dann xxd, hexdump oder ähnliches zum Analysieren.

Leider bleibt es beim ersten Crash stehen. Das hängt aber auch wieder von der Datei ab. Könnte
nur ein schlechtes Byte sein 😉

_{Einen C-Code haben, der eine ähnliche Analyse durchführt, aber für die gesamte Datei. Es ist auf
einer längst vergessenen Diskette. Könnte versuchen, es zu finden, wenn nötig.}

Sonst ja, das schnell und nicht das Ein schmutziger Weg wäre, einen Unterschied zwischen
einer mit gedit gespeicherten Kopie zu machen – wie vom guten mr. @vonbrand.

Persönliches Dokumentenmanagementsystem?

Fehler beim Klonen der Festplatte mit Cat?

Linux

So verwenden Sie CherryTree für Notizen

So verwenden Sie den SCP-Befehl für die Dateiübertragung

So prüfen (scannen) Sie offene Ports in Linux

So begrenzen Sie die Tiefe des „Baums“ für die rekursive Dateiauflistung

So entfernen Sie (^M) Zeichen aus einer Datei in Linux

So installieren Sie Android File Transfer für Linux unter Ubuntu