GNU/Linux >> LINUX-Kenntnisse >  >> Linux

Wie konvertiere ich HTML in Text?

Ich glaube nicht, dass Curl einen eingebauten HTML-Prozessor hat. Allerdings:

lynx --dump <URL>

funktioniert.

Wenn Sie dennoch curl verwenden möchten, können Sie html2text verwenden (verfügbar in Ubuntu).


Sie können html2text installieren (ein fortschrittlicher HTML-zu-Text-Konverter) und die Verwendung ist einfach:

$ html2text http://example.com/
$ cat file.html | html2text -o file.txt

Installieren von:

  • Linux:apt-get install html2text
  • OS X:brew install html2text

Beispiel mit curl :

$ curl -sL google.com | html2text
Search Images Maps Play YouTube News Gmail Drive More ?
Web History | Settings | Sign in
     A better way to browse the web
       Get Google Chrome

          Advanced search Language tools

        [Google Search][I'm Feeling Lucky]

     Advertising Programmes Business Solutions+GoogleAbout GoogleGoogle.com
                           ? 2016 - Privacy - Terms

Linux
  1. So installieren Sie Vim (vi) unter Windows 10

  2. Eine eingehende Mail von Text/plain zu Text/html ändern?

  3. So konvertieren Sie Textdateien in Groß- oder Kleinbuchstaben

  4. Konvertieren Sie alle Linux-Manpages in Text / HTML oder Markdown

  5. So konvertieren Sie PDF in Graustufen

So konvertieren Sie eine Windows-Datei in eine UNIX-Datei

So konvertieren Sie Dateiformate mit Pandoc in Linux [Kurzanleitung]

So konvertieren Sie eine Webseite unter Linux in PDF

So konvertieren Sie Textdokumente in Sprache auf Ubuntu mit eSpeak

So entpacken Sie 80-Zeichen-Text

Wie konvertiert man bestimmten Text aus einer Liste in Großbuchstaben?