Lösung 1:
Perl ist (wie immer) dein Freund. Ich denke, das wird es tun:
perl -n -mHTML::Entities -e ' ; print HTML::Entities::decode_entities($_) ;'
Beispiel:
echo '"test" & test $test ! test @ # $ % ^ & *' |perl -n -mHTML::Entities -e ' ; print HTML::Entities::decode_entities($_) ;'
Mit Ausgabe:
[email protected] ~]$ echo '"test" & test $test ! test @ # $ % ^ & *' |perl -n -mHTML::Entities -e ' ; print HTML::Entities::decode_entities($_) ;'
"test" & test $test ! test @ # $ % ^ & *
Lösung 2:
Dafür ist PHP gut geeignet. Dieses Beispiel erfordert PHP 5:
cat file.html | php -R 'echo html_entity_decode($argn);'
Lösung 3:
recode scheint in Standardpaket-Repositories der wichtigsten GNU/Linux-Distributionen verfügbar zu sein. Z.B. um HTML-Einheiten in UTF-8 zu decodieren:
…|recode html..utf8
Lösung 4:
Mit Python 3:
python3 -c 'import html,sys; print(html.unescape(sys.stdin.read()), end="")' < file.html