GNU/Linux >> LINUX-Kenntnisse > >> Linux

Warum zählt uniq identische Wörter als unterschiedlich?

Versuchen Sie zuerst zu sortieren:

cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt

Oder verwenden Sie "sort -u", wodurch auch Duplikate eliminiert werden. Siehe hier.

Die Größe der Datei hat nichts mit dem zu tun, was Sie sehen. Aus der Manpage von uniq(1):

Hinweis:„uniq“ erkennt keine wiederholten Zeilen, es sei denn, sie sind benachbart. Möglicherweise möchten Sie die Eingabe zuerst sortieren oder „sort -u“ ohne „uniq“ verwenden. Außerdem berücksichtigen Vergleiche die von 'LC_COLLATE'.`

festgelegten Regeln

Also uniq ausführen ein

a
b
a

gibt zurück:

a
b
a

URL, die eine Zeichenfolge in Bash-Skript codiert

Nicht ausgerichtete Speicherzugriffe auf x86/x86_64 verbieten

Linux

Linux WC-Befehl zum Zählen der Anzahl der Zeilen, Wörter und Zeichen

Warum stimmt [a-z] mit Kleinbuchstaben in Bash überein?

Warum ignoriert Sudo Aliasse?

Linux – Warum funktioniert Setuid nicht?

Warum überspringt Strg + Pfeil nach links keine Wörter?

Warum zeigt top eine andere Anzahl von Kernen an als cpuinfo?