GNU/Linux >> LINUX-Kenntnisse >  >> Linux

Warum zählt uniq identische Wörter als unterschiedlich?

Versuchen Sie zuerst zu sortieren:

cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt

Oder verwenden Sie "sort -u", wodurch auch Duplikate eliminiert werden. Siehe hier.


Die Größe der Datei hat nichts mit dem zu tun, was Sie sehen. Aus der Manpage von uniq(1):

Hinweis:„uniq“ erkennt keine wiederholten Zeilen, es sei denn, sie sind benachbart. Möglicherweise möchten Sie die Eingabe zuerst sortieren oder „sort -u“ ohne „uniq“ verwenden. Außerdem berücksichtigen Vergleiche die von 'LC_COLLATE'.`

festgelegten Regeln

Also uniq ausführen ein

a
b
a

gibt zurück:

a
b
a

Linux
  1. Warum hat ein neues Verzeichnis eine Anzahl fester Links von 2, bevor etwas hinzugefügt wird?

  2. Uniq für Unicode-Text verwenden?

  3. Warum druckt Man um 00:30 Uhr „Gimme Gimme Gimme“?

  4. Warum fügt die Ssh -t Option Cr &Lf in der umgeleiteten Ausgabe hinzu?

  5. Warum funktioniert find -mtime bei Dateien mit unterschiedlichen Zeitzonen nicht wie erwartet?

Linux WC-Befehl zum Zählen der Anzahl der Zeilen, Wörter und Zeichen

Warum stimmt [a-z] mit Kleinbuchstaben in Bash überein?

Warum ignoriert Sudo Aliasse?

Linux – Warum funktioniert Setuid nicht?

Warum überspringt Strg + Pfeil nach links keine Wörter?

Warum zeigt top eine andere Anzahl von Kernen an als cpuinfo?