Versuchen Sie zuerst zu sortieren:
cat .temp_occ | sort| uniq -c | sort -k1,1nr -k2 > distribution.txt
Oder verwenden Sie "sort -u", wodurch auch Duplikate eliminiert werden. Siehe hier.
Die Größe der Datei hat nichts mit dem zu tun, was Sie sehen. Aus der Manpage von uniq(1):
Hinweis:„uniq“ erkennt keine wiederholten Zeilen, es sei denn, sie sind benachbart. Möglicherweise möchten Sie die Eingabe zuerst sortieren oder „sort -u“ ohne „uniq“ verwenden. Außerdem berücksichtigen Vergleiche die von 'LC_COLLATE'.`
festgelegten Regeln
Also uniq
ausführen ein
a
b
a
gibt zurück:
a
b
a