Eu corri isso:
cat /usr/bin/* |
perl -ne 'map {$a{$_}++} split//; END{print map { "$a{$_}\t$_\n" } keys %a}' |
grep --text . | sort -n | plotpipe --log y {1}
e consegui isso:
(Mesmo com um log do eixo y, ainda parece exponencial! Há mais de 100x entre o topo e o fundo)
Olhando para os números:
:
31919597 ^H
32983719 ^B
33943030 ^O
39130281 \213
39893389 $
52237360 \211
53229196 ^A
76884442 \377
100776756 H
746405320 ^@
Não é de surpreender que ^@ (NUL) seja o byte mais comum em executáveis. \377 (255) e ^A (1) também fazem sentido intuitivamente para mim.
Mas o que faz com que 'H' (72) seja o segundo byte mais comum em executáveis - muito mais comum que 255 e 1?