Eu baixo os dados em um arquivo dessa maneira (crédito a Valentin Bajrami pelo código):
curl https://en.wikipedia.org/wiki/Help:Special_page -s | grep -o 'Special:[a-zA-Z0-9]*' | sort -u > special_page_names
Eu uso Special:
apenas para uma correspondência precisa, mas, na verdade, depois que os dados foram baixados, não deveria ter esse Special:
texto.
Logo após o sort
, o que eu poderia remover Special:
?
Não há necessidade de outro tubo. Tente isto: