Leia o arquivo de texto com palavras e sua contagem de ocorrências e saída de impressão classificada

Question

Stupid

Asked: 2019-06-07 06:21:49 +0800 CST2019-06-07 06:21:49 +0800 CST 2019-06-07 06:21:49 +0800 CST

Como grep caracteres com seu valor unicode?

772

Eu tenho o caractere Unicode ᚠ, representado por seu ponto de código Unicode 16A0, em um arquivo de texto (o arquivo de texto é codificado(?) como utf-8).

Quando faço grep '\u16A0' test.txtnão obtenho resultado. Como faço para grep esse personagem?

2 respostas

Voted

pLumo · Answer 1 · 2019-06-07T06:52:28+08:00

Best Answer

pLumo

2019-06-07T06:52:28+08:002019-06-07T06:52:28+08:00

Você pode usar aspas ANSI-C para substituir caracteres com escape de barra invertida conforme especificado pelo padrão ANSI C.

grep $'\u16A0'

Para alguns exemplos mais complexos, você pode consultar esta pergunta relacionada e suas respostas.

21

Dr. Alex RE · Answer 2 · 2020-01-14T13:04:53+08:00

Dr. Alex RE

2020-01-14T13:04:53+08:002020-01-14T13:04:53+08:00

Você pode usar o ugrep como um substituto do grep para corresponder ao ponto de código Unicode U + 16A0:

ugrep '\x{16A0}' test.txt

Ele usa as mesmas opções do grep, mas oferece muito mais recursos, como:

O ugrep pesquisa a entrada UTF-8/16/32 e outros formatos . A opção -Q permite que muitos outros formatos de arquivo sejam pesquisados, como ISO-8859-1 a 16, EBCDIC, páginas de código 437, 850, 858, 1250 a 1258, MacRoman e KIO8.

ugrep corresponde aos padrões Unicode por padrão (desativado com a opção -U). A sintaxe do padrão de expressão regular é compatível com POSIX ERE estendida com sintaxe semelhante a PCRE. A opção -P também pode ser usada para correspondência Perl com padrões Unicode.

Veja ugrep no GitHub para detalhes.

3

Como grep caracteres com seu valor unicode?

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Como grep caracteres com seu valor unicode?

2 respostas

relate perguntas