Eu tenho o caractere Unicode ᚠ, representado por seu ponto de código Unicode 16A0, em um arquivo de texto (o arquivo de texto é codificado(?) como utf-8).
Quando faço grep '\u16A0' test.txt
não obtenho resultado. Como faço para grep esse personagem?
Você pode usar aspas ANSI-C para substituir caracteres com escape de barra invertida conforme especificado pelo padrão ANSI C.
Para alguns exemplos mais complexos, você pode consultar esta pergunta relacionada e suas respostas.
Você pode usar o ugrep como um substituto do grep para corresponder ao ponto de código Unicode U + 16A0:
Ele usa as mesmas opções do grep, mas oferece muito mais recursos, como:
Veja ugrep no GitHub para detalhes.