exportar variáveis env programaticamente, via stdout do comando [duplicado]

Question

Gabriel Diego

Asked: 2019-10-18 15:56:56 +0800 CST2019-10-18 15:56:56 +0800 CST 2019-10-18 15:56:56 +0800 CST

Como usar uma string em caracteres chineses como entrada para outro comando no bash?

772

Atualmente, estou usando um comando para converter alguns caracteres chineses em pinyin, o que exige que a string no meu bash seja segura para Unicode e coloque o resultado em outra variável. Eu posso executar o seguinte comando normalmente:

  chinese="你好"
  to-pinyin.py $chinese

Ele imprimirá a saída conforme o esperado, no entanto, como quero a saída em uma variável, tentei fazer o seguinte:

  chinese="你好"
  pinyin=$(to-pinyin.py $chinese)

E python falhará com:

Traceback (most recent call last):
  File "/~/to-pinyin.py", line 31, in <module>
    print pinyin.get(hanzi, delimiter=" ").capitalize()
UnicodeEncodeError: 'ascii' codec can't encode character u'\u01d0' in position 1: ordinal not in range(128)

A mesma coisa vai acontecer com backticks. Acho que vou contornar escrevendo a saída em um arquivo e em uma conversão lá, depois carregar as strings em uma variável. De que outra forma posso corrigir isso para evitar a solução alternativa?

EDITAR:

Por solicitação, aqui está a saída do locale:

$ locale
LANG=en_US.UTF-8
LANGUAGE=en_US
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

SOLUÇÃO UTILIZADA

Graças à resposta de muru e alguma ajuda desta outra resposta , adicionei .encode('utf-8')ao final das strings impressas no meu script python.

Eu gostaria de poder mudar para python3, mas não há nenhum pacote pinyin padrão e não consigo instalar nenhum bom pacote pinyin que faria meu trabalho rapidamente em python3. Lembro-me de tentar por um tempo, mas python3 continuou se recusando a importar o pacote que eu instalei, então instalei um em python2 e funcionou imediatamente.

1 respostas

Voted

muru · Answer 1 · 2019-10-18T18:58:40+08:00

Best Answer

muru

2019-10-18T18:58:40+08:002019-10-18T18:58:40+08:00

Este é um problema com o Python 2print e uma razão para favorecer o manuseio consistente de Unicode do Python 3.

Agora, por que redirecionar para um arquivo causa problemas? É porque print()em python2 é tratado especialmente. Enquanto os outros objetos semelhantes a arquivos em python sempre convertem para ASCII , a menos que você os configure de maneira diferente, usar print()to output para o terminal usará a localidade do usuário para converter antes de enviar a saída para o terminal. Quando print()não está saindo para o terminal (sendo redirecionado para um arquivo, por exemplo), print()decide que não sabe qual localidade usar para esse arquivo e, portanto, tenta converter para ASCII .

4

Como usar uma string em caracteres chineses como entrada para outro comando no bash?

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Como usar uma string em caracteres chineses como entrada para outro comando no bash?

1 respostas

relate perguntas