Obter saída somente hexadecimal do objdump

Question

Sebastian Carlos

Asked: 2023-10-30 17:51:02 +0800 CST2023-10-30 17:51:02 +0800 CST 2023-10-30 17:51:02 +0800 CST

Por que MB_CUR_MAX 6 em vez de 4 para UTF-8? (Linux, glibc)

772

MB_CUR_MAXé definido pela glibc como 'uma expressão inteira positiva que é o número máximo de bytes em um caractere multibyte no código do idioma atual.'

Se eu imprimir o valor eu recebo 1. Presumo que isso ocorre porque C usa a Clocalidade por padrão, mesmo que a localidade do meu sistema seja en_US.UTF-8.

Se eu adicionar setlocale(LC_ALL, "")ao meu programa, que deve permitir o uso da localidade do ambiente, ele MB_CUR_MAXse tornará 6.

Agora minha pergunta é: por que 6? UTF-8 não é uma codificação com 1 a 4 bytes por ponto de código?

1 respostas

Voted

Sebastian Carlos · Answer 1 · 2023-10-30T19:53:10+08:00

Best Answer

Sebastian Carlos

2023-10-30T19:53:10+08:002023-10-30T19:53:10+08:00

De acordo com a Wikipedia , o UTF-8 realmente precisava de até 6 bytes até 2003, quando a RFC 3629 adicionou algumas restrições:

O UTF-8 foi apresentado oficialmente pela primeira vez na conferência USENIX em San Diego, de 25 a 29 de janeiro de 1993. A Força-Tarefa de Engenharia da Internet adotou o UTF-8 em sua Política sobre Conjuntos de Caracteres e Idiomas na RFC 2277 (BCP 18) para a futura Internet. padrões funcionam [...]

[A tabela acima, denominada "UTF-8 (1993)" mostra que a representação de pontos de código de U+4000000 a U+7FFFFFFF requer 6 bytes]

Em novembro de 2003, o UTF-8 foi restringido pela RFC 3629 para corresponder às restrições da codificação de caracteres UTF-16: proibir explicitamente os pontos de código correspondentes aos caracteres substitutos altos e baixos removeu mais de 3% das sequências de três bytes, e terminando em U+10FFFF removeu mais de 48% das sequências de quatro bytes e todas as sequências de cinco e seis bytes.

1

Por que MB_CUR_MAX 6 em vez de 4 para UTF-8? (Linux, glibc)

Possível firmware ausente /lib/firmware/i915/* para o módulo i915

Falha ao buscar o repositório de backports jessie

Como exportar uma chave privada GPG e uma chave pública para um arquivo

Como podemos executar um comando armazenado em uma variável?

Como configurar o systemd-resolved e o systemd-networkd para usar o servidor DNS local para resolver domínios locais e o servidor DNS remoto para domínios remotos?

apt-get update error no Kali Linux após a atualização do dist [duplicado]

Como ver as últimas linhas x do log de serviço systemctl

Nano - pule para o final do arquivo

erro grub: você precisa carregar o kernel primeiro

Como baixar o pacote não instalá-lo com o comando apt-get?

Por que MB_CUR_MAX 6 em vez de 4 para UTF-8? (Linux, glibc)

1 respostas

relate perguntas