Por que os compiladores perdem a vetorização aqui?

Question

geza

Asked: 2024-12-12 04:42:20 +0800 CST2024-12-12 04:42:20 +0800 CST 2024-12-12 04:42:20 +0800 CST

Por que o gcc compara valores de ponto flutuante aparentemente iguais como diferentes com "-fexcess-precision=standard"?

772

Veja este trecho:

int main() {
    double v = 1.1;
    return v == 1.1;
}

Em compilações de 32 bits, este programa retorna 0, se -fexcess-precision=standardfor especificado. Sem ele, o programa retorna 1.

Por que há uma diferença? Olhando para o código assembly ( godbolt ), parece que com -fexcess-precision=standard, o gcc usa 1.1como uma long doubleconstante (ele carrega a constante como TBYTE). Por que ele faz isso?

Primeiro pensei que fosse um bug, mas encontrei este comentário de bug do gcc , parece que esse comportamento é intencional, ou pelo menos não é inesperado.

Isso é um problema de QoI? Eu entendo que a comparação é executada usando long doubleprecisão, mas ainda assim, my 1.1não é um long doubleliteral. O estranho é que se eu lançar o 1.1at na comparação to double(que já é um double), o problema desaparece.

(Outra coisa estranha é que o GCC faz o carregamento e a comparação duas vezes, veja as fucomipinstruções duplas. Mas ele faz isso mesmo no modo de 64 bits. Entendo que no meu link godbolt, a otimização está desativada, mas ainda assim, há apenas uma comparação no meu código, por que o GCC compara duas vezes?)

Aqui está o código asm, sem -fexcess-precision=standard:

main:
        push    ebp
        mov     ebp, esp
        and     esp, -8
        sub     esp, 16
        fld     QWORD PTR .LC0
        fstp    QWORD PTR [esp+8]
        fld     QWORD PTR [esp+8]
        fld     QWORD PTR .LC0
        fucomip st, st(1)
        fstp    st(0)
        setnp   al
        mov     edx, 0
        fld     QWORD PTR [esp+8]
        fld     QWORD PTR .LC0
        fucomip st, st(1)
        fstp    st(0)
        cmovne  eax, edx
        movzx   eax, al
        leave
        ret
.LC0:
        .long   -1717986918
        .long   1072798105

E aqui está:

main:
        push    ebp
        mov     ebp, esp
        and     esp, -8
        sub     esp, 16
        fld     QWORD PTR .LC0
        fstp    QWORD PTR [esp+8]
        fld     QWORD PTR [esp+8]
        fld     TBYTE PTR .LC1
        fucomip st, st(1)
        setnp   al
        mov     edx, 0
        fld     TBYTE PTR .LC1
        fucomip st, st(1)
        fstp    st(0)
        cmovne  eax, edx
        movzx   eax, al
        leave
        ret
.LC0:
        .long   -1717986918
        .long   1072798105
.LC1:
        .long   -858993459
        .long   -1932735284
        .long   16383

2 respostas

Voted

user17732522 · Answer 1 · 2024-12-12T18:28:19+08:00

Em C, é permitido (conforme indicado via FLT_EVAL_METHOD) que um literal de ponto flutuante possa conter um valor com mais previsão, conforme permitido por seu tipo e que, ao mesmo tempo, operadores de ponto flutuante sejam avaliados com uma precisão maior do que os tipos de operando permitem.

Nesse caso, v == 1.1pode ser falso porque o literal 1.1, embora do tipo double, não será arredondado para doubleprecisão, mas ==ainda o compara com maior precisão com o valor armazenado, vque ainda deve ser arredondado para um valor representável por double.

Em C++, embora ainda seja permitido que operações de ponto flutuante sejam avaliadas com maior precisão, o valor de um literal de ponto flutuante ainda precisa ser arredondado para um valor representável em seu tipo.

No entanto, isso interage incorretamente com a especificação incorporada de C, como FLT_EVAL_METHOD, e desvia de C aparentemente sem motivo, então a questão da precisão de valores literais de ponto flutuante ainda é uma questão em aberto, veja https://cplusplus.github.io/CWG/issues/2752.html e https://github.com/cplusplus/papers/issues/1584 .

Sem o -fexcess-precision=standardsinalizador, o GCC não se comporta de forma alguma em conformidade com o padrão e pode até interpretar o valor de vcomo uma precisão maior do que seu tipo permite, o que não é permitido nem pelo padrão C nem pelo C++. (Atribuição, conversão e inicialização devem sempre forçar um arredondamento para um valor representável no tipo real.) Com isso, pode acontecer que v == 1.1seja verdadeiro novamente em virtude de tanto o literal quanto o valor de vconforme recuperado do literal nunca serem arredondados para um doublevalor representável.

Tudo isso é tipicamente relevante em, por exemplo, uma compilação x86 de 32 bits, onde FLT_EVAL_METHODfrequentemente será definido como 2, significando que a precisão mais alta mencionada acima deve sempre ser escolhida como se o tipo fosse long double. Isso é para dar suporte à manutenção doublecomo tipo de 64 bits ao executar operações de ponto flutuante com precisão de 80 bits na FPU x87. Normalmente, essa escolha para FLT_EVAL_METHODtorna o comportamento determinístico no sentido de que é possível dizer exatamente onde um arredondamento é aplicado, mas observe que o padrão ( -fexcess-precision=fast) do GCC não será consistente em se e onde o arredondamento será aplicado.

Dado que FLT_EVAL_METHODé 2e dadas as escolhas para tipos de ponto flutuante, seguindo as regras C, v == 1.1avaliar como falso é o único comportamento correto em conformidade com o padrão. Para C++ isso é diferente, mas não está claro se isso é um defeito no padrão C++. Portanto, é um tanto compreensível por que o GCC seguiria o comportamento necessário em C.

O fato de que v == 1.1pode ser avaliado como falso é muito intencional e os programadores precisam estar cientes do comportamento de excesso de precisão, a menos que tenham certeza de que seu código só precisa suportar implementações nas FLT_EVAL_METHOD == 0quais nenhum excesso de precisão será aplicado.

gnasher729 · Answer 2 · 2024-12-12T08:03:44+08:00

gnasher729

2024-12-12T08:03:44+08:002024-12-12T08:03:44+08:00

Para processadores Intel, long double geralmente é um tipo de ponto flutuante de 80 bits, maior que o double simples de 64 bits.

E então faz sentido: você pega 1,1 com precisão de 80 bits, arredonda para baixo para precisão de 64 bits e armazena em um double.

Então você pega 1.1 com precisão de 80 bits e compara com 1.1 com precisão de 64 bits. Os valores são diferentes porque um tem 16 bits a mais.

0

Por que o gcc compara valores de ponto flutuante aparentemente iguais como diferentes com "-fexcess-precision=standard"?

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Por que o gcc compara valores de ponto flutuante aparentemente iguais como diferentes com "-fexcess-precision=standard"?

2 respostas

relate perguntas