Unlikus提出的问题 -coding

Unlikus

Asked: 2024-03-27 18:52:57 +0800 CST

Compreendendo o rendimento da implementação do simd sum x86

Eu tenho o seguinte loop no asm:

.LBB5_5:
 vaddpd  ymm0, ymm0, ymmword, ptr, [rdi, +, 8*rcx]
 vaddpd  ymm1, ymm1, ymmword, ptr, [rdi, +, 8*rcx, +, 32]
 vaddpd  ymm2, ymm2, ymmword, ptr, [rdi, +, 8*rcx, +, 64]
 vaddpd  ymm3, ymm3, ymmword, ptr, [rdi, +, 8*rcx, +, 96]
 add     rcx, 16
 cmp     rax, rcx
 jne     .LBB5_5

Isso faz parte de uma função maior que calcula a soma de um [f64]array em Rust.

Comparei esse código com a caixa de critérios e consegui que os ciclos 1 000 000 000duplos ocorressem 200 000 000na minha CPU Rocket Lake (i7 11700K)

Em várias fontes, descobri que a latência de uma adição de ponto flutuante é de 4 ciclos nesta CPU. Isso significaria que cada um deles vaddpdsó pode ser executado a cada 4 ciclos, pois carregam uma dependência da soma anterior. Isso significaria que só posso fazer 4 adições duplas por ciclo no máximo.

Minha medição mostra que faz 5 adições por ciclo. (Ele usa as RDTSCinstruções para medi-lo, não tenho certeza se isso pode ser problemático)

Quero principalmente entender o que está acontecendo e testar se entendo bem o pipeline da CPU.

Compreendendo o rendimento da implementação do simd sum x86

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Unlikus's questions