Por que os compiladores perdem a vetorização aqui?

Question

hk134579

Asked: 2025-04-02 11:03:08 +0800 CST2025-04-02 11:03:08 +0800 CST 2025-04-02 11:03:08 +0800 CST

Exemplo de barreira de memória wiki do GCC

772

O código a seguir vem do GCC Wiki .

// -Thread 1-
y.store (20, memory_order_relaxed)
x.store (10, memory_order_relaxed)

// -Thread 2-
if (x.load (memory_order_relaxed) == 10)
 {
   assert (y.load(memory_order_relaxed) == 20) /* assert A */
   y.store (10, memory_order_relaxed)
 }

// -Thread 3-
if (y.load (memory_order_relaxed) == 10)
 assert (x.load(memory_order_relaxed) == 10) /* assert B */

Como os threads não precisam ser sincronizados no sistema, qualquer uma das asserções neste exemplo pode realmente FALHAR .

Eu consigo entender por que assert A pode falhar. Mas como assert B também pode falhar?

Isso y.load() == 10implica o fim do tópico 2, então x.load() == 10?

1 respostas

Voted

Peter Cordes · Answer 1 · 2025-04-02T11:32:42+08:00

Pode ser possível somente em uma máquina que não seja multi-copy-atomic (como POWER), onde a reordenação IRIW é possível. ( Duas gravações atômicas em locais diferentes em threads diferentes sempre serão vistas na mesma ordem por outras threads? ).

Então o T2 vê x == 10antes de ser visível globalmente e armazena y=10.

O T3 pode então ler o armazenamento do T2 yantes que o x=10armazenamento fique visível para ele. (Reordenação do StoreStore do núcleo físico executando T1 e T2 para o núcleo físico executando T3).

Isso pode ser possível em hardware POWER ou NVidia ARMv7 real se T1 e T2 forem executados em núcleos lógicos diferentes do mesmo núcleo físico, e T3 for executado em um núcleo físico separado.

Em termos de modelos de memória C ou C++, o assert pode falhar porque nada garante visibilidade. O fato de uma thread ter visto um valor não implica que todas as threads podem ver esse valor.

Pode haver outros mecanismos mais simples também, mas o assertin T2 significa que y.store (10, relaxed)isso não acontece se essa afirmação falhar, então não é tão simples quanto apenas x.loadexecutar before y.load.

Exemplo de barreira de memória wiki do GCC

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Exemplo de barreira de memória wiki do GCC

1 respostas

relate perguntas