Propriedades JMeter gravando simultaneamente

Question

Not A Name

Asked: 2025-03-24 01:23:18 +0800 CST2025-03-24 01:23:18 +0800 CST 2025-03-24 01:23:18 +0800 CST

A ordem consistente sequencial do C++11 vs. built-ins tradicionais do GCC como `__sync_synchronize`

772

Então me deparei com as postagens maravilhosas do blog de Jeff Preshing sobre o que é Acquire/ Releasee como elas podem ser alcançadas com algumas barreiras de CPU .

Também li que SeqCstse trata de uma ordem total que é garantidamente consistente com a relação não coerente-depois - embora às vezes possa contradizer a relação acontece-antes estabelecida por operações simples Acquiredevido Releasea razões históricas.

Minha pergunta é : como os antigos built-ins do GCC mapeiam no modelo de memória proposto pelo C++11 (e revisões posteriores)? Em particular, como mapear __sync_synchronize()no C++11 ou no C/C++ moderno posterior?

No manual do GCC, essa chamada é simplesmente descrita como uma barreira de memória completa , que eu suponho ser a combinação de todos os quatro principais tipos de barreira, ou seja, barreirasLoadLoad / LoadStore/ StoreLoad/ todas de uma vez. Mas é equivalente a ? Ou talvez , formalmente falando , uma delas seja mais forte que a outra (o que eu suponho ser o caso aqui: em geral, uma cerca deve ser mais forte, pois requer que a cadeia de ferramentas/plataforma improvise uma ordenação global de alguma forma, não?), e acontece que a maioria das CPUs por aí fornece apenas instruções que satisfazem ambas (barreira de memória completa por , ordenação sequencial total por ) de uma vez , por exemplo x86 e PowerPC ?StoreStore sync_synchronize std::atomic_thread_fence(memory_order_seq_cst)SeqCst__sync_synchronizestd::atomic_thread_fence(memory_order_seq_cst)mfencehwsync

Ou __sync_synchronizee std::atomic_thread_fence(memory_order_seq_cst)são formalmente iguais ou são efetivamente iguais (ou seja, formalmente falando, são diferentes, mas nenhuma CPU comercializada se preocupa em diferenciar entre os dois), tecnicamente falando, uma memory_order_relaxedcarga no mesmo atômico ainda não pode ser confiável para sincronizar com /criar acontece antes da relação com ele, certo?

Tecnicamente falando, todas essas afirmações podem falhar, certo?

// Experiment 1, using C11 `atomic_thread_fence`: assertion is allowed to fail, right?

// global
static atomic_bool lock = false;
static atomic_bool critical_section = false;

// thread 1
atomic_store_explicit(&critical_section, true, memory_order_relaxed);
atomic_thread_fence(memory_order_seq_cst);
atomic_store_explicit(&lock, true, memory_order_relaxed);

// thread 2
if (atomic_load_explicit(&lock, memory_order_relaxed)) {
    // We should really `memory_order_acquire` the `lock`
    // or `atomic_thread_fence(memory_order_acquire)` here,
    // or this assertion may fail, no?
    assert(atomic_load_explicit(&critical_section, memory_order_relaxed));
}

// Experiment 2, using `SeqCst` directly on the atomic store

// global
static atomic_bool lock = false;
static atomic_bool critical_section = false;

// thread 1
atomic_store_explicit(&critical_section, true, memory_order_relaxed);
atomic_store_explicit(&lock, true, memory_order_seq_cst);

// thread 2
if (atomic_load_explicit(&lock, memory_order_relaxed)) {
    // Again we should really `memory_order_acquire` the `lock`
    // or `atomic_thread_fence(memory_order_acquire)` here,
    // or this assertion may fail, no?
    assert(atomic_load_explicit(&critical_section, memory_order_relaxed));
}

// Experiment 3, using GCC built-in: assertion is allowed to fail, right?

// global
static atomic_bool lock = false;
static atomic_bool critical_section = false;

// thread 1
atomic_store_explicit(&critical_section, true, memory_order_relaxed);
__sync_synchronize();
atomic_store_explicit(&lock, true, memory_order_relaxed);

// thread 2
if (atomic_load_explicit(&lock, memory_order_relaxed)) {
    // we should somehow put a `LoadLoad` memory barrier here,
    // or the assert might fail, no?
    assert(atomic_load_explicit(&critical_section, memory_order_relaxed));
}

Eu tentei esses snippets no meu RPi 5, mas não vejo falhas nas asserções. Sim, isso não prova nada formalmente, mas também não esclarece a diferenciação entre __sync_synchronizee std::atomic_thread_fence(memory_order_seq_cst).

1 respostas

Voted

Peter Cordes · Answer 1 · 2025-03-24T03:39:26+08:00

Sim, __sync_synchronize()é pelo menos na prática equivalente a std::atomic_thread_fence(memory_order_seq_cst).

Formalmente, __sync_synchronize()opera em termos de barreiras de memória e bloqueio de reordenação de memória, pois é anterior à existência do modelo de memória formal do C++11. atomic_thread_fenceopera em termos do modelo de memória do C++11; compilar para uma instrução de barreira completa é um detalhe de implementação.

Então, por exemplo, não é exigido pelo padrão for para thread_fencefazer nada em um programa onde não há std::atomic<>objetos porque seu comportamento é definido apenas em termos de atômicos. Enquanto __sync_synchronize()(e thread_fencena prática como um detalhe de implementação em GCC/clang) poderia deixar você hackear algo em termos de sincronização em intvariáveis simples. Isso é UB em C++11, e uma má ideia mesmo em termos de uma implementação conhecida como GCC; veja Quem tem medo de um grande e mau compilador otimizador? re: a maldade óbvia vs. não óbvia (como cargas inventadas) que pode acontecer quando você apenas usa barreiras de memória em vez de std::atomiccom relaxedvariáveis compartilhadas para impedir que um compilador as mantenha em registradores.

Mas meu ponto é que, na prática, eles funcionam da mesma forma, mas são de modelos de memória diferentes: os __syncbuiltins são em termos de barreiras contra reordenação local de acessos à memória compartilhada coerente com cache (ou seja, uma visão de arquitetura de CPU), vs. std::atomiccoisas do C++11 sendo em termos de seu formalismo com ordens de modificação e sincronizações com/acontece antes. O que formalmente permite algumas coisas que não são plausíveis em uma CPU real que usa memória compartilhada coerente com cache.

Sim, em seus blocos de código, a asserção pode falhar em uma CPU onde a reordenação LoadLoad é possível. Provavelmente não é possível com ambas as variáveis na mesma linha de cache. Veja o exemplo de problema de ordem de memória de variável atômica C++ não pode reproduzir a reordenação LoadStore para outro caso de tentativa de reproduzir a reordenação de memória.

A ordem consistente sequencial do C++11 vs. built-ins tradicionais do GCC como `__sync_synchronize`

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

A ordem consistente sequencial do C++11 vs. built-ins tradicionais do GCC como `__sync_synchronize`

1 respostas

relate perguntas