Por que os compiladores perdem a vetorização aqui?

Question

Nils Werner

Asked: 2025-04-10 01:00:03 +0800 CST2025-04-10 01:00:03 +0800 CST 2025-04-10 01:00:03 +0800 CST

A ordem de execução de Eigen unaryExpr() é sempre sequencial?

772

Escrevi uma classe de filtro IIR com um estado de filtro interno e uma função elemento a elemento float filter(float x). Naturalmente, devido ao estado de filtro interno, ela filter()só pode ser chamada nas amostras na ordem em que estão organizadas na sequência.

Se eu agora aplicar essa função a um Eigen Array, como

input.unaryExpr(filter);

a ordem de execução será unaryExpr()sempre estritamente na ordem dos valores no array, ou pode ocorrer execução fora de ordem ou até mesmo paralelização?

Seria mais seguro escrever o loop explicitamente para garantir que a ordem seja sempre a esperada?

No momento, parece estar funcionando corretamente, mas não consigo encontrar nenhuma documentação explícita sobre seu comportamento.

1 respostas

Voted

Homer512 · Answer 1 · 2025-04-10T02:35:46+08:00

Uma expressão unária, como todas as expressões próprias, é na verdade apenas um functor sofisticado que se comporta como um Eigen::Matrixor Array, que permite alguma introspecção e pode ser solicitado para valores de índices individuais de linha e coluna. A ordem em que esses valores são solicitados é determinada pelo objeto ao qual os valores são atribuídos; essencialmente, o lado esquerdo da atribuição. Podemos demonstrar isso em 2D:

  Eigen::ArrayXXi in(2, 3);
  in <<
    0, 1, 2,
    3, 4, 5;
  // just the identity function with some debut output
  auto expr = in.unaryExpr([](int x) {
    std::cout << x << ' ';
    return x;
  });

  // assignment 1, simple copy
  Eigen::ArrayXXi out1 = expr;
  std::cout << '\n';

  // assignment 2, copy to row major array
  using RowMajorArray = Eigen::Array<
    int, Eigen::Dynamic, Eigen::Dynamic, Eigen::RowMajor>;
  RowMajorArray out2 = expr;
  std::cout << '\n';

  // assignment 3, copy to transposed output array
  Eigen::ArrayXXi out3(3, 2);
  out3.transpose() = expr;

A primeira atribuição imprime 0 3 1 4 2 5, as outras duas imprimem 0 1 2 3 4 5. O motivo é que out1usa a ordem padrão de coluna principal. Portanto, a ordem mais eficiente para preenchê-la com valores é coluna 0 linha 0, coluna 0 linha 1, coluna 1, linha 0, coluna 1 linha 1, … As outras duas matrizes de saída têm ordem de memória transposta, portanto, usam a ordem de atribuição transposta.

Observe também que nada me impede de avaliar duas vezes. É claro que isso não é um uso regular, mas pode aparecer em códigos que de outra forma seriam inofensivos, como este modelo aqui:

template<class Derived>
typename Eigen::ArrayBase<Derived>::PlainObject
derivative(const Eigen::ArrayBase<Derived>& in)
{
  Eigen::Index n = in.cols() - 1;
  return in.rightCols(n) - in.leftCols(n);
}

Se eu chamar derivative(in.unaryExpr(…)), ele imprimirá 0 1 3 4 1 2 4 5, avaliando a maioria das entradas duas vezes.

Resumindo: não acho uma boa ideia tornar as expressões com estado como você deseja, pelo menos em geral. Idealmente, as expressões devem ser idempotentes. Mas se for o código mais curto, você sabe o que está fazendo e adiciona alguns avisos para que o próximo programador também entenda as limitações, deve ficar tudo bem.

Em geral, o Eigen não realiza paralelismo automaticamente, exceto para multiplicações de matrizes e operações complexas semelhantes e conhecidas. Todo o resto é considerado pequeno, rápido e, em grande parte, limitado pela largura de banda da memória. Não consigo imaginar essa suposição mudando, exceto em uma nova versão principal, o Eigen4. E mesmo assim, eu não presumiria que esse fosse o comportamento padrão para expressões personalizadas. O custo de iniciar e interromper uma região paralela do OpenMP é alto demais para ser feito sem um bom conhecimento de que isso se justifica. E, por definição, o Eigen não tem ideia da complexidade computacional da sua expressão personalizada.

Em geral, a ordem de avaliação também será de frente para trás na ordem de armazenamento da saída na memória, pelo menos em casos simples. Isso é o que torna o cálculo rápido e a programação simples.

Pessoalmente, eu usaria apenas um método simples std::transformou um loop para tornar a ordem das operações explícita. Iteradores para vetores e matrizes 1D são rápidos, o mesmo com colwise()iteradores em 2D.

Eigen::ArrayXf input(1234), output(1234);
std::transform(std::begin(input), std::end(input), std::begin(output),
    [state](float x) mutable { return state(x); });

A ordem de execução de Eigen unaryExpr() é sempre sequencial?

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

A ordem de execução de Eigen unaryExpr() é sempre sequencial?

1 respostas

relate perguntas