为什么编译器在这里错过矢量化？

Question

Nils Werner

Asked: 2025-04-10 01:00:03 +0800 CST2025-04-10 01:00:03 +0800 CST 2025-04-10 01:00:03 +0800 CST

Eigen unaryExpr() 的执行顺序总是连续的吗？

772

我编写了一个 IIR 滤波器类，它具有内部滤波器状态和元素级函数float filter(float x)。当然，由于内部滤波器状态，filter()只能按照序列中排列的顺序对样本调用。

如果我现在将该函数应用于特征数组，例如

input.unaryExpr(filter);

的执行顺序是否unaryExpr()总是严格按照数组中值的顺序，还是可能会出现乱序执行甚至并行化的情况？

明确地编写循环以确保顺序始终符合预期，这样会更安全吗？

现在它似乎运行正常，但我找不到有关其行为的任何明确文档。

1 个回答

Voted

Homer512 · Answer 1 · 2025-04-10T02:35:46+08:00

一元表达式，就像所有 Eigen 表达式一样，实际上只是一个行为类似于Eigen::Matrix或的奇特函子Array，它允许某种自省，并且可以被请求获取各个行和列索引的值。这些值的请求顺序由赋值的对象决定；本质上，就是赋值的左侧。我们可以在二维空间中演示这一点：

  Eigen::ArrayXXi in(2, 3);
  in <<
    0, 1, 2,
    3, 4, 5;
  // just the identity function with some debut output
  auto expr = in.unaryExpr([](int x) {
    std::cout << x << ' ';
    return x;
  });

  // assignment 1, simple copy
  Eigen::ArrayXXi out1 = expr;
  std::cout << '\n';

  // assignment 2, copy to row major array
  using RowMajorArray = Eigen::Array<
    int, Eigen::Dynamic, Eigen::Dynamic, Eigen::RowMajor>;
  RowMajorArray out2 = expr;
  std::cout << '\n';

  // assignment 3, copy to transposed output array
  Eigen::ArrayXXi out3(3, 2);
  out3.transpose() = expr;

第一个赋值语句打印0 3 1 4 2 5，其他两个赋值语句打印0 1 2 3 4 5。原因是out1使用了默认的列主顺序。因此，最有效的填充顺序是：第 0 列第 0 行，第 0 列第 1 行，第 1 列第 0 行，第 1 列第 1 行，…… 其他两个输出数组的内存顺序已转置，因此也使用转置的赋值顺序。

还要注意，没有什么可以阻止我进行两次求值。当然，这种情况并不常见，但它可能会出现在其他良性代码中，比如下面的模板：

template<class Derived>
typename Eigen::ArrayBase<Derived>::PlainObject
derivative(const Eigen::ArrayBase<Derived>& in)
{
  Eigen::Index n = in.cols() - 1;
  return in.rightCols(n) - in.leftCols(n);
}

如果我调用derivative(in.unaryExpr(…))，它将打印0 1 3 4 1 2 4 5，对大多数条目进行两次评估。

长话短说：我认为把表达式写成你想要的状态化不是一个好主意，至少一般来说是这样。理想情况下，表达式应该是幂等的。但如果代码最短，你知道自己在做什么，并且在代码周围添加一些警告，以便下一位程序员也能理解这些限制，那么应该没问题。

一般来说，除了矩阵乘法和类似的已知复杂运算外，Eigen 不会自动并行化。其他所有操作都被假设为小巧快速，并且主要受内存带宽限制。我无法想象除了新的主要版本 Eigen4 之外，这一假设会发生变化。即使到了那个时候，我也不会假设它是自定义表达式的默认行为。启动和停止 OpenMP 并行区域的成本太高，除非充分了解其合理性。而且根据定义，Eigen 根本不知道自定义表达式的计算复杂度。

一般来说，求值的顺序也会按照输出在内存中的存储顺序从前到后进行，至少在简单的情况下是这样。这样计算速度更快，编程也更简单。

就我个人而言，我建议使用普通的迭代器std::transform或循环来明确操作顺序。一维数组和向量的迭代器速度很快，colwise()二维迭代器也一样。

Eigen::ArrayXf input(1234), output(1234);
std::transform(std::begin(input), std::end(input), std::begin(output),
    [state](float x) mutable { return state(x); });

Eigen unaryExpr() 的执行顺序总是连续的吗？

重新格式化数字，在固定位置插入分隔符

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

Eigen unaryExpr() 的执行顺序总是连续的吗？

1 个回答

相关问题