6MPI waitall 错误“数组元素 0 中提供的请求无效 (kind=0)”

Question

Stef1611

Asked: 2025-04-19 19:48:58 +0800 CST2025-04-19 19:48:58 +0800 CST 2025-04-19 19:48:58 +0800 CST

Fortran 派生类型数组上的“％”是否会在内存中创建副本？

772

我想知道“％”如何在派生类型的数组上起作用。

我编写了以下程序，其中“+”运算符已被重载：

module my_mod

  implicit none

  type :: my_type
    real :: r1 , r2
    integer :: i1, i2
  end type my_type
  
  interface operator(+)
    module procedure add_my_type_vec, add_my_type
  end interface
  
contains
  function add_my_type_vec(a,b) result(res)
    type(my_type), dimension(:),intent(in) :: a, b
    type(my_type), dimension(size(a)) :: res

      res%r1 = a%r1 + b%r1
      res%r2 = a%r2 + b%r2
      res%i1 = a%i1 + b%i1
      res%i2 = a%i2 + b%i2
      
  end function add_my_type_vec
  
  function add_my_type(a,b) result(res)
    type(my_type), intent(in) :: a, b
    type(my_type) :: res

      res%r1 = a%r1 + b%r1
      res%r2 = a%r2 + b%r2
      res%i1 = a%i1 + b%i1
      res%i2 = a%i2 + b%i2
      
  end function add_my_type
  
end module my_mod

program my_pgm
    use my_mod
    implicit none
    
    type(my_type),allocatable, dimension(:) :: my_vec1, my_vec2, my_vec3
    
    write(*,*) "Sum on type : ", my_type(1.0, 2.0, 1, 2) + my_type(1.0, 2.0, 1, 2)

    allocate(my_vec1(1000), my_vec2(1000), my_vec3(1000))
    my_vec1 = my_type(1.0, 2.0, 1, 2)
    my_vec2 = my_type(1.0, 2.0, 1, 2)
    my_vec3 = my_vec1 + my_vec2
    
    write(*,*) "Sum on vec of type : ", my_vec3(123)
    

end program my_pgm

在函数中add_my_type_vec，它是如何%工作的？例如，在指令中res%r1 = a%r1 + b%r1，是否创建（即内存复制）两个仅包含a%r1和的实数数组b%r1，然后对这些数组进行求和，最后对进行赋值res%r1？我想这应该更复杂一些。

2 个回答

Voted

francescalus · Answer 1 · 2025-04-19T21:18:14+08:00

编译器通常可以随时创建数组临时变量。1^在某些情况下，例如您在这里的许多帖子中看到的那样，临时副本实际上是必需的，或者非常可取。例如，另一个答案列举了一些情况。

作为一个实际的例子，这是一个可以详细阐述思考的案例，而不是给出严格的答案。

在此处的整个代码中，有很多机会可以在周围创建临时数组add_my_type_vec，例如：

数组虚拟参数a，b可以被复制
赋值语句右侧的数组（a%r1、b%r1等）可以分别复制
右侧的评估（a%r1+b%r1等）可以进入临时位置
函数结果可以是一个临时存储的变量，稍后将其复制到其结果赋值的左侧。

这里不需要任何课程的副本，或者特别有益。

虚拟参数a和b是假定形状，并且编译器知道它们（简单）是连续的。

数组a%r1（等）不是连续的，但具有恒定的步幅：编译器可以轻松处理元素的步幅。

的左侧res%r1 = a%r1 + b%r1不会以任何方式（尤其是不是复杂的方式）出现在右侧：右侧的评估不会影响左侧，因此在分配之前不需要副本来保存评估。

同样，在函数结果的分配中，所涉及的任何变量之间不存在相互作用。

无需在任何地方解决最终确定的要求。

本质上，编译器所要做的就是迭代的元素my_vec3并直接分配和的元素的成对my_vec1和my_vec2，以相当无聊的方式遍历这些数组。

如果编译器认为有必要，或者为了更加安全，它可以决定执行任何复制操作。通常，你可以让编译器在编译时或运行时告诉你它何时进行复制，或者何时设置机制来启用复制决策。

唯一需要担心组件（使用%）的原因是引用的数组不连续。Fortran 能够很好地处理非连续数组，而无需复制。对“复杂”数组和组件“复杂”使用的限制，使得处理这些常见情况变得非常枯燥（对于编译器编写者而言）。

¹编译器必须确保对临时变量的影响也影响与其关联的实体。例如，如果存在一个伪参数的临时副本，则实际参数必须反映任何（适当的）更改。Fortran 的别名规则是对程序的限制，这使得编译器在确定何时需要在诸如拷贝入/拷贝出等技术中显示影响时更加容易。

PierU · Answer 2 · 2025-04-19T21:25:36+08:00

在数组操作res(:)%r1 = a(:)%r1 + b(:)%r1（例如中的操作）中add_my_type_vec()，我希望任何合适的优化编译器都不会创建临时数组。

不过，就内存访问而言，这种方法可能并非最佳：a(:)%r1它是一个步幅为 4 的非连续数组（因为派生类型中有 4 个数字存储单元），而且据我所知，矢量指令在步幅为 4 的数组上效率较低。此外，通过顺序执行 4 个数组操作，在缓存行被清除并稍后重新加载之前，只会使用缓存行内容的 25%。

另一方面，通过对元素（派生类型数组）进行求和，可以更好地利用缓存，但无法利用矢量指令。

最后，只有基准测试才能告诉您对于您正在使用的给定机器/编译器组合来说最有效的方法是什么。

请注意，您实际上不需要在这里编写两个单独的例程。您可以编写一个elemental例程来处理标量和数组的加法（不过，编译器在后台会做什么并不明显）。

module my_mod

  implicit none

  type :: my_type
    real :: r1 , r2
    integer :: i1, i2
  end type my_type
  
  interface operator(+)
    module procedure add_my_type
  end interface
  
contains
  
  elemental function add_my_type(a,b) result(res)
    type(my_type), intent(in) :: a, b
    type(my_type) :: res

      res%r1 = a%r1 + b%r1
      res%r2 = a%r2 + b%r2
      res%i1 = a%i1 + b%i1
      res%i2 = a%i2 + b%i2
      
  end function add_my_type
  
end module my_mod

program my_pgm
    use my_mod
    implicit none
    
    type(my_type),allocatable, dimension(:) :: my_vec1, my_vec2, my_vec3
    
    write(*,*) "Sum on type : ", my_type(1.0, 2.0, 1, 2) + my_type(1.0, 2.0, 1, 2)

    allocate(my_vec1(1000), my_vec2(1000), my_vec3(1000))
    my_vec1 = my_type(1.0, 2.0, 1, 2)
    my_vec2 = my_type(1.0, 2.0, 1, 2)
    my_vec3 = my_vec1 + my_vec2
    
    write(*,*) "Sum on vec of type : ", my_vec3(123)
    

end program my_pgm

Fortran 派生类型数组上的“％”是否会在内存中创建副本？

重新格式化数字，在固定位置插入分隔符

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

Fortran 派生类型数组上的“％”是否会在内存中创建副本？

2 个回答

相关问题