AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / coding / 问题 / 79597613
Accepted
Subject303
Subject303
Asked: 2025-04-29 12:36:03 +0800 CST2025-04-29 12:36:03 +0800 CST 2025-04-29 12:36:03 +0800 CST

MPI 非阻塞集体写入 iwrite_all 与结合文件同步的“非阻塞”非集体 iwrite 之间有什么区别?

  • 772

我正在使用 MPI 库为大规模 CFD 代码设置 IO,并且随着问题规模的扩大,文件 IO 开始占用计算时间。

据我所知,现代背景下的“完成”的事情是大量利用集体 IO 操作,(ARCHER 上的并行 IO 性能- 2015 年白皮书)。

我的问题是,似乎有三种调用集体写入的方法:

  • MPI_File_write_all,阻塞

  • MPI_File_iwrite_all,非阻塞

并且有些推测:

  • MPI_File_iwrite然后调用MPI_File_sync,先非阻塞然后阻塞?

    我之所以说是推测,是因为前一个调用显然是非集体的,而后者(据我所知,后者实际上是将数据推送到存储)是集体的。

我的问题是,多个MPI_File_iwrites 后跟 a是否MPI_File_sync等同于一个MPI_File_write_all,因为文件同步使得非集体写入有效地变成了集体写入?编辑 - 为了清楚起见,我知道 sync 是一个集体例程,我问的是调用 sync 时发生的 IO 是否类似于 write_all 的集体 IO。

后续问题:MPI_File_iwrite_all调用是否需要MPI_File_sync调用,如果确实需要,那么集体非阻塞写入的目的是什么,如果它只是变成了阻塞?

我在这里非常关注阻塞与非阻塞,因为我试图从我的代码中完全删除所有同步以提高 CPU 利用率(即,只有当进程缺少来自邻居的所需信息时才会等待,而不是等待所有进程同步)但显然这在输出时会出现一些问题。

parallel-processing
  • 2 2 个回答
  • 38 Views

2 个回答

  • Voted
  1. Gilles Gouaillardet
    2025-04-29T12:51:18+08:002025-04-29T12:51:18+08:00

    来自 MPI 标准4.1(章节14.6页704)

    MPI_FILE_SYNC 是一个集合操作。用户有责任确保在调用 MPI_FILE_SYNC 之前,所有对 fh 的非阻塞请求和拆分集合操作都已完成——否则,对 MPI_FILE_SYNC 的调用是错误的。

    • 0
  2. Best Answer
    Joachim
    2025-04-29T15:24:30+08:002025-04-29T15:24:30+08:00

    您的问题涉及三个正交的 MPI 概念:操作的本地完成、进程同步和数据一致性。

    阻塞和非阻塞的主要区别在于操作的进程本地状态。阻塞操作在阻塞调用返回之前完成;非阻塞操作在完成调用成功后完成。在操作本地完成之前,MPI 库“拥有”您传递给函数的缓冲区。

    只有一小部分 MPI 函数需要同步。尤其是集体通信,并不一定需要同步。

    完成文件 IO 功能并不能建立数据一致性(或操作影响的全局可见性)。

    MPI_File_sync为文件访问建立数据一致性。仅当写入文件的数据需要对来自不同进程的后续读取可见时,才需要执行此操作。MPI-4.1 中的示例 14.6 指出,实际上需要一个相当于MPI_File_sync+ MPI_Barrier+ 的序列MPI_File_sync来在文件写入和读取之间建立数据一致性。原因是它MPI_File_sync是集体的,但不是同步的。

    是否需要MPI_File_sync取决于应用程序访问文件的方式。如果需要MPI_File_sync,则无论 write 调用的类型如何,都需要它。集体写入和非集体写入函数都需要它。使用非阻塞写入时,您需要在本地完成(测试/等待)文件句柄的所有活动 File-IO 操作,然后才能调用MPI_File_sync。

    • 0

相关问题

  • 如何查看OceanBase中表和索引的并行度?

  • Julia pmap 实际上没有使用多线程?

  • 为什么 std::execution::par_unseq 不起作用?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    重新格式化数字,在固定位置插入分隔符

    • 6 个回答
  • Marko Smith

    为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会?

    • 2 个回答
  • Marko Smith

    VScode 自动卸载扩展的问题(Material 主题)

    • 2 个回答
  • Marko Smith

    Vue 3:创建时出错“预期标识符但发现‘导入’”[重复]

    • 1 个回答
  • Marko Smith

    具有指定基础类型但没有枚举器的“枚举类”的用途是什么?

    • 1 个回答
  • Marko Smith

    如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误?

    • 6 个回答
  • Marko Smith

    `(表达式,左值) = 右值` 在 C 或 C++ 中是有效的赋值吗?为什么有些编译器会接受/拒绝它?

    • 3 个回答
  • Marko Smith

    在 C++ 中,一个不执行任何操作的空程序需要 204KB 的堆,但在 C 中则不需要

    • 1 个回答
  • Marko Smith

    PowerBI 目前与 BigQuery 不兼容:Simba 驱动程序与 Windows 更新有关

    • 2 个回答
  • Marko Smith

    AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String”

    • 1 个回答
  • Martin Hope
    Fantastic Mr Fox msvc std::vector 实现中仅不接受可复制类型 2025-04-23 06:40:49 +0800 CST
  • Martin Hope
    Howard Hinnant 使用 chrono 查找下一个工作日 2025-04-21 08:30:25 +0800 CST
  • Martin Hope
    Fedor 构造函数的成员初始化程序可以包含另一个成员的初始化吗? 2025-04-15 01:01:44 +0800 CST
  • Martin Hope
    Petr Filipský 为什么 C++20 概念会导致循环约束错误,而老式的 SFINAE 不会? 2025-03-23 21:39:40 +0800 CST
  • Martin Hope
    Catskul C++20 是否进行了更改,允许从已知绑定数组“type(&)[N]”转换为未知绑定数组“type(&)[]”? 2025-03-04 06:57:53 +0800 CST
  • Martin Hope
    Stefan Pochmann 为什么 {2,3,10} 和 {x,3,10} (x=2) 的顺序不同? 2025-01-13 23:24:07 +0800 CST
  • Martin Hope
    Chad Feller 在 5.2 版中,bash 条件语句中的 [[ .. ]] 中的分号现在是可选的吗? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench 为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng 为什么 `dict(id=1, **{'id': 2})` 有时会引发 `KeyError: 'id'` 而不是 TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob:MobileAds.initialize() - 对于某些设备,“java.lang.Integer 无法转换为 java.lang.String” 2024-03-20 03:12:31 +0800 CST

热门标签

python javascript c++ c# java typescript sql reactjs html

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve