我的集群中有三个 Nvidia GPU,我的集群中运行着很多 pod。如何找到这些 pod 中的哪一个调度 GPU 以及它们调度了多少 GPU?
我使用此链接在我的集群中为 Nvidia GPU 启用 GPU 计划。 https://kubernetes.io/docs/tasks/manage-gpus/scheduling-gpus/
谢谢
我的集群中有三个 Nvidia GPU,我的集群中运行着很多 pod。如何找到这些 pod 中的哪一个调度 GPU 以及它们调度了多少 GPU?
我使用此链接在我的集群中为 Nvidia GPU 启用 GPU 计划。 https://kubernetes.io/docs/tasks/manage-gpus/scheduling-gpus/
谢谢
这是 kubectl 插件kubectl-view-allocations给出的示例:
似乎提供您正在寻找的东西。
此外,显然,共享 GPU 是可能的(使用 Nvidia 提供的软件) - 可能对您或将来发现此问题的任何人有用: