我有一个 Ubuntu 服务器,它有 16 个 CPU。(nproc --all
给我看16
)
我写了一个 bash 脚本,命名test.sh
如下:
#!/bin/bash
while :
do
echo xxx
done
我执行了它:./test.sh >/dev/null &
.
然后我用命令top
监控cpu使用情况,我发现一个cpu几乎100%被使用了,因为这个过程test.sh
:
6411 me 20 0 11240 3052 2852 R 93.8 0.0 0:11.71 test.sh
%Cpu5 : 96.7 us, 3.3 sy, 0.0 ni, 0.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
如我们所见,该进程test.sh
已分配到第 5 个 CPU 上,几乎 100% 已被使用。
是否可以在多个 CPU 上分配一个繁重的进程,以便我们可以更多地使用 CPU?为什么操作系统不将进程分配到test.sh
多个 CPU 上?是因为进程test.sh
不够重还是我们应该为操作系统做一些配置?
单个线程不能在多个核心之间拆分:
需要编写一个程序以具有多个线程(每个内核一个),或者需要多个程序。如果没有,那么您将不会使用内核。
编写程序以使用更多内核并非易事,而且并非所有问题都可以并行化(编写为在多个内核上运行)。如果一个问题包含 20% 基本上是顺序的代码,那么使用无限数量的处理器,它不会比原始执行时间快 20%(速度增加 500%)。然后是开销(线程之间的通信)。
如果您没有任何内核应用程序,那么您最好将其出售并获得更便宜的机器。
每个核心都会有大量的并行性,以处理单个线程,但这不可见。现在,随着我们添加内核,我们正在努力使单个内核更快。这起初运作良好。
Unix 系统(例如 Gnu/Linux,例如 Ubuntu)在使用额外内核方面做得很好,最多 2→4 个左右。微软的 Windows,如果你有一个用于病毒扫描程序的核心,一个用于碎片整理程序,一个用于其他所有功能,就会得到改进。
之后,只有为多核设计的应用程序才会有所作为。
以下是可以使用多个处理器的 linux 命令示例:
make -j
gcc -pipe
该
make
选项在使用gcc
.调用 gcc 时将选项添加
-fopenmp
到构建选项中。尝试在 for 循环上方添加以下编译指示:
默认情况下,OpenMP 将在您的机器中创建与内核一样多的线程,并将在它们之间平均共享工作负载。