我有一个主要运行 Ruby 脚本的服务器。因为 Ruby (2.7) 有一个 GIL,所以它是单线程的。
我的计算机(服务器)有一个 Intel i3 双核处理器,但由于超线程,我看到了 4 个内核。Ruby 在重负载下仅使用 25% 的 CPU。我想看看禁用超线程是否有利于在单线程上运行的编程语言。
此外,我的服务器正在运行一个非常小的桌面环境,它使用的 CPU 不超过 2%。所以我想让大部分资源都可用于 Ruby。我做了一个基准测试,看看我是否真的通过禁用超线程来提高性能。
基准:
我编写了一个简单的 Ruby 脚本,它运行一个 while 循环并将循环计数器的值与另一个变量相加。该程序应使用 100% 的 CPU 内核:
#!/usr/bin/env ruby
$-v = true
LOOPS = ENV['N'].to_i.then { |x| x < 1 ? 100_000_000 : x } + 1
i, j, t = 0, 0, Time.now
puts "Counting till #{LOOPS - 1} and adding values to V..."
while (i += 1) < LOOPS
if i % 10000 == 0
e = Time.now - t
r = LOOPS.*(e)./(i).-(e).round(2)
print "\e[2KN: #{i} | Done: #{i.*(100) / LOOPS}% | Elapsed: #{e.round(2)}s | Estimated Rem: #{r}s\r"
end
j += i
end
puts "\nV = #{j}\nTime: #{(Time.now).-(t).round(2)}s"
- 使用超线程:
⮚ ruby p.rb
Counting till 100000000 and adding values to V...
N: 100000000 | Done: 99% | Elapsed: 4.55s | Estimated Rem: 0.0s
V = 5000000050000000
Time: 4.55s
⮚ ruby p.rb
Counting till 100000000 and adding values to V...
N: 100000000 | Done: 99% | Elapsed: 4.54s | Estimated Rem: 0.0s
V = 5000000050000000
Time: 4.54s
⮚ ruby p.rb
Counting till 100000000 and adding values to V...
N: 100000000 | Done: 99% | Elapsed: 4.67s | Estimated Rem: 0.0s
V = 5000000050000000
Time: 4.67s
gnome-system-monitor在测试运行时报告 Ruby 的 CPU 使用率为 25%。
- 没有超线程:
[# echo 0 | tee /sys/devices/system/cpu/cpu{2,3}/online
用于禁用超线程]
⮚ ruby p.rb
Counting till 100000000 and adding values to V...
N: 100000000 | Done: 99% | Elapsed: 4.72s | Estimated Rem: 0.0s
V = 5000000050000000
Time: 4.72s
⮚ ruby p.rb
Counting till 100000000 and adding values to V...
N: 100000000 | Done: 99% | Elapsed: 4.54s | Estimated Rem: 0.0s
V = 5000000050000000
Time: 4.54s
⮚ ruby p.rb
Counting till 100000000 and adding values to V...
N: 100000000 | Done: 99% | Elapsed: 4.56s | Estimated Rem: 0.0s
V = 5000000050000000
Time: 4.56s
gnome-system-monitor在测试运行时报告 Ruby 的 CPU 使用率为 50%。
我什至在我的笔记本电脑上运行了测试,它所花费的时间大约是我电脑上的两倍。但结果是相同的:禁用超线程并不能帮助进程做得更好。更糟糕的是,我的笔记本电脑在多任务处理时会变慢一些。
因此,在非超线程模式下,Ruby 使用的 CPU 功率是超线程模式的 2 倍。但是为什么完成同样的任务仍然需要同样的时间呢?
在禁用 HT 的情况下运行时,您的 Ruby 程序没有使用2 倍的 CPU 时间。相反,当它最大化两个核心中的一个核心时,
gnome-system-monitor
将报告为 50% 的利用率。如果由于 HT 的原因,系统报告总共四个核心,那么四分之一的核心将是 25%。禁用 HT 确实会导致结果的更多变化,因为可用的资源更少:最近的 Intel(或 AMD)内核非常宽,因此额外的线程通常有助于提高 10-20% 的总性能。如果在测试运行期间自动执行了一些后台进程,则没有 HT 的系统容易出现更大的差异和更低的总吞吐量。
我不知道减少内核数量会如何提高性能,即使对于单线程应用程序也是如此。启用超线程后,您的 cpu 将使用 4 个虚拟内核运行。使用所有 CPU 的单线程应用程序将使用 25% 的可用 CPU。当您禁用超线程时,您将内核数量减少到 2 个。现在,单线程应用程序可以使用 50% 的可用 CPU。
Ruby 没有使用 2 倍的 CPU,而是当您禁用超线程时,您有 1/2 的 CPU 可用。如果你有一个装满 1/4 水的大杯子,然后把它倒进一个装满 1/2 水的小杯子里,你仍然有等量的水。
是的,您正在消耗大约 1/2 的 CPU 功率。这也会使 Ruby 线程运行得更慢。假设除了 Ruby 线程之外,您还有 3 个线程想要同时运行。如果您将虚拟内核减少到 2 个,那么您的 Ruby 线程更有可能会暂停至少一点,以便让另一个线程有时间。