我只是在学习一些关于低级语言的知识,我注意到 gcc 你可以指定 -march 和 -mtune 参数来优化特定 CPU 系列的软件。
但我也发现有人说从源代码构建程序不会比下载二进制文件快得多。当然,能够为系统中的 CPU 优化软件会显着提高速度,尤其是在像ffmpeg
AVX 等使用相当微架构相关功能的软件中?
我想知道的是,包管理器上的二进制文件是否以某种方式针对多个微架构进行了优化?包管理器是否下载特定于我系统微架构的二进制文件?
我只是在学习一些关于低级语言的知识,我注意到 gcc 你可以指定 -march 和 -mtune 参数来优化特定 CPU 系列的软件。
但我也发现有人说从源代码构建程序不会比下载二进制文件快得多。当然,能够为系统中的 CPU 优化软件会显着提高速度,尤其是在像ffmpeg
AVX 等使用相当微架构相关功能的软件中?
我想知道的是,包管理器上的二进制文件是否以某种方式针对多个微架构进行了优化?包管理器是否下载特定于我系统微架构的二进制文件?
分发包是参考预先确定的基线构建的(例如,参见Debian 的架构基线)。因此,在 Debian 中,
amd64
软件包针对通用 x86-64 CPU,具有 SSE2 但不是 SSE3 或更高版本;i386
软件包针对通用 i686 CPU,没有 MMX 或 SSE。通常,使用编译器默认值,因此调整可能会随着编译器本身的发展而发展。但是,可以构建 CPU 特定优化提供显着优势的软件包以利用较新的 CPU。这是通过提供多种实现而不是依赖编译器优化来完成的,并在运行时在它们之间进行选择:打包的软件检测正在运行的 CPU 并调整它使用的代码路径以利用它(例如,参见
ffmpeg
's )。libswscale/x86/swscale.c
在某些架构上,ld.so
它本身对此有所帮助:如果可用,它可以自动加载优化的库,例如在i386
支持 SSE 的 CPU 上运行的架构系统上。大多数(如果不是全部)包管理器都没有注意到这一切。他们下载给定架构的包并安装它,而不考虑运行系统的 CPU。