如何将 for 循环拆分为 3 个单独的数据框？

Question

Kelly Bundy

Asked: 2024-12-24 00:20:31 +0800 CST2024-12-24 00:20:31 +0800 CST 2024-12-24 00:20:31 +0800 CST

为什么 bytes(lst) 比 bytearray(lst) 慢？

772

我有lst = [0] * 10**6过这样的经历：

  5.4 ± 0.4 ms  bytearray(lst)
  5.6 ± 0.4 ms  bytes(bytearray(lst))
 13.1 ± 0.7 ms  bytes(lst)

Python:
3.13.0 (main, Nov  9 2024, 10:04:25) [GCC 14.2.1 20240910]
namespace(name='cpython', cache_tag='cpython-313', version=sys.version_info(major=3, minor=13, micro=0, releaselevel='final', serial=0), hexversion=51183856, _multiarch='x86_64-linux-gnu')

我本来以为bytes(lst)和bytearray(lst)会一样快，或者bytearray(lst)更慢，因为它是更复杂的类型（具有更多功能，因为它是可变的）。但事实恰恰相反。甚至绕行也bytes(bytearray(lst))比快得多bytes(lst)！为什么bytes(lst)这么慢？

基准测试脚本（在线尝试！）：

from timeit import timeit
from statistics import mean, stdev
import random
import sys

setup = 'lst = [0] * 10**6'

codes = [
    'bytes(lst)',
    'bytearray(lst)',
    'bytes(bytearray(lst))'
]

times = {c: [] for c in codes}
def stats(c):
    ts = [t * 1e3 for t in sorted(times[c])[:5]]
    return f'{mean(ts):5.1f} ± {stdev(ts):3.1f} ms '
for _ in range(25):
    random.shuffle(codes)
    for c in codes:
        t = timeit(c, setup, number=10) / 10
        times[c].append(t)
for c in sorted(codes, key=stats):
    print(stats(c), c)

print('\nPython:')
print(sys.version)
print(sys.implementation)

受到一个也发现更快的答案的启发。bytearray

1 个回答

Voted

blhsing · Answer 1 · 2024-12-24T17:20:19+08:00

Best Answer

blhsing

2024-12-24T17:20:19+08:002024-12-24T17:20:19+08:00

正如 @Homer512 在评论中指出的那样，bytearray 和 bytes 在 CPython 中的实现方式截然不同。虽然 GitHub 问题 # 91149为 bytearray 提供了从列表和元组创建的快速路径，但 bytes 并未获得相同的优化。

所述bytearray 的快速路径利用了PySequence_Fast_ITEMS，当给定一个列表或一个元组时，它会返回一个对象数组，这样只需遍历该数组即可获得所有项目。

另一方面，从列表创建字节必须进行PyList_GET_ITEM调用以使用每个索引获取列表中的每个项目，因此性能相对较低。

我在 PR # 128214中重构了从列表和元组创建字节的代码，并使用以下基准进行测试：

python -m timeit -n 100 -s 'a = [40] * 100000' 'bytes(a)'

性能提高了约 81％：

100 loops, best of 5: 3.43 msec per loop # current
100 loops, best of 5: 1.89 msec per loop # PR #128214

并且确实比在同样的基准上构建字节数组要快：

100 loops, best of 5: 2.14 msec per loop

3

为什么 bytes(lst) 比 bytearray(lst) 慢？

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

为什么 bytes(lst) 比 bytearray(lst) 慢？

1 个回答

相关问题