如何按特定键值“批量”排序张量？

Question

Asked: 2024-04-14 02:19:56 +0800 CST2024-04-14 02:19:56 +0800 CST 2024-04-14 02:19:56 +0800 CST

如何创建 numba 列表并并行填充它

772

import numba
from numba import prange
from numba.typed import Dict, List

@numba.njit(parallel=True)
def create_list_of_dicts(input: List[int]):
    output = List()
    for i in prange(len(input)):
        output.append((Dict([(1, 2)]), input[i]))
    return output
len(create_list_of_dicts([i for i in range(1000)]))

导致我的 Python 解释器崩溃

double free or corruption (!prev)
Aborted (core dumped)

我认为这是因为List.append不是线程安全的。有解决方法吗？

预填充列表

output = [None] * len(input)

然后通过分配给条目

output[i] = ...

给出

No implementation of function Function(<built-in function setitem>) found for signature:
 
 >>> setitem(list(none)<iv=None>, int64, Tuple(DictType[int64,int64]<iv=None>, int64))

1 个回答

Voted

Jérôme Richard · Answer 1 · 2024-04-14T05:53:37+08:00

Numba 不会检查代码是否可以安全地并行执行（这实际上很难做到，在某些情况下如果没有额外的限制根本不可能）。因此，这是您的责任。这里，由于列表上的共享访问而存在竞争条件。这会导致未定义的行为，并且实际上会导致崩溃。

没有有效的方法可以直接并行地将项目附加到列表中。通常的解决方案包括使用关键部分（这是非常低效的，并且会阻止任何并行性，因此它在这里毫无用处），或者构建本地列表，然后合并结果（这在这里显然是次优的。最好的解决方案确实是预分配当您知道其最终大小时的列表（此处是可能的）。

NoneNumba 抱怨是因为您用的项目填充了列表none。由于Numba 列表始终是键入的，而本机类型不包含此 None 类型，因此会导致键入错误。理论上，您可以向 Numba 指定该类型可以是none另一个特定的给定类型（带有该optional类型），但这通常会使访问更加复杂，可能效率较低，这里不需要这样做。让我们首先尝试创建具有默认值的列表。

构建一个没有可选类型的列表

我们需要直接使用正确的类型构建列表。事实上，output = List()它是无效的，因为目标列表没有与您想要的类型匹配的类型。话虽这么说，目标类型并不那么简单，而且有一个问题：使用正确的类型，创建具有预定义大小的列表会强制您创建/初始化所有项目，因此字典对象尽管它们都可以引用相同的对象对象以提高初始化性能。这是生成的代码：

import numba as nb

# Type definition
int64 = nb.types.int64
dictType = nb.types.DictType(int64,int64)
itemType = nb.types.Tuple([dictType, int64])

# Creates an empty list with the right type
# This code can be put in the target function.
# lst = nb.typed.typedlist.List.empty_list(item_type=itemType)

@nb.njit(parallel=True)
def create_list_of_dicts(input):
    defaultDict = nb.typed.typeddict.Dict.empty(key_type=int64, value_type=int64)
    output = [(defaultDict,int64(0))] * len(input)
    for i in nb.prange(len(input)):
        output[i] = (({int64(1): int64(2)}, input[i]))
    return output

inputList = nb.typed.List[int64]([i for i in range(1000)])
len(create_list_of_dicts(inputList))

坏消息是代码并不更快。乍一看，似乎大部分时间还是花在了列表的创建上。然而，分析信息往往表明问题来自于输出从类型化列表到反射列表的转换。这个问题与上一篇文章类似。因此，只有当您在循环中进行一些昂贵的计算时，此解决方案才有用。

这个问题可以通过显式转换output为List. 所以你只需要替换return output为return nb.typed.List(output). 在这种情况下，列表的类型是自动推断的。一旦修复，此实现比最初使用的速度要快得多，append因为append速度很慢。使用并行循环并不会显着缩短执行时间。这是因为分配无法扩展，而且还因为与创建线程、分配工作等所需的时间相比，并行循环太快。如果输入范围是 10_000，那么我可以看到使用多个线程的好处（50 -60% 加速）尽管由于分配问题而很小，据我所知这里无法轻松解决。

构建具有可选类型的列表

到目前为止，我尚未成功构建具有可选类型的项目列表。列表显然尚不支持。事实上，下面的代码表明：

# Works well
lst = nb.typed.typedlist.List.empty_list(itemType)

# Fail
optItemType = nb.types.optional(itemType)
lst = nb.typed.typedlist.List.empty_list(optItemType)

以下是具有可选类型的列表报告的错误：

TypingError：List.item_type 不能是OptionalType(Tuple(DictType[int64,int64]<iv=None>, int64)) 类型

请注意，仅当该行不在函数中时才会报告此明显错误。否则，Numba 会抛出一个明显更复杂的错误，但想法是相同的：当前缺少一些要实现的功能。

理论上，也应该可以用代数类型实现可选类型，但看起来 Numba 不支持它。至少，我在文档中没有找到任何相关参考，并且我没有成功地使其适用于Any迄今为止的类型。

讨论

对于像这样的高级用法，我认为您已经达到了 Numba 的极限，并且它不是正确的工具。事实上，这不仅仅是一个问题，而是几个问题：

到目前为止，列表转换显然效率低下，尽管您可以避免它们；
并行循环中的分配速度很慢，因此代码往往无法很好地扩展；
无法控制分配以减少开销；
尽管您最终可能不需要它们，但似乎尚不支持可选和代数类型；
使用 Numba 手动输入和手动创建列表非常麻烦（恕我直言，冗长且几乎没有记录）。

也许像Awkward （支持 Numba）这样的模块可以帮助解决一些问题，这对您来说可能就足够了，但我建议您使用较低级的语言（例如 C++ 或 Rust）。

如果您确实需要将输出类型作为包含字典的元组列表返回，那么请注意，创建此数据结构将相当昂贵（无论使用什么方法来执行此操作）。您可以将其包装在不透明类型中，以避免转换，但读取/写入数据结构中的项目将更加麻烦且效率较低。

笔记

请注意，我使用过int64，但在您的情况下使用较小的类型可能会更好（较小的类型占用的内存较少，因此它们也有利于性能）。

另请注意，如果 Numba 使用反射列表，则循环将无法使用 Numba 线程并行化操作，因为所有 CPython 对象都需要受 GIL 保护，并且 GIL 在 Numba 并行循环中被禁用，因此没有 Python必须在 Numba 并行循环中访问对象。即使这是可能的，GIL 也会阻止任何实际的并行性。更不用说由于进程间通信和酸洗，多处理在这里效率不高。

请注意，据我所知 Windows 和 Linux 使用不同的整数默认类型。Windows 默认情况下倾向于使用 32 位整数，而 Linux 上倾向于使用 64 位整数。这就是我在代码中指定类型的原因：以避免警告和类型转换错误。

如何创建 numba 列表并并行填充它

构建一个没有可选类型的列表

构建具有可选类型的列表

讨论

笔记

为什么双破折号 (--) 会导致此 MariaDB 子句评估为 true？

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

ELF 重定位的应用顺序在哪里指定？

为什么 GCC 生成有条件执行 SIMD 实现的代码？

Selenium urllib.error.HTTPError：HTTP 错误 404：未找到

Box::new() 会从堆栈复制到堆吗？

sizeof("string") 的正确输出是什么？

使用 <font color="#xxx"> 突出显示 html 中的代码

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

C++17 中 std::byte 只能按位运算？

如何创建 numba 列表并并行填充它

1 个回答

构建一个没有可选类型的列表

构建具有可选类型的列表

讨论

笔记

相关问题