假设我有:
import pyarrow as pa
arr = pa.array([1, 3, 2, 2, 1, 3])
我想根据{1: 'one', 2: 'two', 3: 'three'}
并最终替换值:
<pyarrow.lib.LargeStringArray object at 0x7f8dd0b3c820>
[
"one",
"three",
"two",
"two",
"one",
"three"
]
我可以通过 Polars 来实现这一点:
In [19]: pl.from_arrow(arr).replace_strict({1: 'one', 2: 'two', 3: 'three'}, return_dtype=pl.String).to_arrow()
Out[19]:
<pyarrow.lib.LargeStringArray object at 0x7f8dd0b3c820>
[
"one",
"three",
"two",
"two",
"one",
"three"
]
有没有办法只用 PyArrow 来完成它?
使用 pyarryow 计算模块中的函数可以实现你想要的功能
下面是一个简单的例子
希望这对您有帮助,请查看https://arrow.apache.org/docs/python/compute.html了解详细信息