如何将 for 循环拆分为 3 个单独的数据框？

Question

Phil-ZXX

Asked: 2024-08-20 20:54:52 +0800 CST2024-08-20 20:54:52 +0800 CST 2024-08-20 20:54:52 +0800 CST

极坐标拆分列并获取第 n 个（或最后一个）元素

772

我有以下代码和输出。

代码。

import polars as pl

df = pl.DataFrame({
    'type': ['A', 'O', 'B', 'O'],
    'id':   ['CASH', 'ORB.A123', 'CHECK', 'OTC.BV32']
})

df.with_columns(sub_id=pl.when(pl.col('type') == 'O').then(pl.col('id').str.split('.')).otherwise(None))

输出。

shape: (4, 3)
┌──────┬──────────┬─────────────────┐
│ type ┆ id       ┆ sub_id          │
│ ---  ┆ ---      ┆ ---             │
│ str  ┆ str      ┆ list[str]       │
╞══════╪══════════╪═════════════════╡
│ A    ┆ CASH     ┆ null            │
│ O    ┆ ORB.A123 ┆ ["ORB", "A123"] │
│ B    ┆ CHECK    ┆ null            │
│ O    ┆ OTC.BV32 ┆ ["OTC", "BV32"] │
└──────┴──────────┴─────────────────┘

现在，我该如何提取每个列表的第 n 个元素（或在本例中为最后一个元素）？

特别是，预期输出如下。

shape: (4, 3)
┌──────┬──────────┬────────────┐
│ type ┆ id       ┆ sub_id     │
│ ---  ┆ ---      ┆ ---        │
│ str  ┆ str      ┆ str        │
╞══════╪══════════╪════════════╡
│ A    ┆ CASH     ┆ null       │
│ O    ┆ ORB.A123 ┆ "A123"     │
│ B    ┆ CHECK    ┆ null       │
│ O    ┆ OTC.BV32 ┆ "BV32"     │
└──────┴──────────┴────────────┘

1 个回答

Voted

Hericks · Answer 1 · 2024-08-20T20:58:46+08:00

Best Answer

Hericks

2024-08-20T20:58:46+08:002024-08-20T20:58:46+08:00

您可以简单地附加.list.last()来选择每个列表的最后一个元素。

或者，可以.list.get()通过索引获取列表元素。

import polars as pl

df = pl.DataFrame({
    'type': ['A', 'O', 'B', 'O'],
    'id':   ['CASH', 'ORB.A123', 'CHECK', 'OTC.BV32']
})

df.with_columns(
    sub_id=pl.when(
        pl.col('type') == 'O'
    ).then(
        pl.col('id').str.split('.').list.last()
    )
)

shape: (4, 3)
┌──────┬──────────┬────────┐
│ type ┆ id       ┆ sub_id │
│ ---  ┆ ---      ┆ ---    │
│ str  ┆ str      ┆ str    │
╞══════╪══════════╪════════╡
│ A    ┆ CASH     ┆ null   │
│ O    ┆ ORB.A123 ┆ A123   │
│ B    ┆ CHECK    ┆ null   │
│ O    ┆ OTC.BV32 ┆ BV32   │
└──────┴──────────┴────────┘

请注意，我已删除，.otherwise(None)因为这是if-then-otherwise表达式的默认行为。

2

极坐标拆分列并获取第 n 个（或最后一个）元素

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

极坐标拆分列并获取第 n 个（或最后一个）元素

1 个回答

相关问题