我有这个代码:
import polars as pl
cols = ['Delta', 'Qty']
metrics = {'CHECK.US': {'Delta': {'ABC': 1, 'DEF': 2}, 'Qty': {'GHIJ': 3, 'TT': 4}},
'CHECK.NA': {},
'CHECK.FR': {'Delta': {'QQQ': 7, 'ABC': 6}, 'Qty': {'SS': 9, 'TT': 5}}
}
df = pl.DataFrame([{col: v.get(col) for col in cols} for v in metrics.values()])\
.insert_column(0, pl.Series('key', metrics.keys()))\
.with_columns([pl.col(col).name.map_fields(lambda x: f'{col} ({x})') for col in cols])
现在,df.unnest('Qty')
正确给出所有列的格式为Qty (xxx)
:
shape: (3, 5)
┌──────────┬────────────┬────────────┬──────────┬──────────┐
│ key ┆ Delta ┆ Qty (GHIJ) ┆ Qty (TT) ┆ Qty (SS) │
│ --- ┆ --- ┆ --- ┆ --- ┆ --- │
│ str ┆ struct[3] ┆ i64 ┆ i64 ┆ i64 │
╞══════════╪════════════╪════════════╪══════════╪══════════╡
│ CHECK.US ┆ {1,2,null} ┆ 3 ┆ 4 ┆ null │
│ CHECK.NA ┆ null ┆ null ┆ null ┆ null │
│ CHECK.FR ┆ {6,null,7} ┆ null ┆ 5 ┆ 9 │
└──────────┴────────────┴────────────┴──────────┴──────────┘
但是,当我执行同样的事情时,df.unnest('Delta')
它会错误地返回以下列Qty (xxx)
:
shape: (3, 5)
┌──────────┬───────────┬───────────┬───────────┬────────────┐
│ key ┆ Qty (ABC) ┆ Qty (DEF) ┆ Qty (QQQ) ┆ Qty │
│ --- ┆ --- ┆ --- ┆ --- ┆ --- │
│ str ┆ i64 ┆ i64 ┆ i64 ┆ struct[3] │
╞══════════╪═══════════╪═══════════╪═══════════╪════════════╡
│ CHECK.US ┆ 1 ┆ 2 ┆ null ┆ {3,4,null} │
│ CHECK.NA ┆ null ┆ null ┆ null ┆ null │
│ CHECK.FR ┆ 6 ┆ null ┆ 7 ┆ {null,5,9} │
└──────────┴───────────┴───────────┴───────────┴────────────┘
值看起来正确,只是列名错误。
我使用的pl.col(col).name.map_field(...)
方式不正确吗?如何修复代码,使输出变成这样:
shape: (3, 5)
┌──────────┬─────────────┬─────────────┬─────────────┬────────────┐
│ key ┆ Delta (ABC) ┆ Delta (DEF) ┆ Delta (QQQ) ┆ Qty │
│ --- ┆ --- ┆ --- ┆ --- ┆ --- │
│ str ┆ i64 ┆ i64 ┆ i64 ┆ struct[3] │
╞══════════╪═════════════╪═════════════╪═════════════╪════════════╡
?
就循环内的 lambda 而言,它更像是一个通用的 Python “Gotcha” 。
col
被设置为每个 lambda 循环中的最后一个值。解决方法是使用命名参数。
在您的具体例子中:
1. https://docs.python.org/3/faq/programming.html#why-do-lambdas-define-in-a-loop-with- different-values-all -return-the-same-result