Dante提出的问题 -coding

Dante

Asked: 2024-08-24 01:42:57 +0800 CST

如何使用字典映射替换极坐标数据框中的多行？

假设我有一份包含用户及其薪资记录的 excel 表/csv。我在数据库中为每个用户创建了一个帐户，并希望使用数据库中的 ID 为每个用户创建薪资记录。

import polars as pl

# Create the DataFrame with repeated entries for John and Jane
df = pl.DataFrame({
    "first_name": ["John", "Jane", "Alice", "Bob", "John", "Jane", "John", "Jane"],
    "middle_name": ["A.", "B.", "C.", "D.", "A.", "B.", "A.", "B."],
    "last_name": ["Doe", "Smith", "Johnson", "Brown", "Doe", "Smith", "Doe", "Smith"],
    "salary": [50000, 60000, 55000, 62000, 50000, 60000, 50000, 60000],
    "date": ["2023-01-15", "2023-02-20", "2023-03-05", "2023-04-10", "2023-05-15", "2023-06-20", "2023-07-15", "2023-08-20"]
})
print(df)
shape: (8, 5)
┌────────────┬────────────┬────────────┬────────┬────────────┐
│ first_name │ middle_name│ last_name  │ salary │ date       │
│ ---        │ ---        │ ---        │ ---    │ ---        │
│ str        │ str        │ str        │ i64    │ date       │
├────────────┼────────────┼────────────┼────────┼────────────┤
│ John       │ A.         │ Doe        │ 50000  │ 2023-01-15 │
│ Jane       │ B.         │ Smith      │ 60000  │ 2023-02-20 │
│ Alice      │ C.         │ Johnson    │ 55000  │ 2023-03-05 │
│ Bob        │ D.         │ Brown      │ 62000  │ 2023-04-10 │
│ John       │ A.         │ Doe        │ 50000  │ 2023-05-15 │
│ Jane       │ B.         │ Smith      │ 60000  │ 2023-06-20 │
│ John       │ A.         │ Doe        │ 50000  │ 2023-07-15 │
│ Jane       │ B.         │ Smith      │ 60000  │ 2023-08-20 │
└────────────┴────────────┴────────────┴────────┴────────────┘

#Get unique values
 subset_df = df.select(["first_name", "middle_name", "last_name"])
 unique_subset_df = subset_df.unique()
 for row in subset_df.select(pl.struct(pl.all()).value_counts()):
    # create acoount

用户列表及其对应的id如下

users = [
    {'id': 1, 'first_name': 'John', 'middle_name': 'A.', 'last_name': 'Doe'},
    {'id': 2, 'first_name': 'Jane', 'middle_name': 'B.', 'last_name': 'Smith'},
    {'id': 3, 'first_name': 'Alice', 'middle_name': 'C.', 'last_name': 'Johnson'},
    {'id': 4, 'first_name': 'Bob', 'middle_name': 'D.', 'last_name': 'Brown'}
]
# Note:The data above can also be transformed into a list of tuples

我怎样才能用该字典列表中相应的 ID 替换数据框的、和列first_name中middle_name的值？last_name

Dante

Asked: 2024-08-10 20:24:13 +0800 CST

如何将极坐标中的两列组合成 `{key:value}` 对？

我正在使用Polars DataFrame，我想将两列组合成字典格式，其中一列的值成为键，另一列的值成为相应的值。

这是一个 DataFrame 示例：

import polars as pl

df = pl.DataFrame({
    "name": ["Chuck", "John", "Alice"],
    "surname": ["Dalliston", "Doe", "Smith"]
})

我想将此 DataFrame 转换为包含字典的新列，其中 name 是键，surname 是值。预期结果应如下所示：

shape: (3, 3)
┌───────┬─────────┬──────────────────────────┐
│ name  │ surname │ name_surname             │
│ ---   │ ---     │ ---                      │
│ str   │ str     │ dict[str, str]           │
├───────┼─────────┼──────────────────────────┤
│ Chuck │ Dalliston│ {"Chuck": "Dalliston"}   │
│ John  │ Doe     │ {"John": "Doe"}          │
│ Alice │ Smith   │ {"Alice": "Smith"}       │
└───────┴─────────┴──────────────────────────┘

我尝试过以下代码：

df.with_columns(
    json = pl.struct("name", "surname").map_elements(json.dumps)
)

但结果并不像预期的那样。key-value它没有使用创建字典，而是生成了：

{name:Chuck,surname:Dalliston}

如何使用字典映射替换极坐标数据框中的多行？

如何将极坐标中的两列组合成 `{key:value}` 对？

重新格式化数字，在固定位置插入分隔符

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

Dante's questions