如何将 for 循环拆分为 3 个单独的数据框？

Question

iBeMeltin

Asked: 2024-09-18 23:43:26 +0800 CST2024-09-18 23:43:26 +0800 CST 2024-09-18 23:43:26 +0800 CST

创建数据透视表并从另一个数据框添加其他列

772

给定两个格式相同的数据框：

df1

Counterparty  Product  Deal  Date          Value
foo           bar      Buy    01/01/24     10.00
foo           bar      Buy    01/01/24     10.00
foo           bar      Sell   01/01/24     10.00
foo           bar      Sell   01/01/24     10.00
fizz          bar      Buy    01/01/24     10.00
fizz          bar      Buy    01/01/24     10.00
fizz          buzz     Sell   01/01/24     10.00
fizz          buzz     Sell   01/01/24     10.00

df2

Counterparty  Product  Deal  Date          Value
foo           bar      Buy    01/01/24     11.00
foo           bar      Buy    01/01/24     09.00
foo           bar      Sell   01/01/24     09.00
foo           bar      Sell   01/01/24     10.00
fizz          bar      Buy    01/01/24     12.00
fizz          bar      Buy    01/01/24     08.00
fizz          buzz     Sell   01/01/24     09.00
fizz          buzz     Sell   01/01/24     10.00

到目前为止我已经这样做了：

out = pd.pivot_table(df1, values = 'Value', index='Counterparty', columns = 'Product', aggfunc='sum').reset_index().rename_axis(None, axis=1)
out = out.fillna(0)

 Counterparty   bar  buzz
0         fizz  20.0  20.0
1          foo  40.0   0.0

购买我如何旋转这些来创建像这样的视觉效果：

Counterparty  Bar  Buzz  Total  col1 col2
foo           40    0      40    39    1
fizz          20    20     40    39    1

col1来自哪里df2，和之间col2的区别是什么Totalcol1

样本：

df1 = pd.DataFrame({
    "Counterparty": ["foo", "foo", "foo", "foo", "fizz", "fizz", "fizz", "fizz"],
    "Product": ["bar", "bar", "bar", "bar", "bar", "bar", "buzz", "buzz"],
    "Deal": ["Buy","Buy", "Sell", "Sell", "Buy", "Buy", "Sell", "Sell"],
    "Date": ["01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24"],
    "Value": [10, 10, 10, 10, 10, 10, 10, 10]
    })

df2 = pd.DataFrame({
    "Counterparty": ["foo", "foo", "foo", "foo", "fizz", "fizz", "fizz", "fizz"],
    "Product": ["bar", "bar", "bar", "bar", "bar", "bar", "buzz", "buzz"],
    "Deal": ["Buy","Buy", "Sell", "Sell", "Buy", "Buy", "Sell", "Sell"],
    "Date": ["01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24", "01/01/24"],
    "Value": [11, 9, 9, 10, 12, 8, 9, 10]
    })

out = pd.pivot_table(df1, values = 'Value', index='Counterparty', columns = 'Product', aggfunc='sum').reset_index().rename_axis(None, axis=1)
out = out.fillna(0)

2 个回答

Voted

Michael Cao · Answer 1 · 2024-09-19T00:04:14+08:00

Best Answer

Michael Cao

2024-09-19T00:04:14+08:002024-09-19T00:04:14+08:00

Total可以通过对除第一列之外的所有现有列求和来生成列。在添加其他列之前必须先完成此操作。

out['Total'] = out[out.columns[1:]].sum(axis = 1)

col1列通过 groupby 完成，合并Counterparty然后重命名该列：

out = out.merge(df2.groupby('Counterparty')[['Value']].sum(), on = 'Counterparty')
out = out.rename(columns = {'Value': 'col1'})

col2很简单：

out['col2'] = out['Total'] - out['col1']

1

amance · Answer 2 · 2024-09-19T00:06:23+08:00

amance

2024-09-19T00:06:23+08:002024-09-19T00:06:23+08:00

您可以将分组总和 df2 合并到 df1 的数据透视表中，然后使用assign 添加缺失的列。

df1.pivot_table(index='Counterparty', columns='Product', values='Value', aggfunc='sum').fillna(0).astype(int).assign(Total=lambda x: x.sum(axis=1)).merge(df2.groupby('Counterparty')['Value'].sum().rename('col1'), left_index=True, right_index=True).rename_axis(None, axis=1).reset_index().assign(col2=lambda x: x['Total']-x['col1'])


    Counterparty    bar buzz    Total   col1    col2
0           fizz     20   20       40     39       1
1            foo     40    0       40     39       1

0

创建数据透视表并从另一个数据框添加其他列

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

创建数据透视表并从另一个数据框添加其他列

2 个回答

相关问题