从重复行中提取字符串，删除重复项，给出字符串计数[重复]

Question

Marcio Lino

Asked: 2024-12-26 19:59:33 +0800 CST2024-12-26 19:59:33 +0800 CST 2024-12-26 19:59:33 +0800 CST

在 Pandas 中转置多个值列

772

我有以下熊猫数据框，我想转置它。

年	CD_PRD	维基百科	最大有效射程	虚拟地址	VL_APR
2022	CD76	10000	8000	170000	58000
2022	CD92	15000	7500	86000	1200
2023	CD76	8000	12000	15000	5000
2023	CD92	12000	4560	10480	15600
2024	CD76	400	8000	45800	120
2024	CD92	56000	10200	150000	1500

我需要的是将值列名称（例如 VL_JAN | VL_FEB | VL_MAR | VL_APR ）转换为行，将行（CD-PRD）转换为线，以便在末尾包含以下数据框：

年	几个月	VL_CD76	VL_CD92
2022	一月	10000	15000
2022	二月	8000	7500
2022	3月	170000	86000
2022	急性淋巴细胞白血病	58000	1200
2023	一月	8000	12000
2023	二月	12000	4560
2023	3月	15000	10480
2023	急性淋巴细胞白血病	5000	15600
2024	一月	400	56000
2024	二月	8000	10200
2024	3月	45800	150000
2024	急性淋巴细胞白血病	120	1500

我做了以下操作，但似乎我错过了一些东西并且没有设法获得正确的数据框结构。

df3 = df2.pivot(index='YEAR', columns=['CD_PRD'], values=['VL_JAN', 'VL_FEB', 'VL_MAR', 'VL_APR']).reset_index()
print(df3)

任何帮助都非常感谢。谢谢！

马西奥

1 个回答

Voted

PaulS · Answer 1 · 2024-12-26T20:15:26+08:00

一种可能的解决方案，其步骤如下：

第一步是将数据框的索引设置df为列YEAR并CD_PRD使用该set_index方法。
然后，stack使用该方法将列转换为行，从而创建分层索引。
然后应用该unstack方法将索引的最内层重新转换为列。
该reset_index方法用于重置数据框的索引，将索引重新转换为列。
该rename_axis方法用于删除轴的名称。
该set_axis方法用于将数据框的列重命名为列表colnames。
最后，该pipe方法用于应用一个 lambda 函数，该函数使用该方法通过从使用该方法的列中的值中删除前缀assign来创建一个新列。MONTHVL_MONTHstr.replace

colnames = ['YEAR', 'MONTH', 'VL_CD76', 'VL_CD92']

(df.set_index(['YEAR', 'CD_PRD']).stack()
 .unstack(1).reset_index().rename_axis(None, axis=1)
 .set_axis(colnames, axis=1)
 .pipe(lambda x: x.assign(MONTH = x['MONTH'].str.replace('VL_', ''))))

输出：

    YEAR MONTH  VL_CD76  VL_CD92
0   2022   JAN    10000    15000
1   2022   FEB     8000     7500
2   2022   MAR   170000    86000
3   2022   APR    58000     1200
4   2023   JAN     8000    12000
5   2023   FEB    12000     4560
6   2023   MAR    15000    10480
7   2023   APR     5000    15600
8   2024   JAN      400    56000
9   2024   FEB     8000    10200
10  2024   MAR    45800   150000
11  2024   APR      120     1500

在 Pandas 中转置多个值列

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

在 Pandas 中转置多个值列

1 个回答

相关问题