Bantha Hunter提出的问题 -coding

Bantha Hunter

Asked: 2023-08-24 23:39:33 +0800 CST

从重复行中提取字符串，删除重复项，给出字符串计数[重复]

我对 Python/panda 比较陌生。这是我的问题：我有一个 df 看起来像这样：

df = pd.DataFrame({
    'ZIP Code': ['1234','1234', '5678', '9101'],
    'City Name': ['City A', 'City A', 'City B', 'City C'],
    'Newspaper': ['City A News', 'City A Newspaper', 'News for City B', 'C News'],
})

正如您所看到的，对于 A 市，有两份报纸，但它们列在不同的两行中。在我真实的 df 中，我有多个城市案例，在单独的行中列出，除了列出的报纸之外，彼此完全相同。

所以我想创建一个看起来像这样的 df ：

df_wanted = pd.DataFrame({
'ZIP Code': ['1234', '5678', '9101'],
'City Name': ['City A', 'City B', 'City C'],
'Newspaper': ['City A News, City A Newspaper', 'News for City B', 'C News'],
'Number of Newspapers': [2, 1, 0]

})

所以基本上，我想删除重复的行并将不重复报纸的字符串添加到城市的第一个条目中。

此外，我想创建一个统计报纸数量的列，以便我可以使用这些数字进行进一步分析。

我希望你能帮助我解决我的问题！提前致谢：）

到目前为止，我还没有找到解决我的问题的方法。

从重复行中提取字符串，删除重复项，给出字符串计数[重复]

重新格式化数字，在固定位置插入分隔符

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

Bantha Hunter's questions