循环遍历列以生成 countplot() seaborn

Question

Bantha Hunter

Asked: 2023-08-24 23:39:33 +0800 CST2023-08-24 23:39:33 +0800 CST 2023-08-24 23:39:33 +0800 CST

从重复行中提取字符串，删除重复项，给出字符串计数[重复]

772

我对 Python/panda 比较陌生。这是我的问题：我有一个 df 看起来像这样：

df = pd.DataFrame({
    'ZIP Code': ['1234','1234', '5678', '9101'],
    'City Name': ['City A', 'City A', 'City B', 'City C'],
    'Newspaper': ['City A News', 'City A Newspaper', 'News for City B', 'C News'],
})

正如您所看到的，对于 A 市，有两份报纸，但它们列在不同的两行中。在我真实的 df 中，我有多个城市案例，在单独的行中列出，除了列出的报纸之外，彼此完全相同。

所以我想创建一个看起来像这样的 df ：

df_wanted = pd.DataFrame({
'ZIP Code': ['1234', '5678', '9101'],
'City Name': ['City A', 'City B', 'City C'],
'Newspaper': ['City A News, City A Newspaper', 'News for City B', 'C News'],
'Number of Newspapers': [2, 1, 0]

})

所以基本上，我想删除重复的行并将不重复报纸的字符串添加到城市的第一个条目中。

此外，我想创建一个统计报纸数量的列，以便我可以使用这些数字进行进一步分析。

我希望你能帮助我解决我的问题！提前致谢：）

到目前为止，我还没有找到解决我的问题的方法。

1 个回答

Voted

Quang Hoang · Answer 1 · 2023-08-24T23:43:55+08:00

Best Answer

Quang Hoang

2023-08-24T23:43:55+08:002023-08-24T23:43:55+08:00

您可以使用名为 agg 的 groupby：

df.groupby('ZIP Code').agg(**{
    'City Name': ('City Name', 'first'),
    'Newspaper': ('Newspaper', ', '.join),
    'No. Newspaper': ('Newspaper', 'size')
})

输出：

         City Name                      Newspaper  No. Newspaper
ZIP Code                                                        
1234        City A  City A News, City A Newspaper              2
5678        City B                News for City B              1
9101        City C                         C News              1

0

从重复行中提取字符串，删除重复项，给出字符串计数[重复]

使用 <font color="#xxx"> 突出显示 html 中的代码

为什么在传递 {} 时重载解析更喜欢 std::nullptr_t 而不是类？

您可以使用花括号初始化列表作为（默认）模板参数吗？

为什么列表推导式在内部创建一个函数？

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

为什么 'char -> int' 是提升，而 'char -> Short' 是转换（但不是提升）？

为什么库中不调用全局变量的构造函数？

std::common_reference_with 在元组上的行为不一致。哪个是对的？

C++17 中 std::byte 只能按位运算？

从重复行中提取字符串，删除重复项，给出字符串计数[重复]

1 个回答

相关问题