如何将 for 循环拆分为 3 个单独的数据框？

Question

Alex

Asked: 2024-07-26 02:34:50 +0800 CST2024-07-26 02:34:50 +0800 CST 2024-07-26 02:34:50 +0800 CST

如何使用与 df“B” 的比较作为条件来过滤 df“A”？

772

我有 2 个数据框，dfA和dfB，它们具有不同的形状和不同的顺序。dfA包含在中dfB。

此示例中有 3 列，“职位”、“部门”和“薪水”。dfA“薪水”列中缺少值，因此我想从中获取这些值dfB。

dfA如果和之间的“职位名称”和“工作部门”匹配dfB，“薪水”也相同，因此我可以使用中的“薪水”来dbB填写dfA。

例如，“教师”部门的每个“英语教师”的工资都是X，但“民办教师”部门的“英语教师”的工资却不同，尽管职称相同。

但是，我还没有找到执行该操作的代码。

我的思考过程是这样的，尽管我认为它完全是错误的：

condition_A = (dfA['Job Title'] == dfB['Job Title'])

condition_B = (dfA['Job Department'] == dfB['Job Department'])

dfA.loc[(condition_A) & (condition_B), 'Job Salary'] = dfB.loc[(condition_A) & (condition_B), 'Job Salary']

这次尝试显然没有成功。

dataA = {
    'Job Title': ['ET', 'FT', 'ET', 'ST', 'ST'],
    'Job Department': ['T', 'T', 'PT', 'T', 'PT'],
    'Job Salary': [np.nan, 1500, 1000, np.nan, np.nan]
}
dfA = pd.DataFrame(dataA)

dataB = {
    'Job Title': ['ST', 'ET', 'RT', 'FT', 'ST', 'PT', 'ET'],
    'Job Department': ['T', 'T', 'PT', 'T', 'PT', 'T', 'PT'],
    'Job Salary': [2000, 800, 1700, 1500, 2500, 700, 1000]
}
dfB = pd.DataFrame(dataB)

期望结果（dfA缺失值填充dfB）：

dataA = {
    'Job Title': ['ET', 'FT', 'ET', 'ST', 'ST'],
    'Job Department': ['T', 'T', 'PT', 'T', 'PT'],
    'Job Salary': [800, 1500, 1000, 2000, 2500]
}
dfA = pd.DataFrame(dataA)

提前致谢！

1 个回答

Voted

dydev · Answer 1 · 2024-07-26T03:05:00+08:00

Best Answer

dydev

2024-07-26T03:05:00+08:002024-07-26T03:05:00+08:00

dfA = pd.merge(
    dfA,
    dfB,
    how="left",
    on=["Job Title", "Job Department"],
    suffixes=("_dropme", ""),
).drop(columns='Job Salary_dropme')

表格中的结果与您描述的一样，除了最后的职位薪水值之外，我认为这是您的错误，因为在给出的dfA和的示例中不存在职位-部门-薪水dfB。

职称	工作部门	工作薪资
等	电视	800
金融时报	电视	1500
等	太平洋标准时间	1000
英石	电视	2000
英石	太平洋标准时间	2500

2

如何使用与 df“B” 的比较作为条件来过滤 df“A”？

为什么要通过 where 子句中绑定的通用特征来约束单位类型（如 `where () : Trait<…>`）？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

如果 T 既不可构造、不可复制、也不可移动，那么我可以拥有 std::optional<T> 吗？

为什么我可以定义一个 constinit 的 std::string 实例？如果对象需要动态初始化，constinit 不是被禁止的吗？

如何分配以后放置的新“如同新”

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

如何使用与 df“B” 的比较作为条件来过滤 df“A”？

1 个回答

相关问题