如何将 for 循环拆分为 3 个单独的数据框？

Question

Leyla Elkhamlichi

Asked: 2024-11-04 18:54:27 +0800 CST2024-11-04 18:54:27 +0800 CST 2024-11-04 18:54:27 +0800 CST

使用长数据框的条件用另一列的值填充一列

772

我想用另一列的值填充数据框，我使用条件来填充值。我想要填写的条件是当列“Essentieel_Optioneel”中的值 ==“essentieel”时，需要用 perc_essentieel_skill 填充值。当值为“optioneel”时也是如此。

当我削减这个时我得到一个错误

conditions = [
     (df1['Essentieel_Optioneel'] <= 'essentieel'),
     (df1['Essentieel_Optioneel'] <= 'optioneel')

]

values = df1[['perc_essentieel_skill','perc_essentieel_skill']]
df1['vector'] = np.select(conditions, values)

df1

    811 'list of cases must be same length as list of conditions')
    813 # Now that the dtype is known, handle the deprecated select([], []) case
    814 if len(condlist) == 0:

ValueError: list of cases must be same length as list of conditions

我觉得我的数据框太长了，我有一个 19913 * 12 列的框。

我感觉我必须使用 for 循环。

1 个回答

Voted

mozway · Answer 1 · 2024-11-04T19:01:16+08:00

为了清楚起见，您应该提供一个完整的示例，但假设您想使用这两列作为替换，则需要转置values并转换为 numpy 数组：

values = df1[['perc_essentieel_skill1', 'perc_essentieel_skill2']].T.values
df1['vector'] = np.select(conditions, values)

或者手动分配每个条件的列：

df1['vector'] = np.select(conditions, [df1['perc_essentieel_skill1'],
                                       df1['perc_essentieel_skill2']])

例子：

  Essentieel_Optioneel perc_essentieel_skill1 perc_essentieel_skill2 vector
0           essentieel                     A1                     B1     A1
1           essentieel                     A2                     B2     A2
2            optioneel                     A3                     B3     B3

如果“Essentieel_Optioneel”中有离散类别，您还可以重构代码以使用索引查找：

d = {'essentieel': 'perc_essentieel_skill1',
     'optioneel': 'perc_essentieel_skill2'
    }

idx, cols = pd.factorize(df1['Essentieel_Optioneel'].map(d))

df1['vector'] = df1.reindex(cols, axis=1).to_numpy()[np.arange(len(df1)), idx]

使用长数据框的条件用另一列的值填充一列

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

使用长数据框的条件用另一列的值填充一列

1 个回答

相关问题