如何将 for 循环拆分为 3 个单独的数据框？

Question

KansaiRobot

Asked: 2024-01-30 23:34:47 +0800 CST2024-01-30 23:34:47 +0800 CST 2024-01-30 23:34:47 +0800 CST

仅对某些索引应用函数

772

我有一个函数computeLeft，它接收一个索引并返回四个数字。像这样的东西：

def computeLeft(i):
    return np.array([i*2, i*3, i*4, i*5])
    # edited to correct it

现在在我的代码中我这样使用它：

import numpy as np
import pandas as pd

results=["val1","val2","val3","val4"]
df[results] = np.vectorize(computeLeft, signature="()->(4)")(range(len(df)))

哪里df有一些数据框。

这显然将该函数应用于的所有行df。我想将此函数仅应用于的某些索引df。

例如我有一个清单[2, 5, 7, 8, 10]。我只想计算computeLeft列表中的索引，并且结果中的列仅具有这些行的值（其余行具有 Nan）。

我怎样才能有computeLeft选择性地申请呢？

2 个回答

Voted

Oskar Hofmann · Answer 1 · 2024-01-31T02:40:36+08:00

Best Answer

Oskar Hofmann

2024-01-31T02:40:36+08:002024-01-31T02:40:36+08:00

首先，您需要修复您的函数及其向量化：

def computeLeft(i):
    return np.array([i*2, i*3, i*4, i*5])

computeLeftVectorized = np.vectorize(computeLeft, signature="()->(n)")

为了实现你的目标，你可以使用loc[]：

results=["val1","val2","val3","val4"]

# Add new columns and fill the columns with NaN
df[results] = np.nan

indices_to_change = [2,5,7,8,10]
# change all rows in results with the provided indices
df.loc[indices_to_change, results] = computeLeftVectorized(indices_to_change)

这假设您的数据帧具有给定整数的索引标签（给定索引不仅仅是具有不同索引标签的行号）。

2

jared · Answer 2 · 2024-01-31T09:17:07+08:00

如果computeLeft代表您的实际函数，那么您最好以矢量化方式编写它，因为np.vectorize它很慢（它主要是一个便利函数，并不能提高速度）。在这种情况下，您可以将函数编写为：

def computeLeftNumpy(i):
    i = np.asarray(i)
    return np.array([i*2, i*3, i*4, i*5]).T

用法：

import pandas as pd
import numpy as np

indices_to_change = [2,5,7,8,10]

df = pd.DataFrame({"val1":np.zeros(15),
                   "val2":np.zeros(15),
                   "val3":np.zeros(15),
                   "val4":np.zeros(15)})
print(df)
df.loc[indices_to_change] = computeLeftNumpy(indices_to_change)
print(df)

输出：

    val1  val2  val3  val4
0    0.0   0.0   0.0   0.0
1    0.0   0.0   0.0   0.0
2    0.0   0.0   0.0   0.0
3    0.0   0.0   0.0   0.0
4    0.0   0.0   0.0   0.0
5    0.0   0.0   0.0   0.0
6    0.0   0.0   0.0   0.0
7    0.0   0.0   0.0   0.0
8    0.0   0.0   0.0   0.0
9    0.0   0.0   0.0   0.0
10   0.0   0.0   0.0   0.0
11   0.0   0.0   0.0   0.0
12   0.0   0.0   0.0   0.0
13   0.0   0.0   0.0   0.0
14   0.0   0.0   0.0   0.0

    val1  val2  val3  val4
0    0.0   0.0   0.0   0.0
1    0.0   0.0   0.0   0.0
2    4.0   6.0   8.0  10.0
3    0.0   0.0   0.0   0.0
4    0.0   0.0   0.0   0.0
5   10.0  15.0  20.0  25.0
6    0.0   0.0   0.0   0.0
7   14.0  21.0  28.0  35.0
8   16.0  24.0  32.0  40.0
9    0.0   0.0   0.0   0.0
10  20.0  30.0  40.0  50.0
11   0.0   0.0   0.0   0.0
12   0.0   0.0   0.0   0.0
13   0.0   0.0   0.0   0.0
14   0.0   0.0   0.0   0.0

速度对比：

indices_to_change = np.arange(5000)
%timeit computeLeftVectorized(indices_to_change)
7.77 ms ± 30.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
%timeit computeLeftNumpy(indices_to_change)
11.6 µs ± 281 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)

显然不使用的版本np.vectorize要快得多。

仅对某些索引应用函数

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

仅对某些索引应用函数

2 个回答

相关问题