Henkie提出的问题 -coding

Henkie

Asked: 2024-11-10 00:20:19 +0800 CST

这段 Python 代码可以加速吗？

我有以下想要加速的代码：

import numpy as np

def do_calc(a, b, d, sum_)->None:
    idx = np.ndindex(a.shape[:1]) 
    sum_[:] = 0
    for i in idx:
       sum_[0:d[i[0]]] -= a[i, 0:d[i[0]]][0]
       sum_[d[i[0]]] += b[i, d[i[0]]][0]
    return sum_


a=np.ones((5,10), order='F')
b=np.ones((5,10), order='F')*10

sum_ = np.empty(a.shape[1])

d = [8,5,2,7,1]
do_calc(a, b, d, sum_)

因此 a 和 b 是静态的 5x10 数组，我想将它们加起来形成sum_一个长度为 1d 的数组，如下所示：

对于每一行i，b我只想包含索引d[i]，也就是b[i, d[i]]将进入位置sum_[d[i]]
对于每一行i，a我想包含所有到索引的值d[i]，也就是说a[i, 0:d[i]]，将进入位置sum_[0:d[i]]

在这个例子中，我们有：


a= array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
          [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
          [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
          [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
          [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.]])

b= array([[10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
          [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
          [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
          [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],
          [10., 10., 10., 10., 10., 10., 10., 10., 10., 10.]])

d= [8, 5, 2, 7, 1]

sum_= array([-5.,  6.,  7., -3., -3.,  8., -2.,  9., 10.,  0.])

我尝试了以下方法：

使用 Fortan 顺序，因为我们主要复制最后一个索引
sum_传递给 do_calc 函数，这样就不必每次都启动它。最后两行有一个大循环，我们每次都会为 d 生成新值并运行 do_calc。
使用 ndindex 来迭代行。

我想知道是否可以更有效地完成此操作，因为代码一直在处理这一部分。而实际上 a 和 b 不是常量，因此我们无法在此示例中利用这一点。

Henkie

Asked: 2024-11-06 19:14:58 +0800 CST

如何根据每个列的不同条件过滤 DataFrame

我有一个 DataFrame，其中对于每一列，我只想根据索引显示特定值，但这些条件对于每一列都是不同的。它看起来像这样：

data = {'a': [1,2,3,4,5],
        'b': [10,20,30,40,50],
        'c': [1,1,1,1,1]}
df = pd.DataFrame(data)

df:
   a   b  c
0  1  10  1
1  2  20  1
2  3  30  1
3  4  40  1
4  5  50  1

我现在想要取“a”的索引 <3、“b”的索引 <2 和“c”的索引 = 4 的值。结果如下：

     a     b    c
0  1.0  10.0  NaN
1  2.0  20.0  NaN
2  3.0   NaN  NaN
4  NaN   NaN  1.0

我尝试了以下操作：

import pandas as pd

df_a = df.loc[df.index<3, 'a']
df_b = df.loc[df.index<2, 'b']
df_c = df.loc[df.index==4, 'c']

df_result = pd.concat([df_a, df_b, df_c], axis=1)```

这给出了所需的结果，但有没有更有效的方法来实现这一点？因此，如果我有一个“<”条件列表和一个“=”条件列表，那么我可以一次性创建结果过滤器吗？如果 NaN 变为零，那就没问题了，因为无论如何，这最终都是我想要的。

这段 Python 代码可以加速吗？

如何根据每个列的不同条件过滤 DataFrame

为什么要通过 where 子句中绑定的通用特征来约束单位类型（如 `where () : Trait<…>`）？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

如果 T 既不可构造、不可复制、也不可移动，那么我可以拥有 std::optional<T> 吗？

为什么我可以定义一个 constinit 的 std::string 实例？如果对象需要动态初始化，constinit 不是被禁止的吗？

如何分配以后放置的新“如同新”

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

Henkie's questions