如何按特定键值“批量”排序张量？

Question

BlackPhoenix

Asked: 2024-12-04 17:48:43 +0800 CST2024-12-04 17:48:43 +0800 CST 2024-12-04 17:48:43 +0800 CST

给定 numpy 直方图的分布的平均值和中位数

772

假设您numpy histogram根据一些数据（您无法访问）计算出一个，因此您只知道箱数和计数。有没有一种有效的方法来计算直方图描述的分布的平均值和中位数？

1 个回答

Voted

mozway · Answer 1 · 2024-12-04T18:14:18+08:00

不可以。聚合为直方图后，初始信息会部分丢失。您无法准确计算原始总体的平均值/中位数。

为了演示，这里有两个不同的数组（具有不同的均值/中位数），它们给出相同的计数和箱子：

a1 = np.array([10, 20, 100, 300, 310])
np.mean(a1), np.median(a1)
# (148.0, 100.0)

a2 = np.array([10, 10, 130, 300, 310])
np.mean(a2), np.median(a2)
# (152.0, 130.0)

np.histogram(a1, bins=2)
# (array([3, 2]), array([ 10., 160., 310.])

np.histogram(a2, bins=2)
# (array([3, 2]), array([ 10., 160., 310.])

近似

但是你可以确定平均值的限度：

low = np.average(bins[:-1], weights=cnt)
high = np.average(bins[1:], weights=cnt)
print(f'The average is in the {low}-{high} range.')
# The average is in the 70.0-220.0 range.

对于中位数：

cnt_cumsum = np.add.accumulate(cnt)
idx = np.searchsorted(cnt_cumsum, half)
low = bins[idx]
high = bins[idx+1]
print(f'The median is in the {low}-{high} range.')
# The median is in the 10.0-160.0 range.

具有 1000 个随机值和 20 个箱的示例：

True data mean: 0.496, median: 0.481
The average is in the 0.471-0.521 range.
The median is in the 0.45-0.5 range.

给定 numpy 直方图的分布的平均值和中位数

近似

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

为什么这个简单而小的 Java 代码在所有 Graal JVM 上的运行速度都快 30 倍，但在任何 Oracle JVM 上却不行？

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

给定 numpy 直方图的分布的平均值和中位数

1 个回答

近似

相关问题