Como classificar o tensor em "lote" por valor de chave específico?

Question

BlackPhoenix

Asked: 2024-12-04 17:48:43 +0800 CST2024-12-04 17:48:43 +0800 CST 2024-12-04 17:48:43 +0800 CST

Média e mediana da distribuição dada pelo histograma numpy

772

Suponha que você tenha um numpy histogramcalculado a partir de alguns dados (aos quais você não tem acesso), então você só conhece bins e contagens. Existe uma maneira eficiente de calcular a média e a mediana da distribuição descrita pelo histograma?

1 respostas

Voted

mozway · Answer 1 · 2024-12-04T18:14:18+08:00

Não, você não pode. Após agregação como histograma, a informação inicial é parcialmente perdida. Você não pode calcular exatamente a média/mediana da população original.

Como demonstração, aqui estão duas matrizes diferentes (com médias/medianas diferentes) que fornecem as mesmas contagens e compartimentos:

a1 = np.array([10, 20, 100, 300, 310])
np.mean(a1), np.median(a1)
# (148.0, 100.0)

a2 = np.array([10, 10, 130, 300, 310])
np.mean(a2), np.median(a2)
# (152.0, 130.0)

np.histogram(a1, bins=2)
# (array([3, 2]), array([ 10., 160., 310.])

np.histogram(a2, bins=2)
# (array([3, 2]), array([ 10., 160., 310.])

Aproximação

No entanto, você pode determinar os limites da média:

low = np.average(bins[:-1], weights=cnt)
high = np.average(bins[1:], weights=cnt)
print(f'The average is in the {low}-{high} range.')
# The average is in the 70.0-220.0 range.

E para a mediana:

cnt_cumsum = np.add.accumulate(cnt)
idx = np.searchsorted(cnt_cumsum, half)
low = bins[idx]
high = bins[idx+1]
print(f'The median is in the {low}-{high} range.')
# The median is in the 10.0-160.0 range.

Exemplo com 1000 valores aleatórios e 20 caixas:

True data mean: 0.496, median: 0.481
The average is in the 0.471-0.521 range.
The median is in the 0.45-0.5 range.

Média e mediana da distribuição dada pelo histograma numpy

Aproximação

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Média e mediana da distribuição dada pelo histograma numpy

1 respostas

Aproximação

relate perguntas