Suponha que você tenha um numpy histogram
calculado a partir de alguns dados (aos quais você não tem acesso), então você só conhece bins e contagens. Existe uma maneira eficiente de calcular a média e a mediana da distribuição descrita pelo histograma?
relate perguntas
-
Como classificar o tensor em "lote" por valor de chave específico?
-
Aviso de descontinuação do notebook Jupyter ao encontrar a raiz do determinante de uma matriz
-
Como você concatena matrizes internas do tensor ao longo do eixo?
-
Digite regra de promoção para i4 e S8 no documento numpy
-
Transmitindo uma matriz numpy em uma matriz de tamanho maior usando uma matriz de índice
Não, você não pode. Após agregação como histograma, a informação inicial é parcialmente perdida. Você não pode calcular exatamente a média/mediana da população original.
Como demonstração, aqui estão duas matrizes diferentes (com médias/medianas diferentes) que fornecem as mesmas contagens e compartimentos:
Aproximação
No entanto, você pode determinar os limites da média:
E para a mediana:
Exemplo com 1000 valores aleatórios e 20 caixas: