AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 79216699
Accepted
Christian Bongiorno
Christian Bongiorno
Asked: 2024-11-23 06:01:51 +0800 CST2024-11-23 06:01:51 +0800 CST 2024-11-23 06:01:51 +0800 CST

No Oracle: Como obter apenas os registros cuja soma constitui > x % do total

  • 772

Tenho estes dados:

select * from (
    select 'A' as JOB, 15 as errors from dual union all
    select 'B' as JOB, 17 as errors from dual union all
    select 'C' as JOB, 29 as errors from dual union all
    select 'D' as JOB, 27 as errors from dual union all
    select 'E' as JOB, 35 as errors from dual union all
    select 'F' as JOB, 32 as errors from dual union all
    select 'G' as JOB, 75 as errors from dual union all
    select 'H' as JOB, 31 as errors from dual union all
    select 'I' as JOB, 12 as errors from dual union all
    select 'J' as JOB, 10 as errors from dual
)

E, em palavras, eu preciso:The jobs constituting the (top) 60% of errors

Então, neste caso, seria (113):

select sum(errors) * .4 as cut_off from ...

Os resultados finais seriam estes, pois sua soma < 113:

TRABALHO ERROS
G 75
E 35

Basicamente, preciso de um filtro que mantenha algum tipo de soma corrente e, depois, descarte tudo quando atingir esse valor.

Tenho essa consulta, que não funciona muito bem e eu preferiria não usar a withdeclaração

with data as (
    select 'A' as JOB, 15 as errors from dual union all
        select 'B' as JOB, 17 as errors from dual union all
        select 'C' as JOB, 29 as errors from dual union all
        select 'D' as JOB, 27 as errors from dual union all
        select 'E' as JOB, 35 as errors from dual union all
        select 'F' as JOB, 32 as errors from dual union all
        select 'G' as JOB, 75 as errors from dual union all
        select 'H' as JOB, 31 as errors from dual union all
        select 'I' as JOB, 12 as errors from dual union all
        select 'J' as JOB, 10 as errors from dual
)
select k.*
from (
    select t.*,
           errors + LAG(errors, 1, 0) OVER (order by errors desc ) previous
    from data t
) k where previous >= (select sum(errors) *.4 from data) order by errors desc

E eu tentei a soma em janela:

select k.*
from (
    select t.*,
           SUM(errors) OVER (
               partition by JOB
               order by errors desc
               RANGE BETWEEN UNBOUNDED PRECEDING
                AND CURRENT ROW
          ) as limit
    from (
        select 'A' as JOB, 15 as errors from dual union all
        select 'B' as JOB, 17 as errors from dual union all
        select 'C' as JOB, 29 as errors from dual union all
        select 'D' as JOB, 27 as errors from dual union all
        select 'E' as JOB, 35 as errors from dual union all
        select 'F' as JOB, 32 as errors from dual union all
        select 'G' as JOB, 75 as errors from dual union all
        select 'H' as JOB, 31 as errors from dual union all
        select 'I' as JOB, 12 as errors from dual union all
        select 'J' as JOB, 10 as errors from dual
    ) t
) k order by errors desc
sql
  • 2 2 respostas
  • 26 Views

2 respostas

  • Voted
  1. Best Answer
    keithwalsh
    2024-11-23T06:27:33+08:002024-11-23T06:27:33+08:00
    • SUM(errors) OVER (ORDER BY errors DESC ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW)calcula o total de erros em ordem decrescente.
    • WHERE cum_errors <= cut_offfiltra trabalhos com erros cumulativos abaixo de 40% do total.
    SELECT job, errors
    FROM (
        SELECT job, errors,
            SUM(errors) OVER (ORDER BY errors DESC
                ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS cum_errors,
            SUM(errors) OVER () * 0.4 AS cut_off
        FROM (
            SELECT 'A' AS job, 15 AS errors FROM DUAL UNION ALL
            SELECT 'B' AS job, 17 AS errors FROM DUAL UNION ALL
            SELECT 'C' AS job, 29 AS errors FROM DUAL UNION ALL
            SELECT 'D' AS job, 27 AS errors FROM DUAL UNION ALL
            SELECT 'E' AS job, 35 AS errors FROM DUAL UNION ALL
            SELECT 'F' AS job, 32 AS errors FROM DUAL UNION ALL
            SELECT 'G' AS job, 75 AS errors FROM DUAL UNION ALL
            SELECT 'H' AS job, 31 AS errors FROM DUAL UNION ALL
            SELECT 'I' AS job, 12 AS errors FROM DUAL UNION ALL
            SELECT 'J' AS job, 10 AS errors FROM DUAL
        ) t
    )
    WHERE cum_errors <= cut_off
    ORDER BY errors DESC;
    

    Saída:

    TRABALHO ERROS
    G 75
    E 35

    violino

    • 2
  2. samhita
    2024-11-23T07:58:40+08:002024-11-23T07:58:40+08:00

    Outra lógica usando subconsulta e autojunção.

    total_erros_cte:

    Este CTE calcula o número total de erros da tabela jobs_errors. Ele simplesmente soma todos os erros na tabela.

    soma_corrente_cte:

    Este CTE calcula a soma cumulativa de erros em ordem decrescente. Para cada trabalho, ele soma os erros de todos os trabalhos que têm erros maiores ou iguais à contagem de erros do trabalho atual (ONDE x.errors >= t.errors). Ele também recupera o total_errors do total_errors_cte para comparar a soma corrente com 40% do total de erros.

    WITH total_errors_cte AS (
        -- Calculate the total errors for all jobs
        SELECT SUM(errors) AS total_errors
        FROM jobs_errors
    ),
    running_sum_cte AS (
        -- Calculate the running sum of errors, ordered by errors DESC
        SELECT JOB, errors, 
               (SELECT total_errors FROM total_errors_cte) AS total_errors,
               (
                   SELECT SUM(errors)
                   FROM jobs_errors x
                   WHERE x.errors >= t.errors
               ) AS running_sum
        FROM jobs_errors t
    )
    -- Filter jobs whose running sum is <= 40% of total errors
    SELECT JOB, errors
    FROM running_sum_cte
    WHERE running_sum <= total_errors * 0.4
    ORDER BY errors DESC;
    

    Saída :

    Violino

    insira a descrição da imagem aqui

    • 0

relate perguntas

  • Atualizando todas as linhas, exceto uma que tenha os mesmos valores em determinadas colunas

  • Existe uma maneira de inverter apenas os números quando eu retornar uma coluna sql? (hebraico)

  • SQL menor/maior comparação entre booleanos produz resultados inesperados

  • Como atualizar valores na tabela Postgres com base em uma correspondência em uma matriz

  • Como somar colunas no sql server

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

    • 1 respostas
  • Marko Smith

    Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

    • 1 respostas
  • Marko Smith

    Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

    • 1 respostas
  • Marko Smith

    Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

    • 6 respostas
  • Marko Smith

    `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

    • 3 respostas
  • Marko Smith

    Quando devo usar um std::inplace_vector em vez de um std::vector?

    • 3 respostas
  • Marko Smith

    Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

    • 1 respostas
  • Marko Smith

    PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

    • 2 respostas
  • Marko Smith

    AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Martin Hope
    Aleksandr Dubinsky Por que a correspondência de padrões com o switch no InetAddress falha com 'não cobre todos os valores de entrada possíveis'? 2024-12-23 06:56:21 +0800 CST
  • Martin Hope
    Phillip Borge Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle? 2024-12-12 20:46:46 +0800 CST
  • Martin Hope
    Oodini Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores? 2024-12-12 06:27:11 +0800 CST
  • Martin Hope
    sleeptightAnsiC `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso? 2024-11-09 07:18:53 +0800 CST
  • Martin Hope
    The Mad Gamer Quando devo usar um std::inplace_vector em vez de um std::vector? 2024-10-29 23:01:00 +0800 CST
  • Martin Hope
    Chad Feller O ponto e vírgula agora é opcional em condicionais bash com [[ .. ]] na versão 5.2? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng Por que `dict(id=1, **{'id': 2})` às vezes gera `KeyError: 'id'` em vez de um TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos 2024-03-20 03:12:31 +0800 CST
  • Martin Hope
    MarkB Por que o GCC gera código que executa condicionalmente uma implementação SIMD? 2024-02-17 06:17:14 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve