Atualizando todas as linhas, exceto uma que tenha os mesmos valores em determinadas colunas

Question

Asked: 2024-06-05 15:55:10 +0800 CST2024-06-05 15:55:10 +0800 CST 2024-06-05 15:55:10 +0800 CST

Postgres SQL: Como obter uma espécie de correlação contínua?

772

Dada a seguinte estrutura de dados:

X	S
1	10
1	15
1	12
2	32
2	11
2	45
2	55
3	23
3	34
3	56
3	23
3	45
4	32
4	84
4	24
4	23

Gosto de correlacionar X com Y. Levando em conta todos os dados, isso é trivial, claro:

SELECT CORR(X,Y) FROM some_table;

Mas gosto de correlacionar X com Y de forma contínua. Então o resultado pode ser assim:

X	CORR(X,Y)
1	0,40
2	0,43

Para a linha X=1, CORR(X,Y) reflete a correlação de X com Y, mas apenas para X sendo 1,2 ou 3. Da mesma forma, para a linha X=2, a correlação é apenas para X sendo 2,3 ou 4.

Mas, para ser honesto, não tenho ideia de como cobrir isso. Primeiro, pensei em usar uma espécie de combinação de GROUP BY, LAG e PARTITION, mas não tenho ideia de como combiná-los de maneira sensata.

1 respostas

Voted

Dogbert · Answer 1 · 2024-06-05T16:13:34+08:00

Usando uma função de janela com order by x range between current row and 2 following(que encontrará a correlação entre todas as linhas com x = valor atual e valor atual + 2):

select distinct
    x,
    corr
from (
    select
        x,
        corr(x, y) over (order by x range between current row and 2 following)
    from
        items) items
order by
    x;

Configurar:

create table items (x integer not null, y integer not null);

insert into items(x, y) values
    (1, 10),
    (1, 15),
    (1, 12),
    (2, 32),
    (2, 11),
    (2, 45),
    (2, 55),
    (3, 23),
    (3, 34),
    (3, 56),
    (3, 23),
    (3, 45),
    (4, 32),
    (4, 84),
    (4, 24),
    (4, 23);

Saída:

x   corr
1   0.5369994889254458
2   0.10527796470131953
3   0.11612585264679108
4   null

Verificado com:

select corr(x, y) from (select * from items where x in (1, 2, 3)) items;
# => 0.5369994889254458

select corr(x, y) from (select * from items where x in (2, 3, 4)) items;
# => 0.10527796470131953

Para mostrar nulo para linhas onde o intervalo de x não é 3:

select distinct
    x,
    case when range = 3 then corr else null end
from (
    select
        x,
        corr(x, y) over w,
        max(x) over w - min(x) over w + 1 as range
    from items
    window w as (order by x range between current row and 2 following)
    ) items
order by
    x;

Saída:

1   0.5369994889254458
2   0.10527796470131953
3   null
4   null

Postgres SQL: Como obter uma espécie de correlação contínua?

Como retornar várias colunas de uma função dentro de `mutate` e me permitir nomear as colunas de saída?

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

Buscando uma explicação para a mudança na ordem das operações de ampliação do .NET Framework 4.8 para o .NET 8

Qual é a diferença entre passar NULL e nullptr para um parâmetro de modelo?

Como o C++ seleciona o operador `delete` em caso de substituição na subclasse?

Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira?

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Selenium urllib.error.HTTPError: Erro HTTP 404: Não encontrado

destaque o código em HTML usando <font color="#xxx">

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Postgres SQL: Como obter uma espécie de correlação contínua?

1 respostas

relate perguntas