user24758287提出的问题 -coding

user24758287

Asked: 2024-11-25 12:28:19 +0800 CST

Polares - Como extrair o último valor não nulo em uma determinada coluna

Gostaria de realizar o seguinte:

Entrada:

df = pl.DataFrame({
    "a": [1,15,None,20,None]
})

Saída:

df = pl.DataFrame({
    "a": [1,15,None,20,None],
    "b": [0,14,None,5,None]
})

Ou seja, de:

UM
1
15
Nenhum
20
Nenhum

para:

UM	B
1	0
15	14
Nenhum	Nenhum
20	5
Nenhum	Nenhum

Então, o que ele faz:

Se o valor de "A" for nulo, então o valor de B (coluna de saída) também será nulo
Se "A" tiver algum valor, recupere o último valor não nulo em "A" e, em seguida, subtraia o valor atual em "A" com o valor não nulo anterior.

Gostaria de fazer isso na biblioteca de dataframes polars do Python, mas não consigo encontrar uma solução.

Tentei a seguinte pergunta:

Como selecionar o último valor não nulo de uma coluna e também o valor de outra coluna na mesma linha em Polars?

Mas infelizmente, isso não responde ao problema original, já que a pergunta realiza uma agregação de uma coluna inteira e, então, pega o último valor dessa coluna.

O que eu gostaria de fazer não é agregar uma coluna inteira, mas simplesmente subtrair um valor atual com um valor anterior não nulo.

Eu também tentei usar rolling:

df = df.with_row_index().rolling(
    index_column = 'index',
    period = '???i').agg(pl.col("A").last())

Mas, é claro, isso não funciona porque a ocorrência de Valores Nulos não pode ser determinada (ou seja, não é periódica, então não sei quantos índices antes da entrada atual contêm um valor não nulo em "A").

Alguém sabe como fazer isso?

Obrigado!

user24758287

Asked: 2024-09-11 12:30:00 +0800 CST

Como extrair valores com base em nomes de colunas e colocá-los em outra coluna em polares?

Gostaria de preencher um valor em uma coluna com base no nome de outra coluna, na biblioteca Polars do python (obtive o seguinte DF explodindo os nomes das colunas das minhas variáveis):

Entrada:

Nome	Média	Mediana	Q1	Variável
Maçã	2	3	4	Média
Maçã	2	3	4	Mediana
Maçã	2	3	4	Q1
Banana	1	5	10	Média
Banana	1	5	10	Mediana
Banana	1	5	10	Q1

Saída esperada:

Nome	Média	Mediana	Q1	Variável	Valor
Maçã	2	3	4	Média	2
Maçã	2	3	4	Mediana	3
Maçã	2	3	4	Q1	4
Banana	1	5	10	Média	1
Banana	1	5	10	Mediana	5
Banana	1	5	10	Q1	10

Você pode gerar a tabela de entrada aqui:

test = pl.DataFrame(
    {
        "Name": ["Apple","Apple","Apple","Banana","Banana","Banana"],
        "Average": [2,2,2,1,1,1],
        "Median": [3,3,3,5,5,5],
        "Q1": [4,4,4,10,10,10],
        "Variable":["Average","Median","Q1","Average","Median","Q1"]
    }
)

Eu tentei:

df = df.with_columns(value = pl.col(f"{pl.col.variable}"))

Mas isso não funciona porque polars percebem o argumento como uma função (?). Alguém sabe como fazer isso?

Nota: Eu também tentei transpor o dataframe, o que, além de ser computacionalmente caro, também não funcionou! Porque ele transporia o DF para um DF de 5 linhas. O que eu preciso é de um DF de (Nome * Número de Variáveis) linhas.

Ou seja, por exemplo, se eu tiver 3 nomes diferentes (por exemplo, Maçã, Banana e Fruta do Dragão) e 3 variáveis (Média, Mediana, Q1), meu DF deverá ter 9 linhas de comprimento!

Polares - Como extrair o último valor não nulo em uma determinada coluna

Como extrair valores com base em nomes de colunas e colocá-los em outra coluna em polares?

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

user24758287's questions