FredMaster提出的问题 -coding

FredMaster

Asked: 2024-01-25 17:15:53 +0800 CST

Dataframe Polars: grupos sobrepostos

Atualmente estou "convertendo" de pandas para polares porque gosto muito da API. Esta pergunta é uma pergunta mais geral para uma pergunta anterior minha (veja aqui )

Eu tenho o seguinte dataframe


# Dummy data
df = pl.DataFrame({
    "Buy_Signal": [1, 0, 1, 0, 1, 0, 0], 
    "Returns": [0.01, 0.02, 0.03, 0.02, 0.01, 0.00, -0.01],
})

Em última análise, quero fazer agregações na coluna Returnscondicionais a intervalos diferentes - que são dados por column Buy_Signal. No caso acima, o comprimento é de 1 até o final do dataframe. O dataframe resultante deve, portanto, ter a seguinte aparência

| group     | Returns   |
|------:    |--------:  |
|   u32     |     f64   |
|     1     |    0.01   |
|     1     |    0.02   |
|     1     |    0.03   |
|     1     |    0.02   |
|     1     |    0.01   |
|     1     |     0.0   |
|     1     |   -0.01   |
|     2     |    0.03   |
|     2     |    0.02   |
|     2     |    0.01   |
|     2     |     0.0   |
|     2     |   -0.01   |
|     3     |    0.01   |
|     3     |     0.0   |
|     3     |   -0.01   |

Uma abordagem postada como resposta à minha pergunta anterior é a seguinte:


# Build overlapping group index
idx = df.select(index=
          pl.when(pl.col("Buy_Signal") == 1)
          .then(pl.int_ranges(pl.int_range(pl.len()), pl.len()  ))
).explode(pl.col("index")).drop_nulls().cast(pl.UInt32)

# Join index with original data
df = (df.with_row_index()
    .join(idx, on="index")
    .with_columns(group = (pl.col("index") == pl.col("index").max())
                .shift().cum_sum().backward_fill() + 1)
    .select(["group", "Returns"])
)
df

Pergunta: existem outras boas soluções para este problema.

Com bom quero dizer (i) legível e/ou (ii) rápido.

Meu problema real contém conjuntos de dados muito maiores.

Obrigado

FredMaster

Asked: 2023-08-18 14:28:21 +0800 CST

Mesas de látex em Quarto

Estou usando o Quarto para construir uma apresentação no formato revelar js.

Como posso produzir tabelas de látex na minha apresentação? Eu sou capaz de produzir fórmulas de látex usando a $$...$$sintaxe. No entanto, quando eu faço

$$
\begin{table}[]
\begin{tabular}{@{}ll@{}}
\toprule
Header 1 & Header 2 \\ \midrule
A        & B        \\
C        & C       
\end{tabular}
\end{table}
$$

A tabela não é mostrada e no VS Code recebo a mensagem de erro Quarto: Help Latex Error "Unknown environment table

Existe uma maneira de mostrar tabelas de látex no quarto revelar?

Dataframe Polars: grupos sobrepostos

Mesas de látex em Quarto

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

FredMaster's questions