Como divido o loop for em 3 quadros de dados individuais?

Question

AmirX

Asked: 2024-08-09 14:47:50 +0800 CST2024-08-09 14:47:50 +0800 CST 2024-08-09 14:47:50 +0800 CST

É possível não obter NaN para o primeiro valor de pct_change()?

772

Meu DataFrame é:

import pandas as pd 
df = pd.DataFrame(
    {
        'a': [20, 30, 2, 5, 10]
    }
)

A saída esperada é pct_change()de a:

    a  pct_change
0  20  -50.000000
1  30   50.000000
2   2  -93.333333
3   5  150.000000
4  10  100.000000

Quero comparar df.a.iloc[0]com 40 para o primeiro valor de pct_change. Se eu usar df['pct_change'] = df.a.pct_change().mul(100), o primeiro valor será NaN.

Minha tentativa:

def percent(a, b):
    result = ((a - b) / b) * 100
    return result.round(2)

df.loc[df.index[0], 'pct_change'] = percent(df.a.iloc[0], 40)

Existe uma maneira melhor/mais eficiente?

2 respostas

Voted

Dogbert · Answer 1 · 2024-08-09T15:09:29+08:00

Best Answer

Dogbert

2024-08-09T15:09:29+08:002024-08-09T15:09:29+08:00

Você pode usar o fill_valueargumento de palavra-chave em pct_change.

A pct_changedocumentação diz:

Argumentos adicionais de palavras-chave são passados para DataFrame.shiftou Series.shift.

e Series.shiftaceita um fill_valueargumento para preencher as linhas ausentes.

import pandas as pd

df = pd.DataFrame({"a": [20, 30, 2, 5, 10]})

df["pct_change"] = df["a"].pct_change(fill_value=40).mul(100)

print(df)

Saída:

    a  pct_change
0  20  -50.000000
1  30   50.000000
2   2  -93.333333
3   5  150.000000
4  10  100.000000

4

ParSa MnS · Answer 2 · 2024-08-09T15:04:02+08:00

ParSa MnS

2024-08-09T15:04:02+08:002024-08-09T15:04:02+08:00

Um método que achei realmente útil é usar applyo método junto com lambda. Ele verifica o índice e executa de acordo. Você também pode fazer isso no DataFrame sem problemas.

Então seria algo assim:

import pandas as pd 

df = pd.DataFrame({
    'a': [20, 30, 2, 5, 10]
})

# Define a function to calculate the percentage change
def percent_change(row):
    # Check if it's the first row
    if row.name == 0:
        # Compare with 40 for the first value
        return ((row - 40) / 40) * 100
    else:
        # For subsequent rows, use the standard pct_change() method
        return row.pct_change() * 100

# Apply the function to the 'a' column
df['pct_change'] = df['a'].apply(percent_change)

print(df)

Preste atenção if row.name == 0:também ao que o define para compará-lo com o primeiro valor.

1

É possível não obter NaN para o primeiro valor de pct_change()?

Então seria algo assim:

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

É possível não obter NaN para o primeiro valor de pct_change()?

2 respostas

Então seria algo assim:

relate perguntas