Como divido o loop for em 3 quadros de dados individuais?

Question

hoa tran

Asked: 2024-11-19 12:13:19 +0800 CST2024-11-19 12:13:19 +0800 CST 2024-11-19 12:13:19 +0800 CST

Como somar dados por data de entrada, mês e mês anterior

772

Estou tentando somar dados da data selecionada, mês da data selecionada e mês anterior da data selecionada, mas não sei como fazer. Abaixo estão meus dados de exemplo e minha Saída esperada:

Dados de amostra:

import pandas as pd
import numpy as np
df = pd.read_excel('https://github.com/hoatranobita/hoatranobita/raw/refs/heads/main/Check%20data%20(1).xlsx', sheet_name='Data')
df

    COA Code    USDConversion Amount    Base Date 2
0   19010000000 26924582.44 2024-10-01
1   19010000000 38835600.44 2024-10-02
2   19010000000 46794586.57 2024-10-03
3   19010000000 57117346.49 2024-10-06
4   19010000000 69256132.98 2024-10-07
... ... ... ...
65  58000000000 38082130.88 2024-11-12
66  58000000000 38140016.13 2024-11-13
67  58000000000 38160089.27 2024-11-14
68  58000000000 38233974.54 2024-11-17
69  58000000000 38323598.99 2024-11-18

Então, se eu selecionar a data de novembro (por exemplo 2024-11-18, quero agrupar por data selecionada, mês da data selecionada e mês anterior da data selecionada).

Saída:

COA Code        2024-11-18  October         November
0   19010000000 42625047.24 1354513618.61   584813860.97
1   58000000000 38323598.99 820927014.08    456265522.64

1 respostas

Voted

mozway · Answer 1 · 2024-11-19T13:52:14+08:00

A generalização exata da sua pergunta não está totalmente clara, mas supondo que você queira agrupar por Código COA, você pode garantir que tudo seja uma data/hora/períodos, então selecionar as linhas apropriadas com indexação booleana e between, finalmente, executar uma groupby.sumdessas linhas e concatpara as linhas de data originais.

Aqui como uma função para maior clareza:

def get_previous(df, date, date_col='Base Date 2'):
    # ensure working with datetime/period objects
    date = pd.Timestamp(date)
    period = date.to_period('M')
    dt = pd.to_datetime(df[date_col])
    p = dt.dt.to_period('M')
    # select rows to keep
    m = p.between(period-1, period, inclusive='both')
    
    # produce rows with original date
    # aggregate previous and current month
    # combine and rename the columns
    return pd.concat([
          df[df[date_col].eq(date)]
           .set_index('COA Code')['USDConversion Amount']
           .rename(date.strftime('%Y-%m-%d')),
        
          df[m].groupby(['COA Code', p])['USDConversion Amount']
           .sum().unstack(date_col)
           .rename(columns=lambda x: x.strftime('%B')) 
          ], axis=1).reset_index()


out = get_previous(df, '2024-11-18')

Saída:

      COA Code   2024-11-18       October      November
0  58000000000  38323598.99  8.209270e+08  4.562655e+08

NB. você pode substituir groupby.sum+ unstackpor pivot_table( df[m].assign(col=p).pivot_table(index='COA Code', columns='col', values='USDConversion Amount', aggfunc='sum')).

Como somar dados por data de entrada, mês e mês anterior

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Como somar dados por data de entrada, mês e mês anterior

1 respostas

relate perguntas