AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77708538
Accepted
cicciodevoto
cicciodevoto
Asked: 2023-12-24 02:00:47 +0800 CST2023-12-24 02:00:47 +0800 CST 2023-12-24 02:00:47 +0800 CST

Agrupar dataframe do pandas por hora e dia

  • 772

Eu tenho um dataframe cobrindo um mês de texto com carimbo de data/hora, mais ou menos assim:

timestamp              text
2023-01-01 00:00:00    ABC
2023-01-01 00:00:01    DEF
2023-01-01 00:00:01    GHI
...

Gostaria de contar a quantidade de texto para cada hora e para cada dia da semana, para ter no final 168 (24*7) números.

Por exemplo se no dia 01-01-2023, que é domingo, entre as 10h e as 11h há 10 textos, no domingo seguinte (08-01-2023) sempre entre as 10h e as 11h há 15 textos, e assim sucessivamente. No final o número de todos os textos para todos os domingos entre as 10h e as 11h é: 10+15+...

Quero fazer isso para cada hora e para cada dia da semana.

Se o dataframe original for df, comecei a agrupar por horas:

hours_df = df.groupby(pd.Grouper(key="timestamp", freq="h")).size().reset_index(name="count_hours")

então adicionei o day_of_week:

hours_df["day_of_week"] = hours_df["timestamp"].dt.dayofweek

mas se eu agrupar agora desta day_of_weekforma:

day_df = hours_df.groupby("day_of_week").size().reset_index(name="count_days")

Vou perder a informação das horas e o resultado é um dataframe com 7 entradas, ou seja, os dias.

Como posso combinar o agrupamento das horas com o dos dias?

python-3.x
  • 1 1 respostas
  • 45 Views

1 respostas

  • Voted
  1. Best Answer
    mozway
    2023-12-24T02:23:26+08:002023-12-24T02:23:26+08:00

    Você pode agrupar diretamente por dia da semana e hora:

    df.groupby([df['timestamp'].dt.dayofweek.rename('dow'),
                df['timestamp'].dt.hour.rename('hour')
               ]).size()
    

    Ou usando concate value_counts:

    pd.concat([df['timestamp'].dt.dayofweek.rename('dow'),
               df['timestamp'].dt.hour.rename('hour')], axis=1
             ).value_counts()
    

    Saída:

    dow  hour
    6    0       3
    dtype: int64
    

    Nota. para uma entrada longa o suficiente, você deve ter todas as combinações; caso contrário, sempre poderá reindex.


    Alternativamente, para uma saída retangular, use crosstab:

    pd.crosstab(df['timestamp'].dt.dayofweek.rename('dow'),
                df['timestamp'].dt.hour.rename('hour'))
    
    # or for all values:
    out = (pd.crosstab(df['timestamp'].dt.dayofweek.rename('dow'),
                       df['timestamp'].dt.hour.rename('hour'))
             .reindex(index=range(1, 7), columns=range(24), fill_value=0)
          )
    

    Saída:

    hour  0   1   2   3   4   5   6   7   8   9   10  11  12  13  14  15  16  17  18  19  20  21  22  23
    dow                                                                                                 
    1      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    2      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    3      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    4      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    5      0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    6      3   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
    
    • 2

relate perguntas

  • Preenchendo valores ausentes no dataframe do Pandas usando outro dataframe

  • Comparando e classificando valores em duas colunas de um DataFrame e classificando na mesma linha em python

  • Esta versão do ChromeDriver suporta apenas 114

  • Por que lista vazia para funcionar?

  • A configuração do Python-Django Multi-Index of Pandas DataFrame não agrupa/mescla o último índice

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve