Tenho uma coleção de dados de usuários da seguinte forma:
usuário | começar | fim |
---|---|---|
John Doe | 2025-03-21 11:30:35 | 2025-03-21 13:05:26 |
... | ... | ... |
Jane Doe | 2023-12-31 01:02:03 | 2024-01-02 03:04:05 |
Cada usuário tem uma data e hora de início e término de alguma atividade. Gostaria de colocar esse intervalo temporal no índice para poder consultar rapidamente o dataframe e ver quais usuários estavam ativos durante um determinado intervalo de data/hora, assim:
df['2024-01-01:2024-01-31']
O Pandas possui Period
objetos, mas estes parecem suportar apenas um ano, dia ou minuto específico, e não uma data e hora de início e término arbitrárias. O Pandas também possui MultiIndex
índices, mas estes parecem ser projetados para rótulos categóricos hierárquicos, não para intervalos de tempo. Alguma outra ideia de como representar esse intervalo de tempo em um índice?
Aqui está sua solução:
Saída:
Você também pode criar uma máscara e filtrar as linhas que você precisa como esta