Como divido o loop for em 3 quadros de dados individuais?

Question

Jim

Asked: 2025-04-24 08:35:10 +0800 CST2025-04-24 08:35:10 +0800 CST 2025-04-24 08:35:10 +0800 CST

Converter dicionário Python aninhado em um dataframe Pandas

772

Tenho dados meteorológicos em um dicionário Python que estou tentando converter para um arquivo DF do Pandas. (De lá, vou carregá-los no SQLServer, mas essa parte já está funcionando)

my_dict = {
'data.outdoor.temperature': {'unit': '℃', 'list': 
{'datetime.datetime(2025, 4, 23, 10, 0): 22.3', 
'datetime.datetime(2025, 4, 23, 14, 0): 21.3', 
'datetime.datetime(2025, 4, 23, 18, 0): 18.2', }}, 
'data.indoor.temperature': {'unit': '℃', 'list': 
{'datetime.datetime(2025, 4, 23, 10, 0): 23.2', 
'datetime.datetime(2025, 4, 23, 14, 0): 23.5', 
'datetime.datetime(2025, 4, 23, 18, 0): 22.9'}}}

O resultado que estou buscando é:

outdoor.temperature | 2025_04_20 | 14 | 28.1 | ℃  
outdoor.temperature | 2025_04_20 | 18 | 23.8 | ℃  
.....etc  
indoor.temperature | 2025_04_20 | 14 | 23.5 | ℃  
indoor.temperature | 2025_04_20 | 18 | 23.8 | ℃  
.....etc

A lista de datetime& temperaturespode ter centenas de registros

Eu tentei from_dict, concat/ unstack, normalize, flattene combinações de todos eles, mas estou derrotado

1 respostas

Voted

ifly6 · Answer 1 · 2025-04-24T09:07:53+08:00

Alterei seu construtor de dicionário para construir objetos de data e hora em vez de ter um conjunto de strings com formato datetime.datetime(#, #, #, #, #): ##.#, como interpretei como sendo no formato de dicionário:

my_dict1 = {'data.outdoor.temperature': {'unit': '℃', 'list': {datetime.datetime(2025, 4, 23, 10, 0): '22.3', datetime.datetime(2025, 4, 23, 14, 0): '21.3', datetime.datetime(2025, 4, 23, 18, 0): '18.2', }}, 'data.indoor.temperature': {'unit': '℃', 'list': {datetime.datetime(2025, 4, 23, 10, 0): '23.2', datetime.datetime(2025, 4, 23, 14, 0): '23.5', datetime.datetime(2025, 4, 23, 18, 0): '22.9'}}}

Depois, construí uma representação de dicionário, anexei a unitcoluna como um índice, transformei a coluna da lista em uma Série (descompactando-a), antes de empilhar tudo e redefinir o índice.

pd.DataFrame.from_dict(my_dict1, orient='index').set_index('unit', append=True)['list'].apply(pd.Series).stack().reset_index()

Isso resultou no seguinte:

                    level_0 unit             level_2     0
0  data.outdoor.temperature    ℃ 2025-04-23 10:00:00  22.3
1  data.outdoor.temperature    ℃ 2025-04-23 14:00:00  21.3
2  data.outdoor.temperature    ℃ 2025-04-23 18:00:00  18.2
3   data.indoor.temperature    ℃ 2025-04-23 10:00:00  23.2
4   data.indoor.temperature    ℃ 2025-04-23 14:00:00  23.5
5   data.indoor.temperature    ℃ 2025-04-23 18:00:00  22.9

(Pode parecer desalinhado porque o caractere ℃ é mais largo que o caractere monoespaçado padrão.) Você pode então renomear colunas atribuindo a df.columns. Eu escolhi df.columns = ['where', 'unit', 'date', 'temp'].

Você pode limpar wherede forma bem simples: df['where'] = df['where'].str.replace(r'^data\.', '', regex=True).

O construtor também é fornecido tempcomo uma string, eu faria df['temp'] = df['temp'].pipe(pd.to_numeric)para torná-lo numérico.

Converter dicionário Python aninhado em um dataframe Pandas

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Converter dicionário Python aninhado em um dataframe Pandas

1 respostas

relate perguntas