Paul

Asked: 2024-08-30 01:37:16 +0800 CST2024-08-30 01:37:16 +0800 CST 2024-08-30 01:37:16 +0800 CST

alternativa pandas 2.x para `mangle_dup_cols` com `read_excel()`

Tenho um arquivo Excel que se parece com este:

Na célula A1, o usuário pode selecionar uma opção e a seleção B1:E3 é usada como uma tabela de consulta para preencher as células A2:A3. Quero ler a tabela de consulta para python usando pandas.read_excel(). No entanto, quando uso

df = pd.read_excel("workbook.xlsx", sheet_name="Sheet1", header=0, usecols="B:E", numrows=2)

um nome de coluna é registrado duas vezes e o segundo é aumentado com um sufixo ".1". Desde então pandas 2.x, a configuração mangle_dup_cols=Falsenão é mais reconhecida. Infelizmente, não posso alterar o formato da planilha do Excel e preferiria não fazer downgrade de pandas.

Como solução alternativa, atualmente leio a tabela para um DataFramewith header=Nonee então atribuo o índice de linha 0 como os nomes das colunas e descarto a primeira linha. Esta não é uma solução muito elegante e eu esperava que houvesse uma maneira melhor de fazer isso.

1 respostas

Voted

Best Answer

juanpa.arrivillaga
2024-08-30T05:03:25+08:002024-08-30T05:03:25+08:00
Não consigo encontrar uma substituição direta nos documentos, mas acho que uma solução alternativa mais simples seria não usar o header=0, em vez disso, usar uma regex para limpar os nomes das colunas:

df = pd.read_csv() df.columns = df.columns.str.replace(r"(.+)\.\d+$", r"\1", regex=True)
1

alternativa pandas 2.x para `mangle_dup_cols` com `read_excel()`

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

alternativa pandas 2.x para `mangle_dup_cols` com `read_excel()`

1 respostas

relate perguntas