Como divido o loop for em 3 quadros de dados individuais?

Question

crazydragon777

Asked: 2024-08-23 00:33:12 +0800 CST2024-08-23 00:33:12 +0800 CST 2024-08-23 00:33:12 +0800 CST

Existe uma maneira eficiente de incluir todas as colunas não selecionadas restantes em uma seleção python-polars?

772

Estou tentando reordenar as colunas em um dataframe Polars e colocar 5 colunas de 100 primeiro (infelizmente, o documento deve ser legível no Excel). Não consigo encontrar uma maneira fácil de fazer isso.

Idealmente, eu gostaria de algo simples como

df.select(
    'col2',
    'col1',
    r'^.*$',  # the rest of the columns, but this throws a duplicate column name error
)

Lookahead negativo não é suportado, portanto não é possível criar um regex que exclua minhas colunas selecionadas. Eu poderia fazer duas seleções sobrepostas, eliminar as colunas de uma seleção e depois juntá-las, mas essa não parece ser a maneira pretendida de fazer isso. Todas as outras soluções que encontrei envolvem nomear explicitamente cada coluna, o que estou tentando evitar à medida que as colunas são adicionadas ou mudam de nome com certa frequência.

2 respostas

Voted

jqurious · Answer 1 · 2024-08-23T00:35:03+08:00

Envolve nomear as colunas duas vezes, mas você pode excluí-las:

pl.exclude()

df.select('col2', 'col1', pl.exclude('col1', 'col2'))

Exemplo:

df = pl.DataFrame(schema=list('abcdefg'))

df.select('g', 'e', pl.exclude('e', 'g'))

shape: (0, 7)
┌──────┬──────┬──────┬──────┬──────┬──────┬──────┐
│ g    ┆ e    ┆ a    ┆ b    ┆ c    ┆ d    ┆ f    │
│ ---  ┆ ---  ┆ ---  ┆ ---  ┆ ---  ┆ ---  ┆ ---  │
│ null ┆ null ┆ null ┆ null ┆ null ┆ null ┆ null │
╞══════╪══════╪══════╪══════╪══════╪══════╪══════╡
└──────┴──────┴──────┴──────┴──────┴──────┴──────┘

Há uma solicitação de recurso para permitirdf.select('col2', 'col1', ...)

https://github.com/pola-rs/polars/issues/12067

Dean MacGregor · Answer 2 · 2024-08-23T01:02:44+08:00

Você pode combinar pl.excludecom o operador morsa.

Suponha que você tenha algo como

df=pl.DataFrame(
    [
        pl.Series('c', [1, 2, 3], dtype=pl.Int64),
        pl.Series('b', [2, 3, 4], dtype=pl.Int64),
        pl.Series('fcvem', [4, 5, 6], dtype=pl.Int64),
        pl.Series('msoy', [4, 5, 6], dtype=pl.Int64),
        pl.Series('smrn', [4, 5, 6], dtype=pl.Int64),
        pl.Series('z', [4, 5, 6], dtype=pl.Int64),
        pl.Series('wxous', [4, 5, 6], dtype=pl.Int64),
        pl.Series('uusn', [4, 5, 6], dtype=pl.Int64),
        pl.Series('ydj', [4, 5, 6], dtype=pl.Int64),
        pl.Series('squr', [4, 5, 6], dtype=pl.Int64),
        pl.Series('yyx', [4, 5, 6], dtype=pl.Int64),
        pl.Series('nl', [4, 5, 6], dtype=pl.Int64),
        pl.Series('a', [0, 1, 2], dtype=pl.Int64),
    ]
)

e você deseja que as 3 primeiras colunas sejam 'a', 'b', 'c'. Você pode fazer:

df.select(*(start_cols:=['a','b','c']), pl.exclude(start_cols))

Isso cria uma lista chamada start_colsque contém 'a','b','c'. O asterisco desembrulha a lista e então pl.excludeusa o conteúdo de start_colspara dizer aos polares para retornar tudo, exceto start_cols.

Se preferir, você pode fazer esta sintaxe:

df.select((start_cols:=['a','b','c'])+ [pl.exclude(start_cols)])

Existe uma maneira eficiente de incluir todas as colunas não selecionadas restantes em uma seleção python-polars?

Exemplo:

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Por que esse código Java simples e pequeno roda 30x mais rápido em todas as JVMs Graal, mas não em nenhuma JVM Oracle?

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Quando devo usar um std::inplace_vector em vez de um std::vector?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

Existe uma maneira eficiente de incluir todas as colunas não selecionadas restantes em uma seleção python-polars?

2 respostas

Exemplo:

relate perguntas