AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 76969939
Accepted
craigm
craigm
Asked: 2023-08-24 21:45:00 +0800 CST2023-08-24 21:45:00 +0800 CST 2023-08-24 21:45:00 +0800 CST

Crie uma nova coluna baseada parcialmente em outros nomes de colunas

  • 772

Sou novo em Polars e Python em geral. Tenho um problema um tanto incomum para o qual preciso de ajuda. Eu tenho um dataframe com mais de 50 colunas que são 0/1. Preciso criar uma nova coluna que contenha uma lista separada por vírgulas de cada coluna que contenha 1, mas usando parte do nome da coluna. Se hccx = 1, anexe x a uma coluna de string. Um exemplo simplificado:

df=pl.DataFrame(
    {'id':[1,2,3], 'hcc1':[0,1,1],'hcc2':[0,0,1],'hcc5':[0,1,1],'hcc8':[1,0,0]}
)
shape: (3, 5)
┌─────┬──────┬──────┬──────┬──────┐
│ id  ┆ hcc1 ┆ hcc2 ┆ hcc5 ┆ hcc8 │
│ --- ┆ ---  ┆ ---  ┆ ---  ┆ ---  │
│ i64 ┆ i64  ┆ i64  ┆ i64  ┆ i64  │
╞═════╪══════╪══════╪══════╪══════╡
│ 1   ┆ 0    ┆ 0    ┆ 0    ┆ 1    │
│ 2   ┆ 1    ┆ 0    ┆ 1    ┆ 0    │
│ 3   ┆ 1    ┆ 1    ┆ 1    ┆ 0    │
└─────┴──────┴──────┴──────┴──────┘

Quero criar uma nova coluna (tipo string), hccall, semelhante a esta:

eu ia ligar
1 8
2 1,5
3 1,2,5

Imagino que algum tipo de compreensão de lista percorrendo colunas que começam com 'hcc' funcionaria, mas estou meio preso. Posso criar um loop, mas não sei como anexar à coluna dentro do loop. Alguma ideia inteligente?

python-polars
  • 2 2 respostas
  • 46 Views

2 respostas

  • Voted
  1. Best Answer
    Mondo30003
    2023-08-24T22:12:06+08:002023-08-24T22:12:06+08:00

    Acho que a opção mais fácil é primeiro derreter seu dataframe para que você tenha uma linha por ID por coluna em seu dataframe. Você pode filtrar as linhas iguais a 1. Você pode agregar a última letra das linhas originais em uma lista. Com list.join você pode combinar a lista em uma string separada por vírgulas

    (
        df.melt(id_vars="id")
        .filter(pl.col("value") == 1)
        .groupby("id")
        .agg(pl.col("variable").str.slice(3))
        .with_columns(pl.col("variable").list.join(","))
    )
    
    shape: (3, 2)
    ┌─────┬──────────┐
    │ id  ┆ variable │
    │ --- ┆ ---      │
    │ i64 ┆ str      │
    ╞═════╪══════════╡
    │ 2   ┆ 1,5      │
    │ 3   ┆ 1,2,5    │
    │ 1   ┆ 8        │
    └─────┴──────────┘
    
    • 3
  2. Dean MacGregor
    2023-08-25T02:56:14+08:002023-08-25T02:56:14+08:00

    Aqui está outra maneira de fazer isso sem derreter ou agrupar

    (
        df
        .with_columns(
            hccall=pl.concat_list(
                        pl.when(pl.col(x)==1)
                        .then(pl.lit(x.replace('hcc',', ')))
                        .otherwise(pl.lit('')) for x in df.columns if x[:3]=='hcc')
                    .list.join("")
                    .str.replace("^, ", "")
                        )
    )
    

    Não consigo descobrir como eliminar elegantemente os nulos, concat_listentão fica complicado str.replaceno final. Acho que há uma maneira sucinta de fazer isso, mas isso me escapa no momento.

    • 2

relate perguntas

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve