AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 79365034
Accepted
Samuel Allain
Samuel Allain
Asked: 2025-01-17 22:20:56 +0800 CST2025-01-17 22:20:56 +0800 CST 2025-01-17 22:20:56 +0800 CST

Como reciclar uma lista para criar uma nova coluna?

  • 772

Como posso criar a typecoluna reciclando uma lista de dois elementos ["lat","lon"]?

endereço coordenar tipo
"lugar 1" 48.943837 tarde
"lugar 1" 2.387917 muito tempo
"lugar 2" 37.843837 tarde
"lugar 2" 6.387917 muito tempo

Como seria feito automaticamente em R comd$type <- c("lat","lon")

Reprex:

d0 = pl.DataFrame(
    {
        "adresse": ["place 1", "place 2"],
        "coord": [[48.943837, 2.387917], [37.843837, 6.387917]],
    }
)
d1 = d0.explode("coord")

O que eu tentei:

d1 = d1.with_columns(type=pl.Series(["1","2"]))
# ShapeError: unable to add a column of length 2 to a DataFrame of height 4

d1 = d1.join(pl.DataFrame({"id":["1", "2"]}), how="cross")
# logically, 8 rows instead of 4
python
  • 3 3 respostas
  • 77 Views

3 respostas

  • Voted
  1. Best Answer
    roman
    2025-01-17T22:50:44+08:002025-01-17T22:50:44+08:00
    • pl.int_range()e pl.len()para criar um "número de linha".
    • pl.Expr.over()para fazer isso dentro adresseda coluna.
    (
        d0.explode("coord")
        .with_columns(
            type = pl.int_range(pl.len()).over("adresse")
        )
    )
    
    shape: (4, 3)
    ┌─────────┬───────────┬──────┐
    │ adresse ┆ coord     ┆ type │
    │ ---     ┆ ---       ┆ ---  │
    │ str     ┆ f64       ┆ i64  │
    ╞═════════╪═══════════╪══════╡
    │ place 1 ┆ 48.943837 ┆ 0    │
    │ place 1 ┆ 2.387917  ┆ 1    │
    │ place 2 ┆ 37.843837 ┆ 0    │
    │ place 2 ┆ 6.387917  ┆ 1    │
    └─────────┴───────────┴──────┘
    

    Ou se você precisar polars.datatypes.Enum():

    dtype = pl.Enum(["lat", "lon"])
    
    (
        d0.explode("coord")
        .with_columns(
            type = pl.int_range(pl.len()).over("adresse").cast(dtype)
        )
    )
    
    shape: (4, 3)
    ┌─────────┬───────────┬──────┐
    │ adresse ┆ coord     ┆ type │
    │ ---     ┆ ---       ┆ ---  │
    │ str     ┆ f64       ┆ enum │
    ╞═════════╪═══════════╪══════╡
    │ place 1 ┆ 48.943837 ┆ lat  │
    │ place 1 ┆ 2.387917  ┆ lon  │
    │ place 2 ┆ 37.843837 ┆ lat  │
    │ place 2 ┆ 6.387917  ┆ lon  │
    └─────────┴───────────┴──────┘
    

    Como alternativa, você pode primeiro criar listas adicionais pl.int_ranges()e depois explodir ambas as listas juntas, para não precisar pl.Expr.over()da função window.

    (
        d0
        .with_columns(type = pl.int_ranges(2))
        # or using pl.col.coord.list.len()
        # .with_columns(type = pl.int_ranges(pl.col.coord.list.len()))
        .explode("coord", "type")
        .with_columns(type = pl.col.type.cast(dtype))
    )
    
    • 3
  2. Hericks
    2025-01-18T02:29:15+08:002025-01-18T02:29:15+08:00

    A transmissão em estilo R geral pode ser implementada de forma similar à solução proposta por @roman. Para evitar um OutOfBoundsError, quando há menos categorias do que linhas (ou seja, transmissão verdadeirapl.Expr.mod ), pode ser usado.

    dtype = pl.Enum(["lat", "lon"])
    d0.with_columns(
        pl.int_range(pl.len()).mod(dtype.categories.len()).cast(dtype)
    )
    
    shape: (4, 3)
    ┌─────────┬───────────┬─────────┐
    │ adresse ┆ coord     ┆ literal │
    │ ---     ┆ ---       ┆ ---     │
    │ str     ┆ f64       ┆ enum    │
    ╞═════════╪═══════════╪═════════╡
    │ place 1 ┆ 48.943837 ┆ lat     │
    │ place 1 ┆ 2.387917  ┆ lon     │
    │ place 2 ┆ 37.843837 ┆ lat     │
    │ place 2 ┆ 6.387917  ┆ lon     │
    └─────────┴───────────┴─────────┘
    
    • 2
  3. Henry Harbeck
    2025-01-19T15:02:22+08:002025-01-19T15:02:22+08:00

    Aqui estão duas opções sem Enums

    Um com d0e o outro assumindo que você já crioud1

    # Option 1
    # create a literal column ["lat", "lon"] and explode it at the same time as coord
    d0.with_columns(type=pl.lit(["lat", "lon"])).explode("coord", "type")
    
    d1 = d0.explode("coord")
    
    # Option 2 - assuming d1 has been created and you want to go from there
    # lat for even rows, lon for odd
    d1.with_columns(
        type=pl.when(pl.int_range(pl.len()) % 2 == 0)
        .then(pl.lit("lat"))
        .otherwise(pl.lit("lon"))
    )
    
    # Same output for both
    
    shape: (4, 3)
    ┌─────────┬───────────┬──────┐
    │ adresse ┆ coord     ┆ type │
    │ ---     ┆ ---       ┆ ---  │
    │ str     ┆ f64       ┆ str  │
    ╞═════════╪═══════════╪══════╡
    │ place 1 ┆ 48.943837 ┆ lat  │
    │ place 1 ┆ 2.387917  ┆ lon  │
    │ place 2 ┆ 37.843837 ┆ lat  │
    │ place 2 ┆ 6.387917  ┆ lon  │
    └─────────┴───────────┴──────┘
    
    • 1

relate perguntas

  • Como divido o loop for em 3 quadros de dados individuais?

  • Como verificar se todas as colunas flutuantes em um Pandas DataFrame são aproximadamente iguais ou próximas

  • Como funciona o "load_dataset", já que não está detectando arquivos de exemplo?

  • Por que a comparação de string pandas.eval() retorna False

  • Python tkinter/ ttkboostrap dateentry não funciona quando no estado somente leitura

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Reformatar números, inserindo separadores em posições fixas

    • 6 respostas
  • Marko Smith

    Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

    • 2 respostas
  • Marko Smith

    Problema com extensão desinstalada automaticamente do VScode (tema Material)

    • 2 respostas
  • Marko Smith

    Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

    • 1 respostas
  • Marko Smith

    Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

    • 1 respostas
  • Marko Smith

    Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

    • 6 respostas
  • Marko Smith

    `(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

    • 3 respostas
  • Marko Smith

    Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

    • 1 respostas
  • Marko Smith

    PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

    • 2 respostas
  • Marko Smith

    AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

    • 1 respostas
  • Martin Hope
    Fantastic Mr Fox Somente o tipo copiável não é aceito na implementação std::vector do MSVC 2025-04-23 06:40:49 +0800 CST
  • Martin Hope
    Howard Hinnant Encontre o próximo dia da semana usando o cronógrafo 2025-04-21 08:30:25 +0800 CST
  • Martin Hope
    Fedor O inicializador de membro do construtor pode incluir a inicialização de outro membro? 2025-04-15 01:01:44 +0800 CST
  • Martin Hope
    Petr Filipský Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não? 2025-03-23 21:39:40 +0800 CST
  • Martin Hope
    Catskul O C++20 mudou para permitir a conversão de `type(&)[N]` de matriz de limites conhecidos para `type(&)[]` de matriz de limites desconhecidos? 2025-03-04 06:57:53 +0800 CST
  • Martin Hope
    Stefan Pochmann Como/por que {2,3,10} e {x,3,10} com x=2 são ordenados de forma diferente? 2025-01-13 23:24:07 +0800 CST
  • Martin Hope
    Chad Feller O ponto e vírgula agora é opcional em condicionais bash com [[ .. ]] na versão 5.2? 2024-10-21 05:50:33 +0800 CST
  • Martin Hope
    Wrench Por que um traço duplo (--) faz com que esta cláusula MariaDB seja avaliada como verdadeira? 2024-05-05 13:37:20 +0800 CST
  • Martin Hope
    Waket Zheng Por que `dict(id=1, **{'id': 2})` às vezes gera `KeyError: 'id'` em vez de um TypeError? 2024-05-04 14:19:19 +0800 CST
  • Martin Hope
    user924 AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos 2024-03-20 03:12:31 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve