AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / coding / Perguntas / 77221749
Accepted
Rana
Rana
Asked: 2023-10-03 19:13:26 +0800 CST2023-10-03 19:13:26 +0800 CST 2023-10-03 19:13:26 +0800 CST

Como mudar o valor da coluna para a esquerda no Spark SQL?

  • 772

Eu tenho a seguinte tabela

Equipe Equipe_Categoria Pontuação1 Pontuação2 Pontuação3 Pontuação4 Pontuação 5 Pontuação 6 Pontuação7 Pontuação8
A41 Bicicletas 40 91 51
A57 Bicicletas 60 47

Quero deslocar os valores para a esquerda se uma pontuação anterior for NULLou ""
A saída necessária for:

Equipe Equipe_Categoria Pontuação1 Pontuação2 Pontuação3 Pontuação4 Pontuação 5 Pontuação 6 Pontuação7 Pontuação8
A41 Bicicletas 40 91 51
A57 Bicicletas 60 47

Eu tentei usar coalescelike

spark.sql("""SELECT Team, Team_Category, COALESCE(NULLIF(Score1,""),NULLIF(Score2,""),...NULLIF(Score8,"")) AS Score1, COALESCE(NULLIF(Score2,""),NULLIF(Score3,"")...NULLIF(Score8,"")) AS Score2,...""")

mas isso resolveria apenas metade do problema. Mesmo que os valores sejam agora movidos para a esquerda, os valores à direita ainda estarão lá.

Como isso pode ser feito usando spark sql?

Observação: uma equipe pode ter diversas linhas, mas elas são independentes umas das outras.

pyspark
  • 1 1 respostas
  • 21 Views

1 respostas

  • Voted
  1. Best Answer
    Shubham Sharma
    2023-10-03T19:47:32+08:002023-10-03T19:47:32+08:00

    Crie uma matriz a partir das Scorecolunas e use-a array_compactpara remover nulos, finalmente, com base na nova posição de cada elemento na matriz, reatribua as colunas de pontuação de volta ao dataframe

    cols = [c for c in df.columns if c.startswith('Score')]
    
    arr = F.array_compact(F.array(*cols))
    df1 = df.select('Team', 'Team_Category', *[arr[i].alias(c) for i, c in enumerate(cols)])
    

    +----+-------------+------+------+------+------+------+------+------+------+
    |Team|Team_Category|Score1|Score2|Score3|Score4|Score5|Score6|Score7|Score8|
    +----+-------------+------+------+------+------+------+------+------+------+
    | A41|        Bikes|    40|    91|    51|  null|  null|  null|  null|  null|
    | A57|     Bicycles|    60|    47|  null|  null|  null|  null|  null|  null|
    +----+-------------+------+------+------+------+------+------+------+------+
    

    Nota: array_compactsó está disponível a partir do spark 3.4.0 se você estiver usando uma versão antiga, então podemos usar filter:arr = F.filter(F.array(*cols), lambda x: x.isNotNull())

    • 2

relate perguntas

  • Databricks Autoloader/writeStream: Como tentar novamente?

  • Aplicar operação lógica em um dataframe no pyspark

  • pyspark divide uma coluna do tipo Array de comprimento variável em duas matrizes menores

  • Por que o Spark SQL pula milissegundos quando fazemos a transmissão

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    destaque o código em HTML usando <font color="#xxx">

    • 2 respostas
  • Marko Smith

    Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

    • 1 respostas
  • Marko Smith

    Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

    • 2 respostas
  • Marko Smith

    Por que as compreensões de lista criam uma função internamente?

    • 1 respostas
  • Marko Smith

    Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

    • 1 respostas
  • Marko Smith

    java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

    • 3 respostas
  • Marko Smith

    Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

    • 4 respostas
  • Marko Smith

    Por que o construtor de uma variável global não é chamado em uma biblioteca?

    • 1 respostas
  • Marko Smith

    Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

    • 1 respostas
  • Marko Smith

    Somente operações bit a bit para std::byte em C++ 17?

    • 1 respostas
  • Martin Hope
    fbrereto Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}? 2023-12-21 00:31:04 +0800 CST
  • Martin Hope
    比尔盖子 Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)? 2023-12-17 10:02:06 +0800 CST
  • Martin Hope
    Amir reza Riahi Por que as compreensões de lista criam uma função internamente? 2023-11-16 20:53:19 +0800 CST
  • Martin Hope
    Michael A formato fmt %H:%M:%S sem decimais 2023-11-11 01:13:05 +0800 CST
  • Martin Hope
    God I Hate Python std::views::filter do C++20 não filtrando a visualização corretamente 2023-08-27 18:40:35 +0800 CST
  • Martin Hope
    LiDa Cute Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)? 2023-08-24 20:46:59 +0800 CST
  • Martin Hope
    jabaa Por que o construtor de uma variável global não é chamado em uma biblioteca? 2023-08-18 07:15:20 +0800 CST
  • Martin Hope
    Panagiotis Syskakis Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto? 2023-08-17 21:24:06 +0800 CST
  • Martin Hope
    Alex Guteniev Por que os compiladores perdem a vetorização aqui? 2023-08-17 18:58:07 +0800 CST
  • Martin Hope
    wimalopaan Somente operações bit a bit para std::byte em C++ 17? 2023-08-17 17:13:58 +0800 CST

Hot tag

python javascript c++ c# java typescript sql reactjs html

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve