Databricks Autoloader/writeStream: Como tentar novamente?

Question

Rana

Asked: 2023-10-03 19:13:26 +0800 CST2023-10-03 19:13:26 +0800 CST 2023-10-03 19:13:26 +0800 CST

Como mudar o valor da coluna para a esquerda no Spark SQL?

772

Eu tenho a seguinte tabela

Equipe	Equipe_Categoria	Pontuação1	Pontuação2	Pontuação3	Pontuação4	Pontuação 5	Pontuação 6	Pontuação7	Pontuação8
A41	Bicicletas	40			91			51
A57	Bicicletas					60			47

Quero deslocar os valores para a esquerda se uma pontuação anterior for NULLou ""
A saída necessária for:

Equipe	Equipe_Categoria	Pontuação1	Pontuação2	Pontuação3	Pontuação4	Pontuação 5	Pontuação 6	Pontuação7	Pontuação8
A41	Bicicletas	40	91	51
A57	Bicicletas	60	47

Eu tentei usar coalescelike

spark.sql("""SELECT Team, Team_Category, COALESCE(NULLIF(Score1,""),NULLIF(Score2,""),...NULLIF(Score8,"")) AS Score1, COALESCE(NULLIF(Score2,""),NULLIF(Score3,"")...NULLIF(Score8,"")) AS Score2,...""")

mas isso resolveria apenas metade do problema. Mesmo que os valores sejam agora movidos para a esquerda, os valores à direita ainda estarão lá.

Como isso pode ser feito usando spark sql?

Observação: uma equipe pode ter diversas linhas, mas elas são independentes umas das outras.

1 respostas

Voted

Shubham Sharma · Answer 1 · 2023-10-03T19:47:32+08:00

Best Answer

Shubham Sharma

2023-10-03T19:47:32+08:002023-10-03T19:47:32+08:00

Crie uma matriz a partir das Scorecolunas e use-a array_compactpara remover nulos, finalmente, com base na nova posição de cada elemento na matriz, reatribua as colunas de pontuação de volta ao dataframe

cols = [c for c in df.columns if c.startswith('Score')]

arr = F.array_compact(F.array(*cols))
df1 = df.select('Team', 'Team_Category', *[arr[i].alias(c) for i, c in enumerate(cols)])

+----+-------------+------+------+------+------+------+------+------+------+
|Team|Team_Category|Score1|Score2|Score3|Score4|Score5|Score6|Score7|Score8|
+----+-------------+------+------+------+------+------+------+------+------+
| A41|        Bikes|    40|    91|    51|  null|  null|  null|  null|  null|
| A57|     Bicycles|    60|    47|  null|  null|  null|  null|  null|  null|
+----+-------------+------+------+------+------+------+------+------+------+

Nota: array_compactsó está disponível a partir do spark 3.4.0 se você estiver usando uma versão antiga, então podemos usar filter:arr = F.filter(F.array(*cols), lambda x: x.isNotNull())

2

Como mudar o valor da coluna para a esquerda no Spark SQL?

destaque o código em HTML usando <font color="#xxx">

Por que a resolução de sobrecarga prefere std::nullptr_t a uma classe ao passar {}?

Você pode usar uma lista de inicialização com chaves como argumento de modelo (padrão)?

Por que as compreensões de lista criam uma função internamente?

Estou tentando fazer o jogo pacman usando apenas o módulo Turtle Random e Math

java.lang.NoSuchMethodError: 'void org.openqa.selenium.remote.http.ClientConfig.<init>(java.net.URI, java.time.Duration, java.time.Duratio

Por que 'char -> int' é promoção, mas 'char -> short' é conversão (mas não promoção)?

Por que o construtor de uma variável global não é chamado em uma biblioteca?

Comportamento inconsistente de std::common_reference_with em tuplas. Qual é correto?

Somente operações bit a bit para std::byte em C++ 17?

Como mudar o valor da coluna para a esquerda no Spark SQL?

1 respostas

relate perguntas