Jim Macaulay提出的问题 -coding

Jim Macaulay

Asked: 2025-04-11 13:36:29 +0800 CST

Extrair valor de dicionário específico de dataframe no PySpark com atributos que não diferenciam maiúsculas de minúsculas

5

Eu tenho um dataframe abaixo

dataDictionary = [('value1', [{'key': 'Fruit', 'value': 'Apple'}, {'key': 'Colour', 'value': 'White'}]), 
                 ('value2', [{'key': 'Fruit', 'value': 'Mango'}, {'key': 'Bird', 'value': 'Eagle'}, {'key': 'Colour', 'value': 'Black'}]),
('value3', [{'key': 'Fruit', 'value': 'Apple'}, {'key': 'colour', 'value': 'Blue'}])] 

df = spark.createDataFrame(data=dataDictionary)
df.printSchema()
df.show(truncate=False)

+------+------------------------------------------------------------------------------------------------+
|_1    |_2                                                                                              |
+------+------------------------------------------------------------------------------------------------+
|value1|[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]                               |
|value2|[{value -> Mango, key -> Fruit}, {value -> Eagle, key -> Bird}, {value -> Black, key -> Colour}]|
|value3|[{value -> Apple, key -> Fruit}, {value -> Blue, key -> colour}]                               
+------+------------------------------------------------------------------------------------------------+

Eu queria extrair apenas os valores de key -> Colour e estou usando abaixo para obter o resultado exato

from pyspark.sql import SparkSession, functions as F

...
df = df.select('_1', F.filter('_2', lambda x: x['key'] == 'Colour')[0]['value'])

resultado,

_1       _2
value1   White
value2   Black
value3

Mas para valor3, não há resultado porque a chave está em minúsculas colour, enquanto para valor1 e valor2, a chave está em camel case, Colouro que funciona com a função lambda F.filter('_2', lambda x: x['key'] == 'Colour')[0]['value']. Tentei usar upper para lidar com os três cenários, mas não funcionou.

F.filter('_2', lambda x: x['key'].upper() == 'COLOUR')[0]['value']

Qualquer sugestão será apreciada.

Jim Macaulay

Asked: 2025-03-05 16:30:55 +0800 CST

Não é um arquivo de chave privada OPENSSH válido - Paramiko [duplicado]

5

Estou tentando conectar a um host usando paramiko. Consigo conectar com sucesso ao host por meio do winscp usando a chave privada, mas o script falha com o erro abaixo

raise SSHException("não é um arquivo de chave privada {} válido".format(tag)) paramiko.ssh_exception.SSHException: não é um arquivo de chave privada OPENSSH válido

import paramiko
ssh = paramiko.SSHClient()

ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())

ssh.connect('hostname.com', username='user', key_filename='private.ppk')

stdin, stdout, stderr = ssh.exec_command('ls')
print(stdout.readlines())
ssh.close()

Any suggestion would be appretiated,

Jim Macaulay

Asked: 2025-02-14 21:19:30 +0800 CST

Extrair valor de dicionário específico do dataframe no PySpark

5

Eu tenho um dataframe abaixo

dataDictionary = [('value1', [{'key': 'Fruit', 'value': 'Apple'}, {'key': 'Colour', 'value': 'White'}]), 
                 ('value2', [{'key': 'Fruit', 'value': 'Mango'}, {'key': 'Bird', 'value': 'Eagle'}, {'key': 'Colour', 'value': 'Black'}])] 

df = spark.createDataFrame(data=dataDictionary)
df.printSchema()
df.show(truncate=False)

+------+------------------------------------------------------------------------------------------------+
|_1    |_2                                                                                              |
+------+------------------------------------------------------------------------------------------------+
|value1|[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]                               |
|value2|[{value -> Mango, key -> Fruit}, {value -> Eagle, key -> Bird}, {value -> Black, key -> Colour}]|
+------+------------------------------------------------------------------------------------------------+

Eu queria extrair apenas os valores de key -> Colour . O resultado deveria ser,

White
Black

Eu tentei várias opções usando regexp_extract_all , bem como substring com instr , o resultado é sempre um valor vazio. Qualquer sugestão seria apreciada.

result = spark.sql("""select
                    regexp_extract('_2', '''key': 'Colour' + '(\\w+)') as value
                    from table 
                    """)

Jim Macaulay

Asked: 2025-02-14 17:30:37 +0800 CST

Substring reversa do valor com a posição

6

Eu tenho dados

col1
[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]
[{value -> Mango, key -> Fruit}, {value -> Black, key -> Colour}]

e eu queria extrair um valor

value -> White
value -> Black

select col1, instr('key -> Colour' in col1), substr(col1, instr('key -> Colour')
from 
(SELECT '[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]' as col1 from dual
union all
SELECT '[{value -> Mango, key -> Fruit}, {value -> Black, key -> Colour}]' as col1 from dual
) tbl;

Tentei usar posição e substring, mas não consegui. Qualquer sugestão seria apreciada.

Basicamente, preciso procurar uma chave de valor -> Cor e extrair o valor por substring reversa até { que me dará o valor valor -> Branco e valor -> Preto

Jim Macaulay

Asked: 2024-08-27 02:34:38 +0800 CST

Transpor uma coluna no pandas DataFrame

5

Tenho um dataframe abaixo, estou tentando transpor os dados com base na coluna Local. Para cada lista de valores na coluna Local, preciso gerar cada linha.

Language   Capital   Place
Tamil      Chennai   ['Chennai', 'Vellore', 'Trichy', 'Madurai']
Kerala     Kochi     ['Kochi', 'Trivandrum']

Resultado esperado

Language     Capital     Place
Tamil        Chennai     Chennai
Tamil        Chennai     Vellore
Tamil        Chennai     Trichy
Tamil        Chennai     Madurai 
Kerala       Kochi       Kochi
Kerala       Kochi       Trivandrum

Eu tentei de várias maneiras, usando pandas transpose, sem conseguir o resultado esperado. Também recuperei e converti a coluna Place em uma série de dataframe, ainda não consegui obter o resultado.

Qualquer sugestão será apreciada

Jim Macaulay

Asked: 2024-08-09 19:25:00 +0800 CST

Lista aninhada em Python - Transpor lista aninhada em python

1

Eu tenho uma lista aninhada abaixo,

list = [Language:'Tamil'
        Capital: 'Chennai' 
        Place: 'Chennai', 'Vellore', 'Trichy', 'Madurai' 
]

Estou esperando transpor isso como,

Language     Capital     Place
Tamil        Chennai     Chennai
Tamil        Chennai     Vellore
Tamil        Chennai     Trichy
Tamil        Chennai     Madurai

Tentei converter para o dataframe do pandas,

df = pd.DataFrame(list)

O resultado é

Language    Capital       Place  
Tamil       Chennai       ['Chennai', 'Vellore', 'Trichy', 'Madurai']

Agradecemos sugestões para transpor cada lista de valores em uma nova linha para o local

Jim Macaulay

Asked: 2024-01-25 16:42:57 +0800 CST

CSS Flex Container - Justificar conteúdo

4

Tenho abaixo o código html, estou enfrentando enquanto justifico o conteúdo.

<style>
flex-container {
 display: flex;
}
</style>
<div class = "content" style="border: 2px solid;">

<flex-container>
  <flex-item class="flex1">
     <div>
    <table>
     <tr><th>1</th><td>Left line1</td></tr>
    <tr><th>2</th><td>Left line2</td></tr>
   <tr><th>3</th><td>Left line3</td></tr>
   <tr><th>4</th><td>Left line4</td></tr>
    </table>
    </div>
</flex-item>

<flex-item class="flex2">
    <div>
     <table>
     <tr><th>1</th><td>Right line1</td></tr>
    <tr><th>2</th><td>Right line2</td></tr>
   <tr><th>3</th><td>Right line3</td></tr>
   <tr><th>4</th><td>Right line4</td></tr>
    </table>
    </div>
</flex-item>

<flex-container>
<table style = "border: 1px solid black;">
    <th>Column1</th>
    <th>Column2</th>
    <th>Column3</th>
    <th>Column4</th>
    <th>Column5</th>
    
     <tr>
        <td>Data1 for Column1</td>
        <td>Data1 for Column2</td>
        <td>Data1 for Column3</td>
        <td>Data1 for Column4</td>
        <td>Data1 for Column5</td>
     </tr>
<tr>
        <td>Data2 for Column1</td>
        <td>Data2 for Column2</td>
        <td>Data2 for Column3</td>
        <td>Data2 for Column4</td>
        <td>Data2 for Column5</td>
     </tr>
    
</table>
</flex-container>

</div>

O resultado atual é,

Resultado esperado,

Estava tentando usar o método justificar conteúdo, mas não consegui alinhá-lo. Qualquer sugestão seria apreciada

.flex1 {
    justify-content: flex-start;
}
.flex2 {
    justify-content: flex-end;
}

Extrair valor de dicionário específico de dataframe no PySpark com atributos que não diferenciam maiúsculas de minúsculas

Não é um arquivo de chave privada OPENSSH válido - Paramiko [duplicado]

Extrair valor de dicionário específico do dataframe no PySpark

Substring reversa do valor com a posição

Transpor uma coluna no pandas DataFrame

Lista aninhada em Python - Transpor lista aninhada em python

CSS Flex Container - Justificar conteúdo

Reformatar números, inserindo separadores em posições fixas

Por que os conceitos do C++20 causam erros de restrição cíclica, enquanto o SFINAE antigo não?

Problema com extensão desinstalada automaticamente do VScode (tema Material)

Vue 3: Erro na criação "Identificador esperado, mas encontrado 'import'" [duplicado]

Qual é o propósito de `enum class` com um tipo subjacente especificado, mas sem enumeradores?

Como faço para corrigir um erro MODULE_NOT_FOUND para um módulo que não importei manualmente?

`(expression, lvalue) = rvalue` é uma atribuição válida em C ou C++? Por que alguns compiladores aceitam/rejeitam isso?

Um programa vazio que não faz nada em C++ precisa de um heap de 204 KB, mas não em C

PowerBI atualmente quebrado com BigQuery: problema de driver Simba com atualização do Windows

AdMob: MobileAds.initialize() - "java.lang.Integer não pode ser convertido em java.lang.String" para alguns dispositivos

Jim Macaulay's questions