Jim Macaulay提出的问题 -coding

Jim Macaulay

Asked: 2025-04-11 13:36:29 +0800 CST

从 PySpark 中具有不区分大小写的属性的数据框中提取特定的字典值

5

我有以下数据框

dataDictionary = [('value1', [{'key': 'Fruit', 'value': 'Apple'}, {'key': 'Colour', 'value': 'White'}]), 
                 ('value2', [{'key': 'Fruit', 'value': 'Mango'}, {'key': 'Bird', 'value': 'Eagle'}, {'key': 'Colour', 'value': 'Black'}]),
('value3', [{'key': 'Fruit', 'value': 'Apple'}, {'key': 'colour', 'value': 'Blue'}])] 

df = spark.createDataFrame(data=dataDictionary)
df.printSchema()
df.show(truncate=False)

+------+------------------------------------------------------------------------------------------------+
|_1    |_2                                                                                              |
+------+------------------------------------------------------------------------------------------------+
|value1|[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]                               |
|value2|[{value -> Mango, key -> Fruit}, {value -> Eagle, key -> Bird}, {value -> Black, key -> Colour}]|
|value3|[{value -> Apple, key -> Fruit}, {value -> Blue, key -> colour}]                               
+------+------------------------------------------------------------------------------------------------+

我只想提取键 -> 颜色的值，并使用下面的方法获取精确的结果

from pyspark.sql import SparkSession, functions as F

...
df = df.select('_1', F.filter('_2', lambda x: x['key'] == 'Colour')[0]['value'])

结果，

_1       _2
value1   White
value2   Black
value3

但是对于value3，没有结果，因为key是小写的colour；对于value1和vaue2，key是驼峰式命名Colour，这与lambda函数兼容F.filter('_2', lambda x: x['key'] == 'Colour')[0]['value']。我尝试使用大写字母来处理这三种情况，但不起作用。

F.filter('_2', lambda x: x['key'].upper() == 'COLOUR')[0]['value']

任何建议都将不胜感激。

Jim Macaulay

Asked: 2025-03-05 16:30:55 +0800 CST

不是有效的 OPENSSH 私钥文件 - Paramiko [重复]

5

我正在尝试使用 paramiko 连接到主机。我能够使用私钥通过 winscp 成功连接到主机，但脚本失败并出现以下错误

引发 SSHException（“不是有效的 {} 私钥文件”.format(tag)）paramiko.ssh_exception.SSHException：不是有效的 OPENSSH 私钥文件

import paramiko
ssh = paramiko.SSHClient()

ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())

ssh.connect('hostname.com', username='user', key_filename='private.ppk')

stdin, stdout, stderr = ssh.exec_command('ls')
print(stdout.readlines())
ssh.close()

Any suggestion would be appretiated,

Jim Macaulay

Asked: 2025-02-14 21:19:30 +0800 CST

从 PySpark 中的数据框中提取特定的字典值

5

我有以下数据框

dataDictionary = [('value1', [{'key': 'Fruit', 'value': 'Apple'}, {'key': 'Colour', 'value': 'White'}]), 
                 ('value2', [{'key': 'Fruit', 'value': 'Mango'}, {'key': 'Bird', 'value': 'Eagle'}, {'key': 'Colour', 'value': 'Black'}])] 

df = spark.createDataFrame(data=dataDictionary)
df.printSchema()
df.show(truncate=False)

+------+------------------------------------------------------------------------------------------------+
|_1    |_2                                                                                              |
+------+------------------------------------------------------------------------------------------------+
|value1|[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]                               |
|value2|[{value -> Mango, key -> Fruit}, {value -> Eagle, key -> Bird}, {value -> Black, key -> Colour}]|
+------+------------------------------------------------------------------------------------------------+

我只想提取key -> Colour的值。结果应该是，

White
Black

我尝试了使用regexp_extract_all以及使用instr的子字符串的多个选项，结果始终为空值。任何建议都将不胜感激。

result = spark.sql("""select
                    regexp_extract('_2', '''key': 'Colour' + '(\\w+)') as value
                    from table 
                    """)

Jim Macaulay

Asked: 2025-02-14 17:30:37 +0800 CST

根据位置反转子字符串的值

6

我有数据

col1
[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]
[{value -> Mango, key -> Fruit}, {value -> Black, key -> Colour}]

我想提取一个值

value -> White
value -> Black

select col1, instr('key -> Colour' in col1), substr(col1, instr('key -> Colour')
from 
(SELECT '[{value -> Apple, key -> Fruit}, {value -> White, key -> Colour}]' as col1 from dual
union all
SELECT '[{value -> Mango, key -> Fruit}, {value -> Black, key -> Colour}]' as col1 from dual
) tbl;

我尝试使用位置和子字符串，但无法获得，如有任何建议我将不胜感激。

基本上需要搜索一个值键->颜色并通过反向子字符串提取值直到{这将让我得到值->白色和值->黑色

Jim Macaulay

Asked: 2024-08-27 02:34:38 +0800 CST

在 pandas DataFrame 中转置一列

5

我有一个下面的数据框，我正在尝试根据 Place 列转置数据。对于 Place 列中的每个值列表，我需要生成每一行。

Language   Capital   Place
Tamil      Chennai   ['Chennai', 'Vellore', 'Trichy', 'Madurai']
Kerala     Kochi     ['Kochi', 'Trivandrum']

预期结果

Language     Capital     Place
Tamil        Chennai     Chennai
Tamil        Chennai     Vellore
Tamil        Chennai     Trichy
Tamil        Chennai     Madurai 
Kerala       Kochi       Kochi
Kerala       Kochi       Trivandrum

我尝试了很多方法，使用 pandas 转置，无法得到预期的结果。我还检索并将 Place 列转换为一系列数据框，仍然无法得到结果。

任何建议都将不胜感激

Jim Macaulay

Asked: 2024-08-09 19:25:00 +0800 CST

Python 中的嵌套列表 - 在 Python 中转置嵌套列表

1

我有下面嵌套的列表，

list = [Language:'Tamil'
        Capital: 'Chennai' 
        Place: 'Chennai', 'Vellore', 'Trichy', 'Madurai' 
]

我希望将其转置为，

Language     Capital     Place
Tamil        Chennai     Chennai
Tamil        Chennai     Vellore
Tamil        Chennai     Trichy
Tamil        Chennai     Madurai

尝试转换为熊猫数据框，

df = pd.DataFrame(list)

结果是

Language    Capital       Place  
Tamil       Chennai       ['Chennai', 'Vellore', 'Trichy', 'Madurai']

如果有建议，请将每个值列表转置到新行中

Jim Macaulay

Asked: 2024-01-25 16:42:57 +0800 CST

CSS Flex 容器 - 调整内容

4

我有下面的 html 代码，我在证明内容时面临。

<style>
flex-container {
 display: flex;
}
</style>
<div class = "content" style="border: 2px solid;">

<flex-container>
  <flex-item class="flex1">
     <div>
    <table>
     <tr><th>1</th><td>Left line1</td></tr>
    <tr><th>2</th><td>Left line2</td></tr>
   <tr><th>3</th><td>Left line3</td></tr>
   <tr><th>4</th><td>Left line4</td></tr>
    </table>
    </div>
</flex-item>

<flex-item class="flex2">
    <div>
     <table>
     <tr><th>1</th><td>Right line1</td></tr>
    <tr><th>2</th><td>Right line2</td></tr>
   <tr><th>3</th><td>Right line3</td></tr>
   <tr><th>4</th><td>Right line4</td></tr>
    </table>
    </div>
</flex-item>

<flex-container>
<table style = "border: 1px solid black;">
    <th>Column1</th>
    <th>Column2</th>
    <th>Column3</th>
    <th>Column4</th>
    <th>Column5</th>
    
     <tr>
        <td>Data1 for Column1</td>
        <td>Data1 for Column2</td>
        <td>Data1 for Column3</td>
        <td>Data1 for Column4</td>
        <td>Data1 for Column5</td>
     </tr>
<tr>
        <td>Data2 for Column1</td>
        <td>Data2 for Column2</td>
        <td>Data2 for Column3</td>
        <td>Data2 for Column4</td>
        <td>Data2 for Column5</td>
     </tr>
    
</table>
</flex-container>

</div>

目前的结果是，

预期结果，

正在尝试使用对齐内容方法，无法使其对齐。任何建议将不胜感激

.flex1 {
    justify-content: flex-start;
}
.flex2 {
    justify-content: flex-end;
}

从 PySpark 中具有不区分大小写的属性的数据框中提取特定的字典值

不是有效的 OPENSSH 私钥文件 - Paramiko [重复]

从 PySpark 中的数据框中提取特定的字典值

根据位置反转子字符串的值

在 pandas DataFrame 中转置一列

Python 中的嵌套列表 - 在 Python 中转置嵌套列表

CSS Flex 容器 - 调整内容

重新格式化数字，在固定位置插入分隔符

为什么 C++20 概念会导致循环约束错误，而老式的 SFINAE 不会？

VScode 自动卸载扩展的问题（Material 主题）

Vue 3：创建时出错“预期标识符但发现‘导入’”[重复]

具有指定基础类型但没有枚举器的“枚举类”的用途是什么？

如何修复未手动导入的模块的 MODULE_NOT_FOUND 错误？

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

Jim Macaulay's questions