如何将 for 循环拆分为 3 个单独的数据框？

Question

ViSa

Asked: 2024-08-28 01:38:17 +0800 CST2024-08-28 01:38:17 +0800 CST 2024-08-28 01:38:17 +0800 CST

无法在 python 中将文本转换为数据框

772

我正在尝试使用 Python 将转换text为dataframe。

样本文本： 'This is \nsample text\n\nName|age\n--|--\n1.abc|45\n2.xyz|34'

最终期望输出：

我为实现上述输出所遵循的步骤如下：

将文本分成多行并将其分配给变量：我曾尝试使用它print()来处理该文本formatted_text = print('This is \nsample text\n\nName|age\n--|--\n1.abc|45\n2.xyz|34')，但无法将其分配为print()返回NoneType，因此这里出现错误。

此步骤后的期望输出：

This is 
sample text

Name|age
--|--
1.abc|45
2.xyz|34

使用上面line break text存储在variable一个 CSV 文件中的内容，用分隔符读取，|创建一个数据框：我一直在考虑将其处理为pd.read_csv(formatted_text,sep='|', skipinitialspace=True)

此步骤后的期望输出：

我之前尝试在 SO 帖子中解释这个问题，但我想我解释得不太好，所以帖子被关闭了。我希望这次我能解释我的问题。这可能是一个愚蠢的任务，但我已经坚持了很长时间，如果能得到任何帮助，我将不胜感激。

3 个回答

Voted

mozway · Answer 1 · 2024-08-28T01:49:36+08:00

mozway

2024-08-28T01:49:36+08:002024-08-28T01:49:36+08:00

您可以先拆分行，然后拆分列，然后将其提供给DataFrame构造函数，也可以选择fillna使用''：

s = 'This is \nsample text\n\nName|age\n--|--\n1.abc|45\n2.xyz|34'
df = pd.DataFrame([x.split('|') for x in s.split('\n')]).fillna('')

或者，使用Series和str.split：

df = pd.Series(s.splitlines()).str.split('|', expand=True).fillna('')

输出：

             0    1
0     This is      
1  sample text     
2                  
3         Name  age
4           --   --
5        1.abc   45
6        2.xyz   34

2

PaulS · Answer 2 · 2024-08-28T01:47:15+08:00

Best Answer

PaulS

2024-08-28T01:47:15+08:002024-08-28T01:47:15+08:00

可能的解决方案：

text = 'This is \nsample text\n\nName|age\n--|--\n1.abc|45\n2.xyz|34'

pd.read_csv(StringIO(text), lineterminator='\n', engine='c', header=None)

输出：

             0
0     This is 
1  sample text
2     Name|age
3        --|--
4     1.abc|45
5     2.xyz|34

要拆分列，我们可以使用str.splitafter read_csv：

(pd.read_csv(StringIO(text), lineterminator='\n', engine='c', header=None)[0]
 .str.split('|', expand=True))

输出：

             0     1
0     This is   None
1  sample text  None
2         Name   age
3           --    --
4        1.abc    45
5        2.xyz    34

1

M-Sarabi · Answer 3 · 2024-08-28T01:50:33+08:00

M-Sarabi

2024-08-28T01:50:33+08:002024-08-28T01:50:33+08:00

我们可以将每一行拆分|成一个列表，并从中创建一个数据框：

import pandas as pd

text = 'This is \nsample text\n\nName|age\n--|--\n1.abc|45\n2.xyz|34'

array = [line.split('|') if '|' in line else [line, ''] for line in text.splitlines()]

df = pd.DataFrame(array)
print(df)

输出：

             0    1
0     This is      
1  sample text     
2                  
3         Name  age
4           --   --
5        1.abc   45
6        2.xyz   34

1

无法在 python 中将文本转换为数据框

`(表达式，左值) = 右值` 在 C 或 C++ 中是有效的赋值吗？为什么有些编译器会接受/拒绝它？

何时应使用 std::inplace_vector 而不是 std::vector？

在 C++ 中，一个不执行任何操作的空程序需要 204KB 的堆，但在 C 中则不需要

如果 T 既不可构造、不可复制、也不可移动，那么我可以拥有 std::optional<T> 吗？

为什么我可以定义一个 constinit 的 std::string 实例？如果对象需要动态初始化，constinit 不是被禁止的吗？

如何分配以后放置的新“如同新”

PowerBI 目前与 BigQuery 不兼容：Simba 驱动程序与 Windows 更新有关

将 NULL 和 nullptr 传递给模板参数有什么区别？

AdMob：MobileAds.initialize() - 对于某些设备，“java.lang.Integer 无法转换为 java.lang.String”

我正在尝试仅使用海龟随机和数学模块来制作吃豆人游戏

无法在 python 中将文本转换为数据框

3 个回答

相关问题