只处理过非常简单的文本到 csv 数据格式。我正在为一个映射项目使用一个包含 14900 行的文本文件。我尝试使用制表符等进行分隔,但无法在第一列中获取单个属性 ID 的单个文本字符串。每个属性 ID 应该有一个文本字符串属性,但每个属性 ID 有多个分隔行(根据屏幕截图)。我希望为每个属性 ID 创建一个文本字符串提供一些指导。该 txt 文档称为解释性说明,如果有帮助,可以在此处的 ASRIS CSIRO 网站上找到。 https://www.asris.csiro.au/downloads/Atlas/soilAtlas2M.zip。或查看我的意思的屏幕截图。
非常感谢
目标数据需要看起来像这样 描述可能是一个 200 长字符的文本字符串,没有回车或换行 这不是很漂亮,但要将它导入我的地图我不能为一个描述提供多个换行
联系人ID | 描述 |
---|---|
第一的 | 排 |
第二 | 排 |
这可以使用 Windows Excel 2010+ 和 Excel 365(Windows 或 Mac)中提供的 Power Query 来完成
使用 Power Query
使用第一行中的代码作为如何将文本文件读入 Power Query 的示例
`Data => Get&Transform => 从文本/CSV
当 PQ 编辑器打开时:
Home => Advanced Editor
记下第 2 行中的路径
粘贴下面的 M 代码代替您看到的内容
将第 2 行中的路径更改回最初生成的路径。
阅读评论并探索
Applied Steps
以了解算法一些行的输出
cat
tr
awk
只是为了提供替代解决方案,这里是如何使用带有and的 Linux shell 提取此文本sed
:准备索引文件:
从文本文件中删除所有新行:
用 index+newline 搜索并替换所有索引:
此文本操作期望索引字符组仅出现在行首(而不是文本内)才能正常工作。