我想将电子表格(ods 或 xlsx)拆分为多个 csv 文件,一个用于电子表格中的每个工作表。
我想在不启动图形应用程序的情况下做到这一点,最好是在一个班轮中。
有任何想法吗?
尽管链接的副本在其中一个答案中提供了可能的解决方案(不是在接受的答案中)并且很有帮助。该解决方案不适用于我要求的 ODS 文件,我认为这个问题有很大不同。
我想将电子表格(ods 或 xlsx)拆分为多个 csv 文件,一个用于电子表格中的每个工作表。
我想在不启动图形应用程序的情况下做到这一点,最好是在一个班轮中。
有任何想法吗?
尽管链接的副本在其中一个答案中提供了可能的解决方案(不是在接受的答案中)并且很有帮助。该解决方案不适用于我要求的 ODS 文件,我认为这个问题有很大不同。
好吧,
libreoffice
可以从脚本转换文档(即在无头模式下无需打开 GUI)。要将任何电子表格格式转换为 CSV,其最简单的形式如下所示但是,这只是获取文档的第一页并将其转换,而忽略所有其他表单。遗憾的是,它还缺少选择要转换的工作表的选项。
所以我们需要一个外部工具,比如xlsx2csv。它是一个开源 Python(2 和 3)脚本,可将 XLSX 文件转换为 CSV,并支持将所有工作表提取到单独的文件中。
Ubuntu 已经安装了 Python,但也许你需要先安装
pip
它的包管理器。我要使用 Python 3,但您也可以更改以下所有命令以使用 2 运行它:然后你可以安装
xlsx2csv
到pip3
你用户的包目录中,使用之后,可执行脚本可以在
~/.local/bin/xlsx2csv
.现在,如果您还没有 XLSX 格式的文件,让我们将 ODS 电子表格转换为
libreoffice
:然后我们
xlsx2csv
用来提取所有工作表。它将创建一个文件夹OUTPUTFOLDER
并将所有提取的内容SHEETNAME.csv
放在那里:使用
xls2csv
(转换.XLS)catdoc
包安装工具sudo apt install catdoc
:这
xls2csv -b ' ' EXCEL.xls
将读取 MS-Excel 文件并将其内容作为逗号分隔的数据放在标准输出上,并且-b STRING
我们告诉工作表用什么字符(或字符串;我们在这里定义了一个实际的换行符)来分隔。使用
xlsx2csv
(转换.XLSX);安装sudo apt install xlsx2csv
:该
-s 0
装置打印所有工作表。看一眼
\谢谢{布鲁尼}
-O 'separator= format= ...'
用于控制csv格式细节-S
为每个工作表创建不同的输出文件