sed 是一个非常棒的工具,但由于某种原因,我这次不能让它做我需要的事情。我正在处理 csv 中的大量数据集。一些文件用 ;(分号)分隔,另一些文件用 ,(逗号)分隔
这应该有效吗?
find . -type f -name '*.txt' -print0 | xargs -0 sed -i'' -e '/s/;/,'
它没。所以我虽然,o,让我们逃脱他们。
find . -type f -name '*.txt' -print0 | xargs -0 sed -i'' -e '/s/\;/\,'
那里也没有运气。
甚至在所有场景中都尝试过'vs'。如果不编写python脚本并逐行处理,我怎么能做到这一点。有500M行,所以真的不想走RBAR方式。
sed 似乎无法做到这一点,并且在开始或独奏时不支持特殊字符。替代方案如下。
这是闪电般的快速。速度没有问题。处理大数据时,您可能只需要一些额外的空间。我的好主意是在处理大数据时将文件拆分为 2gb 部分。