sed 模式匹配日期

Question

Ben Fourie

Asked: 2020-09-14 07:58:01 +0800 CST2020-09-14 07:58:01 +0800 CST 2020-09-14 07:58:01 +0800 CST

无法替换流编辑中的特定字符

sed 是一个非常棒的工具，但由于某种原因，我这次不能让它做我需要的事情。我正在处理 csv 中的大量数据集。一些文件用 ;（分号）分隔，另一些文件用 ,（逗号）分隔

这应该有效吗？

find . -type f -name '*.txt' -print0 | xargs -0 sed -i'' -e '/s/;/,'

它没。所以我虽然，o，让我们逃脱他们。

find . -type f -name '*.txt' -print0 | xargs -0 sed -i'' -e '/s/\;/\,'

那里也没有运气。

甚至在所有场景中都尝试过'vs'。如果不编写python脚本并逐行处理，我怎么能做到这一点。有500M行，所以真的不想走RBAR方式。

Ben Fourie · Answer 1 · 2020-09-17T09:49:44+08:00

Best Answer

Ben Fourie

sed 似乎无法做到这一点，并且在开始或独奏时不支持特殊字符。替代方案如下。

cat source.txt | tr ';' ',' > newsource.txt

这是闪电般的快速。速度没有问题。处理大数据时，您可能只需要一些额外的空间。我的好主意是在处理大数据时将文件拆分为 2gb 部分。