我tr
用于解析文本并执行多项任务,例如将所有单词小写、删除标点符号和多个空格。最终结果应该是只有字母数字字符的干净的小写文本,除非在特定情况下:
word$digit
如
house$999
除了这种情况,公式非常简单。例如,对于我删除标点符号的情况,我会用空格替换它
tr '[:punct:]' ' '
这只是使用管道来获得所需输出的其余部分的问题。例如,
tr '[:upper:]' '[:lower:]' < $1 | tr '[:punct:]' ' ' | ... > $2
但是,我在试图弄清楚如何定义异常以$
保持字母数字字符和一组数字之间的符号时遇到了一些麻烦,而其他实例和所有其他标点符号都被删除了。
根据@xenoid 的回答,以下代码适用于我
结果是: