我有地址字符串(由于初始编程不佳)允许输入过多的自由文本。在清理这个继承的烂摊子的过程中,我注意到在地址字段的末尾,经常有(而且经常不是)我想去掉的逗号。
问题是(再次,经常!)那些输入数据的人(由线路支付......)输入的字符串如下:
`address_1_string , `
那是 address_1_string 后跟两个空格,然后是我要删除的逗号,然后是另外两个空格。address_string_1
空格的数量(在逗号之前或之后)是任意的,通常从 0 到 5。由于本身可能具有内部(有效)逗号这一事实,问题变得更加复杂。
所以,我正在寻找的是一个正则表达式,它会走到行尾,删除任何尾随空格、第一个逗号,然后是更多空格,直到有效的 [a-zA-Z0-9] ([:alphanum: ]?) 字符被找到。
我有正则表达式的概念,但这超出了我的工资等级。这是我在 Stackexchange 上的第一篇文章,所以如果我在错误的地方,请重定向我。TIA。
将删除行尾的所有空格和逗号字符。
为了在适当的位置编辑文件,一些
sed
实现有一个受's选项-i
启发的选项:perl
-i