我很难弄清楚如何删除重复但不完整的文本字符串。使用perl
、awk
或均未成功sed
。
我需要转换:
a b
a b c
a b c d
a b c d e
a b c d x
a b c d z
进入
a b
a b c d e
a b c d x
a b c d z
每个不完整的模式都必须被删除,但(1) 不是每个最终完整且唯一的字符串,以及(2) 不是长度为两个单词的字符串。
我能找到的所有答案都涉及删除相同的重复项。
我很难弄清楚如何删除重复但不完整的文本字符串。使用perl
、awk
或均未成功sed
。
我需要转换:
a b
a b c
a b c d
a b c d e
a b c d x
a b c d z
进入
a b
a b c d e
a b c d x
a b c d z
每个不完整的模式都必须被删除,但(1) 不是每个最终完整且唯一的字符串,以及(2) 不是长度为两个单词的字符串。
我能找到的所有答案都涉及删除相同的重复项。