我有一个长文本文件,其中包含一些需要清理的垃圾数据。
条目如下。
American Chopper 0x4156003D American Chopper 5849
American Chopper 2: Full Throttle 0x4156004F American Chopper 2 Full Throttle 5849
America's Army: Rise of a Soldier 0x55530043 America’s Army:RoaS 5849
我需要删除以 10 位字母数字字符串开头的所有内容0x
结果应该看起来像
American Chopper 0x4156003D
American Chopper 2: Full Throttle 0x4156004F
America's Army: Rise of a Soldier 0x55530043
您可以通过以下操作找到紧随其后的字符:
(?<=0x[A-Z0-9]{8}).*
。由于您的字符串似乎始终是十六进制数字,因此您可以将
Z
公式上的 替换为F
. 您还可以添加a-f
到小写字母的情况下。公式将是:(?<=0x[A-Fa-f0-9]{8}).*
解释:
?<=0x[A-Z0-9]{8}).*
是一个正面的外观,它将查找/匹配紧跟在 10 个字母数字字符串之后的所有字符。