abhav luthra Asked: 2019-04-24 07:22:24 +0800 CST2019-04-24 07:22:24 +0800 CST 2019-04-24 07:22:24 +0800 CST 删除 html 标签和这些标签之间的数据的正则表达式 772 我已经尝试了很多东西,但由于正则表达式的贪婪性质,我仍然无法弄清楚 abc = 'dfbafbd<a href="#Free_Calling_Best_Apps">Free Calling Best Apps</a>sbrwsggsfzbs<a></a>abc 我的正则表达式 abc1 = re.sub(r'<a.+\/a>',' ',abc) 输出 = 'dfbafbd abc' 所需输出 = 'dfbafbd sbrwsggsfzbs abc' regex python3 1 个回答 Voted Best Answer Toto 2019-04-24T07:42:30+08:002019-04-24T07:42:30+08:00 让你的正则表达式不贪婪: abc1 = re.sub(r'<a.+?/a>',' ',abc) # here __^ 但是用正则表达式解析 HTML 是一项艰巨的工作。 HTML 和正则表达式不是好朋友。使用解析器,它更简单、更快并且更易于维护。
让你的正则表达式不贪婪:
但是用正则表达式解析 HTML 是一项艰巨的工作。
HTML 和正则表达式不是好朋友。使用解析器,它更简单、更快并且更易于维护。