我有一段字符串"Desirable: < 200 Borderline HIgh: 200 - 240 High: > 240"
,我只想提取唯一的数字或十进制值。
为了提取Number,Decimal,-
我使用了这个正则表达式代码r'[^0-9.-]+'
但它没有返回唯一值:
import re
check = "Desirable: < 200 Borderline HIgh: 200 - 240 High: > 240"
re.sub(r'[^0-9.-]+', '',check)
输出:
200200-240240
期望输出:
200-240
Numbers, Decimals,-
请注意:从字符串中提取非常重要。
您可以使用以下方法提取所有数字、十进制数:
然后你可以使用获得唯一的一个
set()
,最后使用它们加入"-".join
您想要的代码:
此代码的挑战之一是
set()
不保留数字的顺序。如果顺序很重要,您可以改用numpy.unique()
: