我有两个带有字符串的向量,如下所示:
x <- c("Zimbabwe (Rhodesia)", "India", "Equatorial Guinea", "United States")
y <- c("Zimbabwe", "India", "Guinea")
我想获得一个向量,其中包含和之间不完全匹配的字符串。理想的结果是:x
y
"Zimbabwe (Rhodesia)" "Zimbabwe" "Equatorial Guinea" "Guinea" "United States"
我试图在这里巩固一些概念 - 我知道我可以用来grep(paste(y, collapse = "|")
获取向量的部分匹配,并使用锚点来查找给定字符串的精确匹配。但如何整合它们呢?
我该怎么做呢?
一种选择是使用集合运算,即使用并集和交集的集合差:
另一种可能,可能更直观一些:
创建于 2023 年 12 月 20 日,使用reprex v2.0.2
按“字母递减”顺序:
您可以连接并删除重复的: