Eu tenho dois vetores com strings da seguinte maneira:
x <- c("Zimbabwe (Rhodesia)", "India", "Equatorial Guinea", "United States")
y <- c("Zimbabwe", "India", "Guinea")
Quero obter um vetor que contenha aquelas strings que não correspondem exatamente entre x
e y
. O resultado idealmente seria:
"Zimbabwe (Rhodesia)" "Zimbabwe" "Equatorial Guinea" "Guinea" "United States"
Estou tentando consolidar alguns conceitos aqui - sei que posso usar grep(paste(y, collapse = "|")
para obter uma correspondência parcial para um vetor e âncoras para encontrar uma correspondência exata para uma determinada string. Mas como integrá-los?
Como eu faço isso?
Uma opção seria usar operações de conjunto, ou seja, usar a diferença de conjunto da união e da interseção:
Outra possibilidade, que pode ser um pouco mais intuitiva:
Criado em 20/12/2023 com reprex v2.0.2
Em ordem "decrescente alfabeticamente":
você pode concatenar e descartar os duplicados: