Quero encontrar um regex ou perl oneliner para detectar duas linhas consecutivas que tenham as mesmas palavras na mesma ordem, mas os espaços iniciais, finais e a quantidade de espaços entre as palavras podem variar de uma linha para a outra. O regex deve excluir as linhas que não correspondem.
Eu uso essa regex para detectar linhas consecutivas idênticas.
^\s*(.*\S)(\s\n*\1)+$
Ela falha quando a quantidade de espaço em branco varia de uma linha para outra.
Eu tenho este texto de exemplo
Mary has a little lamb. The live near the mountain.
Mary has a little lamb. The live near the mountain.
vrfgrgru hfiughf iujhfuihgifughuir nuhuvhfug
Mary has a little lamb. The live near the mountain.
Mary has a little lamb. The live near the mountain.
Mary has a little lamb. The live near the mountain.
Mary has a little lamb. The live near the mountain.
fghurhg bojghirejyohi ndhguhyituhgi
gbshbsiughsf bnighriugh hurhgiurhgriu
Elvis was the greatest singer of all time. He has 18 number one in billboard charts.
Elvis was the greatest singer of all time. He has 18 number one in billboard charts.
sgfuhgdugusd vfjsng orjgoergo ejfio dsmnjn
fbdhsbfgdbhhbfhdsfdf
Mary has a little lamb. The live near the mountain.
Mary has a little lamb. The live near the mountain.
gsete gerttrb oijoijoijoijoijoiojo gogoerijoi
jhoiyrei erogjrijgtrio noifdo mkooi
This has been the coldest winter in the last 20 years.
This has been the coldest winter in the last 20 years.
Independentemente do número de espaços nas linhas, a regex deve exibir as linhas consecutivas que contêm as mesmas informações.
Não há três em uma fileira e não há linhas vazias entre as linhas correspondentes.