Um de nossos parceiros de negócios está nos enviando rotineiramente arquivos CSV malformados. O arquivo conterá 50.000 linhas e várias centenas delas têm muitos delimitadores de coluna.
Existe uma maneira no Notepad ++ de encontrar todas as linhas em que a contagem de um delimitador específico é maior ou menor que um número especificado, por exemplocount( | ) <> 16
^[^|]*(?!(?:\|[^|\r\n]*){16}$)(?:\|[^|\r\n]*)*$
. matches newline
Explicação:
Captura de tela:
Para simplificar, testo o número de delimitador <> 3