Eu tenho um arquivo enorme (1400 páginas, uma única string de texto) que estou tentando tornar legível no Excel. O arquivo contém valores separados por vírgula, e colocar isso no Excel normalmente não é um problema, exceto que as informações devem estar em várias linhas no Excel e não todas na mesma linha do documento.
O que deveria ser uma linha de informação é separado por 115 vírgulas.
Meu plano era usar o Notepad ++ para contar 115 vírgulas, fazer uma nova linha, contar 115 vírgulas, fazer uma nova linha até percorrer todo o documento. Após esta operação deve ser fácil estruturá-lo no Excel. No entanto, tenho lutado para reunir as expressões necessárias.
Se houver outra maneira mais sensata de fazer isso, sou todo ouvidos, pode ser que esteja no caminho errado. Estou tentando usar a ferramenta localizar/substituir (CTRL+H) no Notepad++.
Eu tenho tentado usar "encontrar o que":
(,*?)\,{115}
O problema é que isso está procurando por 115 vírgulas consecutivas, mas preciso contar as 115 primeiras vírgulas em uma linha de texto e, em seguida, fazer uma paráfrase/nova linha e fazê-lo novamente. Qualquer ajuda / dicas seria muito apreciada. Eu tenho gasto muito tempo tentando encontrar as respostas.
(?:.+?,){115}\K
\n
ou\r\n
. matches newline
Explicação:
Substituição:
Isso manterá a vírgula no final de cada linha. Se você quiser removê-lo, use:
coloque seu texto na variável inputstring e execute em python. Altere a variável numberofcolums com base em quantas colunas você deseja. Se você não tem o python instalado, pode usar uma ferramenta online como esta
Ok, o melhor a se fazer é fazer um script que resolva esse problema,
Se entendi corretamente o seu problema, você precisa dividir uma string.
Eu faria isso com a
split()
função pythons.depois, você pode fazer o Python escrever um arquivo e criar uma nova linha para cada parte de sua matriz que obteve da
split()
função.(não sou o melhor explicando, se precisar de ajuda posso fazer o roteiro para você, pergunte não deve demorar muito, é só pedir)