Usei um gerador de texto de imagem para extrair informações de uma imagem de um glossário semelhante a este:
word1 :meaning1
word2 :meaning2
word3 :meaning3
word4 :meaning4
O que resultou em um arquivo de texto parecido com este:
word1
word2
word3
word4
:meaning1
:meaning2
:meaning3
:meaning4
Sinto que esta é uma ocorrência comum ao copiar textos semelhantes a glossários de documentos PDF também. Existe alguma maneira prática de recriar a disposição do texto original? De preferência crie colunas onde as palavras e os significados estejam interligados, melhor ainda se for sem células.
Acho que estou procurando uma maneira de colar/anexar o conteúdo de várias linhas ao final de várias linhas existentes.
A única solução que consigo pensar é colar tudo no gravador do LibreOffice e escolher colunas, mas isso apenas recriaria o documento de origem em termos de apresentação e não há uso real disso.
A questão é:
Como alterar o texto extraído em duas colunas para que pareça que estava na imagem, ou seja:
word1 :meaning1
word2 :meaning2
word3 :meaning3
word4 :meaning4
Eu preferiria ferramentas GUI, mas soluções CLI não avançadas também são apreciadas.
Soluções CLI não avançadas com o
pr
comando:ou com o
rs
comando:Solução CLI meio avançada com
awk
:Com base em padrões RegEx, ou seja, dois pontos iniciais
^:
ou sem dois pontos iniciais^[^:]
( supondo que seja consistente ), assim:Ou com base nos números das linhas, ou seja, dividindo o arquivo na primeira metade e na última metade, assim:
Use um editor de texto avançado ou IDE como Geany .
Por exemplo, com Geany você pode editar o texto mantendo-o verticalmente
Ctrl
enquanto o seleciona com o mouse.Uma vez selecionado "verticalmente", basta colá-lo no final da primeira linha e pressionar tab quantas vezes quiser, dependendo do espaço necessário entre as colunas.