Tenho um arquivo antigo de e-mails e quero combiná-los em um grande arquivo de texto feliz, isso pode ser feito? Percebo que quando visualizo um e-mail e recorto e colo o conteúdo, obtenho exatamente o que desejo - toda a formatação desapareceu e tenho um arquivo de texto legível, todos os metadados desapareceram junto com todo o material HTML. Eu olhei para 'html2text', mas ele deixa todas as tags, enquanto eu pensei que iria removê-las. Eu poderia visualizar, recortar e colar, mas isso levaria muito tempo.
Aliás, eu uso o Thunderbird, se isso for importante. Não acho que possa fazer isso dentro do programa, espero que seja algum utilitário de linha de comando.
Uma solução com script usando:
formail
(vem comprocmail
) para converter os e-mails para o formato de caixa de correiomutt
para decodificar o material de mímicaelinks
para converter HTML em texto para aqueles e-mails que não têmtext/plain
alternativazsh
para orquestrar o lote e encontrar oseml
arquivos no diretório de trabalho atual e abaixo.O texto é anexado ao
out.mbox
arquivo. Esse arquivo ainda pode ser aberto como uma pasta de correio pela maioria dos agentes de usuário de correio (não conheço o Thunderbird) e deve ser um texto simples com a maioria dos cabeçalhos eliminados.Se você não se importa com o arquivo no formato de caixa de correio, pode substituir
formail>>out.mbox
porcat>>out.txt
, e se não se importa com cabeçalhos, porsed '1,/^$/d'>>out.txt
.Verifique a
elinks
página de manual para saber como ajustar o HTML para renderização de texto, se necessário.O Thunderbird tem um anexo que faz isso: ImportExportTools . Primeiro você o usa para importar os arquivos .eml soltos e depois os exporta para um único arquivo de texto. Funciona bem.