Até agora, meus avós escreveram à mão seus registros financeiros, mas sua caligrafia não cursiva é mais clara e inteligível do que as fotos abaixo. Depois de digitalizar cada página, o Excel 2019 pode converter automaticamente e imediatamente a imagem digitalizada em uma planilha do Excel? Mesmo que o OCR reconheça o texto e os números, organizar cada texto e número consumirá muito tempo.
Aqui está a fonte da segunda foto . Esta postagem do Reddit de 2016 não traz nada de útil.
Eu tenho que concordar com a resposta de music2myear .
Com qualquer computador ao qual você tenha acesso, você não pode fazer nada de útil para ir de registros manuscritos para o Excel.
Existem pelo menos três tarefas difíceis:
Software de consumo e serviços on-line estão disponíveis e fazem um trabalho razoável de conversão de texto impresso por máquina que está em formato de tabela limpa em um arquivo de planilha. Mas mesmo o melhor pode estar longe de ser perfeito. Essa é apenas a tarefa de atribuir texto à célula certa com base em sua posição.
Quando você olha para essas imagens, seu cérebro é muito bom em separar o que é "forma pré-impressa", o que é conteúdo, o que é ruído e o que são marcações humanas que não são relevantes. Você pode reconhecer como as coisas estão alinhadas e o que combina com o quê com base no contexto. Para o computador, tudo o que não é a cor de fundo é "alguma coisa". Descobrir o que é importante para você e o que poderia ser algum tipo de personagem a ser traduzido é extremamente difícil. E se o conteúdo se sobrepõe às linhas pré-impressas, isso introduz quebras e dados ausentes que o computador não pode manipular facilmente.
Pegue suas imagens, por exemplo. A primeira imagem é uma causa perdida. Muito disso ignora as linhas e o layout. Você teria a tarefa adicional de separar e remover a grade pré-impressa do conteúdo. Na segunda imagem, o conteúdo está principalmente dentro dos limites da grade, mas há muitas marcações perdidas (barras, sublinhados etc.) que exigiriam limpeza.
A parte mais difícil, porém, é reconhecer a caligrafia e convertê-la em texto de computador. Para a imagem 1, mesmo os humanos teriam problemas para descobrir o que é, e isso envolveria muita adivinhação com base no contexto e na familiaridade com as palavras. Na imagem 2, a maioria dos números não é tão ruim, mas o texto seria um problema.
Se os registros de seus avós não forem cursivos e limpos, legíveis, consistentes e semelhantes à impressão de máquina, o OCR pode fazer um trabalho "razoável" nele. Mas você ainda teria muita limpeza.
Para se ter uma ideia, o Serviço Postal dos EUA tem alguns dos mais avançados sistemas de reconhecimento de manuscrito, que ele usa para ler endereços em correspondências para que possam ser classificados com equipamentos automatizados. A única maneira de fazer isso é porque os endereços estão em uma estrutura e formato prescritos e eles conhecem todos os endereços possíveis com antecedência. O objetivo é mais combinar os endereços manuscritos com candidatos viáveis do que acertar todos os caracteres.
Há uma tonelada de redundância. Se você conseguir decifrar apenas metade dos caracteres, ainda pode haver apenas uma ou algumas correspondências possíveis. Mesmo assim, uma parte substancial requer intervenção humana. Quando termina e a correspondência chega à transportadora para entrega, a transportadora conhece os endereços e nomes em sua rota e verifica tudo para garantir que os endereços não foram mal interpretados.
Esse é o nível do OCR de caligrafia com tecnologia de ponta e uma gama extremamente controlada de possibilidades de comparação. Sua tarefa precisa traduzir todos os caracteres. Você não tem uma lista principal de todas as palavras que poderiam legitimamente estar nesses registros (além de um dicionário de todo o idioma). O OCR exigiria tanta limpeza que seria mais rápido simplesmente ler os registros e digitá-los no Excel. Essa não é uma tarefa incomum, e os profissionais de entrada de dados podem fazê-la de forma bastante rápida e econômica.
Com isso, você não pode.
Ou, você pode tentar usar as ferramentas que fazem isso, chamadas de "OCR" (para "Reconhecimento óptico de caracteres"), porém elas são baseadas em algoritmos que fazem as melhores suposições quanto aos caracteres que estão sendo representados e com base na condição de as entradas que você tem aqui, é MUITO improvável que você obtenha um resultado satisfatório.
Basicamente, mesmo com as melhores ferramentas disponíveis no mercado de consumo e corporativo hoje, você acabará tendo que corrigir ou inserir manualmente quase todos os dados de qualquer maneira.
Os computadores podem estar melhorando continuamente, mas permanecem muito inferiores aos olhos e ao cérebro humanos na interpretação desse tipo de informação, pelo menos no nível do computador e do software disponível para você e para mim.