Como eu faria minha máquina Linux parecer que está executando o Windows?

Question

cipricus

Asked: 2022-11-27 02:28:07 +0800 CST2022-11-27 02:28:07 +0800 CST 2022-11-27 02:28:07 +0800 CST

O que há de tão especial nesta página em pdf?

772

Estou no Linux, Kubuntu 22.10.

Alguns programas, incluindo o visualizador Plasma PDF Okular, exibem em branco algumas das páginas em um pdf específico (mais de 1.000 páginas), mas outros programas, incluindo alguns navegadores da Internet, exibem todas as páginas sem espaços em branco.

Depois de extrair todas as páginas como pdf, o mesmo acontece com as mesmas páginas problemáticas.

Testando com outros programas e resumindo:

todas as páginas são vistas por WPS PDF, Master PDF, Firefox, navegador Vivaldi, Opera (portanto, acho que também Chromium/Chrome), LibreOffice Draw, ImageMagick, mupdf, PDF Studio Viewer
espaços em branco (com apenas um rodapé) são exibidos no Okular, Qpdfviewer, PDF Aranger, Falkon (navegador de internet!), Inskape, Krita
O Evince (Document Viewer) instalado como snap no Kubuntu não consegue abrir o arquivo grande, nem nenhuma das páginas separadas do pdf, mas dá um erro: Error opening file the.pdf: Permission denied(ele abre outros arquivos pdf)

( Aqui está minha pergunta askubuntu com mais detalhes.)

Carreguei uma dessas complicadas páginas em PDF no DocDroid para teste.

Como posso encontrar mais detalhes sobre esses arquivos?

(Estou curioso sobre o que está acontecendo aqui - embora, para fins práticos, eu possa corrigir isso imprimindo em pdf em um navegador ou simplesmente usando um visualizador de pdf diferente).

Faça o download da página e veja se você pode fornecer alguns detalhes sobre por que esta página pode ser diferente em contraste com esta (que é a mesma, mas corrigida por impressão em pdf 'como imagem' no Opera).

2 respostas

Voted

harrymc · Answer 1 · 2022-11-27T03:54:45+08:00

Processo de análise

Baixei a página e descobri um fato estranho: Tanto o Adobe Reader quanto o Foxit Reader podem exibir o texto, mas é impossível copiá-lo corretamente. Qualquer outro aplicativo exibiria o texto colado com distorções.

Achei que era uma questão de fonte, então usei o Adobe Reader para ver as fontes incorporadas e descobri duas fontes que estavam faltando no meu computador: TimesNewRomanPSMT e ArialMT. Mas baixar as fontes não mudou nada - outros aplicativos ainda não conseguiram colar o texto copiado como estava.

Em seguida, tentei uma amostra do texto na página com o site WhatTheFont , mas não consegui identificar a fonte entre suas 130.000 fontes.

Um exemplo dos problemas no copy-paste do texto é quando copio este texto original:

Mas recebo isso ao colar no navegador ou no Word, que é apenas uma aproximação não exata:

Oral si suflet, revista Institutului de Filologie si folklor publIcata de Ovid Densuseanu, Bucuresti de la 1929.

Observe os erros de caracteres no texto colado.

Quando abro o PDF com o Word, recebo uma página que é apenas uma imagem do texto antigo e não consigo selecionar nenhum texto nela.

Conclusão

Este PDF se comporta como se a parte exibida fosse uma imagem de fundo de um texto antigo usando uma fonte antiga, com um texto de primeiro plano criado usando um OCR impreciso.

O texto OCR se comporta como se fosse o texto da imagem, pois é transparente e colocado na frente da imagem . É selecionável e sua cor de seleção é apenas parcialmente transparente, então parece que você está selecionando o texto exibido, mas está selecionando o texto OCR.

Um visualizador de imagens que não lida corretamente com a transparência mostrará uma página em branco com a imagem não "aparecendo". Este é um problema de transparência.

cipricus · Answer 2 · 2022-11-29T03:16:41+08:00

cipricus

2022-11-29T03:16:41+08:002022-11-29T03:16:41+08:00

Como informação complementar:

Este é um bug com poppler, postado aqui , inicialmente aqui , Evince e Atril (visualizador de PDF do Mint) também são afetados.
Para corrigir as páginas, imprimi-as "como pdf" no Firefox (ou Chrome, Vivaldi, Opera - com essas 'imprimir como imagem' também deve ser selecionado). Dependendo da capacidade da RAM, não se deve "imprimir em pdf" mais de 200-300 páginas de uma só vez para evitar congelamentos/travamentos.

0

O que há de tão especial nesta página em pdf?

Como posso reduzir o consumo do processo `vmmem`?

Baixar vídeo do Microsoft Stream

O Google Chrome DevTools falhou ao analisar o SourceMap: chrome-extension

O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

Como faço para ativar o WindowsXP agora que o suporte acabou?

Área de trabalho remota congelando intermitentemente

O que significa ter uma máscara de sub-rede /32?

Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

O que há de tão especial nesta página em pdf?

2 respostas

relate perguntas