AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1502257
Accepted
Shy
Shy
Asked: 2019-11-15 22:40:59 +0800 CST2019-11-15 22:40:59 +0800 CST 2019-11-15 22:40:59 +0800 CST

Por que o wget não está baixando arquivos recém-adicionados do servidor?

  • 772

Estou executando duas máquinas virtuais - digamos VM1 e VM2. Ambos estão executando o Ubuntu 16.04 e o VM2 possui o servidor web apache2 instalado. Agora no servidor VM2, copiei o código para um pequeno site.

PROBLEMA:

Do VM1, quero poder baixar o conteúdo do site usando wgetrepetidamente em um intervalo definido. Agora ele baixa todo o conteúdo do site inicialmente perfeitamente, mas quando adicionei um novo arquivo (um .jpgarquivo, à pasta do site que contém arquivos de imagem anteriores) para uma pasta (no site da máquina VM2) e, em seguida, executo o comando wget em a máquina VM1, o novo arquivo não é baixado.

MEU COMANDO WGET:

wget --recursive --convert-links --no-check-certificate --no-cache --no-cookies http://192.168.1.44/

O QUE EU TENTEI:

Então eu pensei que era um problema de cache . Mas eu já tinha --no-cacheno meu comando wget, então pesquisei na internet e executei o seguinte comando no lado do servidor para limpar o cache do apache2. Mas ainda sem sorte.

wget
  • 1 1 respostas
  • 932 Views

1 respostas

  • Voted
  1. Best Answer
    RedGrittyBrick
    2019-11-16T01:29:56+08:002019-11-16T01:29:56+08:00

    Se você adicionou um arquivo de imagem JPEG, mas não atualizou nenhum arquivo HTML para incluir uma referência a ele (ou um link para uma página de índice dinâmico), o Wget não seria capaz de encontrar o JPEG.

    A sincronização de dois conjuntos de pastas entre máquinas normalmente seria feita usando ferramentas como rsync, robocopy, etc., que não têm esse problema e que não copiam arquivos inalterados e, portanto, são muito mais eficientes.


    Atualizar:

    Para procurar alterações no conteúdo em servidores aos quais você não tem acesso administrativo, às vezes você pode usar a HTTP HEADsolicitação e examinar o Last-Modifiedcabeçalho, se presente

    C:\> curl --head https://www.gnu.org/graphics/heckert_gnu.transp.small.png
    HTTP/1.1 200 OK
    Date: Thu, 28 Nov 2019 23:15:33 GMT
    Server: Apache/2.4.7
    Strict-Transport-Security: max-age=63072000
    Access-Control-Allow-Origin: (null)
    Last-Modified: Sat, 19 Nov 2016 18:01:39 GMT
    ETag: "1dfd-541ab36d9a6c0"
    Accept-Ranges: bytes
    Content-Length: 7677
    Cache-Control: max-age=2592000
    Expires: Sat, 28 Dec 2019 23:15:33 GMT
    Content-Type: image/png
    Content-Language: non-html
    

    O Wget tem algumas opções para usar solicitações HTTP HEAD.

    Para um site completamente estático sem Javascript, você pode usar uma abordagem simples usando o Wget etc. Acredito que esses sites sejam raros.

    Você sempre terá problemas com páginas geradas dinamicamente. Você teria que baixar e analisar o HTML do site para determinar os URLs que precisa verificar. Você também pode precisar executar Javascript.

    Você só pode verificar as alterações no conteúdo gerado, não nos arquivos de origem. Como outros observaram, o conteúdo gerado geralmente possui alterações que não são de interesse - como registros de data e hora, tempos de processamento etc.

    • 3

relate perguntas

  • baixe imagens e mantenha subpastas com Wget de uma lista

  • usar wget em um link com caracteres japoneses dará 404

  • Wget: Baixe todos os arquivos começando com um nome especificado?

  • wget retorna erro 404

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    Serviço do Windows 10 chamado AarSvc_70f961. O que é e como posso desativá-lo?

    • 2 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Marko Smith

    ssl.SSLCertVerificationError: falha na verificação do certificado [SSL: CERTIFICATE_VERIFY_FAILED]: não foi possível obter o certificado do emissor local (_ssl.c:1056)

    • 4 respostas
  • Marko Smith

    Como posso saber em qual unidade o Windows está instalado?

    • 6 respostas
  • Martin Hope
    Albin Como faço para ativar o WindowsXP agora que o suporte acabou? 2019-11-18 03:50:17 +0800 CST
  • Martin Hope
    fixer1234 O "HTTPS Everywhere" ainda é relevante? 2019-10-27 18:06:25 +0800 CST
  • Martin Hope
    Kagaratsch O Windows 10 exclui muitos arquivos minúsculos muito lentamente. Algo pode ser feito para agilizar? 2019-09-23 06:05:43 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    Inter Sys Como Ctrl+C e Ctrl+V funcionam? 2019-05-15 02:51:21 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve