AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1847169
Accepted
Martin
Martin
Asked: 2024-06-26 23:09:27 +0800 CST2024-06-26 23:09:27 +0800 CST 2024-06-26 23:09:27 +0800 CST

Como descobrir por que o host está bloqueando os bots de rastreamento do Google

  • 772

Temos um host de servidor com WHM.

Este host é um host virtual com vários sites.

Descobrimos recentemente que o Google Analytics e o Search Console parecem não conseguir acessar as páginas do site porque o Google parece não conseguir acessar o arquivo robots.txt.

O arquivo robots.txt existe e pode ser acessado pelo navegador.

Minha conclusão é que de alguma forma o firewall WHM ou similar está bloqueando o acesso do Google a www.website.com/robots.txt . Mas não consigo ver como isso está acontecendo. O Google não fornece informações específicas úteis. Apenas que a solicitação é atendida por um erro (5xx). Mas a solicitação carrega perfeitamente no navegador.

Limpei nossa extensa lista de IPs bloqueados no Firewall (CSF) e verifiquei se as opções de firewall de inundação de portas estão desativadas (estão desativadas). Também verifiquei o Apache para ver se há algo nele que possa causar problemas no host virtual que o httpd.conf inclui e nada parece relevante.

Não tenho certeza do que estou procurando, mas algo que está fazendo com que o Google (especificamente e somente) seja negado pelo servidor.

o que estou perdendo? Onde posso procurar? Estou sem ideias. Acho que há algo automatizado que impede os bots do Google de chegar ao servidor , mas não consigo entender o que é. Talvez algum tipo de regra negando acesso a arquivos não HTML, embora funcionem no navegador.

ip
  • 1 1 respostas
  • 35 Views

1 respostas

  • Voted
  1. Best Answer
    Martin
    2024-06-27T18:19:05+08:002024-06-27T18:19:05+08:00

    Embora não tenha conseguido encontrar informações exatas que me dissessem qual era a causa, por meio de um processo de dedução encontrei o problema:

    Os Googlebots não conseguem operar com determinados tipos de cabeçalhos HTTP "Política de permissões" em vigor. Especificamente

    Permissions-Policy: 
    
    execution-while-not-rendered=*, 
    execution-while-out-of-viewport=*, 
    geolocation=*,
    sync-script=*,
    

    Todos devem estar padrão/ativados ( *) no cabeçalho HTTP fornecido aos bots do Google.

    (Não tenho certeza se a geolocalização é necessária para que funcione, mas os outros definitivamente)

    • 1

relate perguntas

  • Como atribuir um endereço IP estático a diferentes dispositivos

  • Endereços IP dinâmicos: existe uma correção para a lista negra?

  • No PostgreSQL no Linux, editar pg_hba.conf e postgresql.conf e reiniciar o Postgres trava meu cluster na reinicialização (torna-o 'inativo')

  • Por que o Ultrasurf não está escondendo meu endereço IP?

  • É possível usar FTP sem sistema de arquivos no cliente?

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como posso reduzir o consumo do processo `vmmem`?

    • 11 respostas
  • Marko Smith

    Baixar vídeo do Microsoft Stream

    • 4 respostas
  • Marko Smith

    O Google Chrome DevTools falhou ao analisar o SourceMap: chrome-extension

    • 6 respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Martin Hope
    Vickel O Firefox não permite mais colar no WhatsApp web? 2023-08-18 05:04:35 +0800 CST
  • Martin Hope
    Saaru Lindestøkke Por que os arquivos tar.xz são 15x menores ao usar a biblioteca tar do Python em comparação com o tar do macOS? 2021-03-14 09:37:48 +0800 CST
  • Martin Hope
    CiaranWelsh Como posso reduzir o consumo do processo `vmmem`? 2020-06-10 02:06:58 +0800 CST
  • Martin Hope
    Jim Pesquisa do Windows 10 não está carregando, mostrando janela em branco 2020-02-06 03:28:26 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve