AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 128937
Accepted
Zak
Zak
Asked: 2010-04-03 14:32:09 +0800 CST2010-04-03 14:32:09 +0800 CST 2010-04-03 14:32:09 +0800 CST

如何限制谷歌对我的 IP 块的抓取?

  • 772

我在一个/24网络中有几个网站,它们都被谷歌定期抓取。通常这很好。但是,当 google 开始同时抓取所有站点时,支持此 IP 块的一小部分服务器可能会受到很大的负载影响。

使用 google 网站管理员工具,您可以对给定域上的 googlebot 进行速率限制,但我还没有找到一种方法来限制通过 IP 网络的 bot。有人有这方面的经验吗?你怎么修好它的?

google web-crawler
  • 4 4 个回答
  • 4319 Views

4 个回答

  • Voted
  1. nik
    2010-04-03T18:43:44+08:002010-04-03T18:43:44+08:00

    我发现这些笔记很有趣

    1. 给自己一个 smart robots.txt和其他robots.txt帖子那里
    2. 受谷歌机器人困扰的人在谷歌的肮脏小秘密上的帖子
    3. 谷歌网络爬虫
    • 3
  2. Kyle Brandt
    2010-04-05T05:46:38+08:002010-04-05T05:46:38+08:00

    你可以去谷歌,用站长工具创建一个账户,然后你就可以控制每个网站的抓取速度。转到站点配置::设置::抓取速度。这不会让您按我不相信的特定顺序安排您的网站,但您至少可以减慢所有网站的速度。

    • 2
  3. Best Answer
    LapTop006
    2010-04-05T05:07:48+08:002010-04-05T05:07:48+08:00

    如果您运行 BGP,您可以简单地对 AS15169 (AS-GOOGLE) 进行速率限制,但手动操作可能太容易出错。

    • 1
  4. TomTom
    2010-04-03T22:12:56+08:002010-04-03T22:12:56+08:00

    不,不可行。您必须将其放入每个站点的 robots.txt 中。谷歌 - 正确 - 没有告诉“IP地址所有者”可以这么说。所有控制都来自网站上的 robots.txt。

    • -3

相关问题

  • Google 服务器使用什么硬件?

  • 用于 Intranet 搜索的“Google Appliance”的开源替代方案?[关闭]

  • 是否可以跟踪 Google CSE?

  • 面向公司的 Google 邮件

  • 无法通过 Google 的生成器生成站点地图

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    从 IP 地址解析主机名

    • 8 个回答
  • Marko Smith

    如何按大小对 du -h 输出进行排序

    • 30 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    MikeN 在 Nginx 中,如何在维护子域的同时将所有 http 请求重写为 https? 2009-09-22 06:04:43 +0800 CST
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    0x89 bash中的双方括号和单方括号有什么区别? 2009-08-10 13:11:51 +0800 CST
  • Martin Hope
    Kyle Brandt IPv4 子网如何工作? 2009-08-05 06:05:31 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve