需要帮助。如果站点给出 401 502 等错误,我想发出警报。服务器上是一个代理,它在数据狗中发送不同的片段。有这样的模块http_check,就像有这样的功能一样。
http_response_status_code - A string or Python regular expression for an HTTP status code. This check will report DOWN for any status code that does not match. This defaults to 1xx, 2xx and 3xx HTTP status codes. For example: 401 or 4\d\d
这是我的 http_check.yml
init_config:
instances:
- name: My first service
url: https://example.com
collect_response_time: true
timeout: 1
skip_event: true
http_response_status_code: 502
check_certificate_expiration: true
disable_ssl_validation: false
days_warning: 7
days_critical: 3
tags:
- url:example.com
- env:production
实际上,我尝试关闭 nginx 并观察它是否会发送状态。我没看到任何东西。通常的任务是监视站点并在有东西掉下来时发出警报。
datadog 的开发人员知道这个问题。为了解决这个任务,我们需要使用这样的自定义检查 - http_check.py
然后我们需要在主机上重新启动代理并模仿错误。在事件数据狗中,我们将看到
http://example.com returned a status of 503 after 30.0 seconds
之后,我们可以创建警报。此自定义检查发送除 200 之外的所有代码。
您可以将 (4|5)\d\d 用于 http_response_status_code。