关于【prometheus】的问题- 第1页

Jim

Asked: 2025-04-12 01:53:15 +0800 CST

为什么我在 grafana 中看到 rate[1m] 的恒定图表？

5

我设置了一个测试项目，其中 Java 客户端会将测试指标发送到 Prometheus。它基本上会持续调用，Counter.inc()
我可以在 Prometheus 和 Grafana 中看到这些指标。
在 Grafana 中查询过去 5 分钟的数据点，这些是我使用Query Inspector

"Time","{__name__=""my_test_counter_total"", instance=""localhost:8000"", job=""prometheus""}"
2025-04-11 19:32:00,412
2025-04-11 19:32:15,427
2025-04-11 19:32:30,442
2025-04-11 19:32:45,457
2025-04-11 19:33:00,472
2025-04-11 19:33:15,487
2025-04-11 19:33:30,502
2025-04-11 19:33:45,517
2025-04-11 19:34:00,532
2025-04-11 19:34:15,547
2025-04-11 19:34:30,562
2025-04-11 19:34:45,577
2025-04-11 19:35:00,592
2025-04-11 19:35:15,607
2025-04-11 19:35:30,622
2025-04-11 19:35:45,637
2025-04-11 19:36:00,652
2025-04-11 19:36:15,667
2025-04-11 19:36:30,682
2025-04-11 19:36:45,697
2025-04-11 19:37:00,712

在 grafana 中我看到一个线性图：

当我应用该rate[1m]函数时，我的理解是它会在一分钟内对值进行平均，但我看到一个恒定的图表：

为什么rate图表是常数函数？我不应该看到每分钟分桶值的平均值吗？

Amandasaurus

Asked: 2023-02-28 19:52:30 +0800 CST

普罗米修斯公开了自己的任何指标？（例如它使用的磁盘空间）

5

Prometheus 是否公开任何指标？即它使用了多少磁盘空间等。

我想开始微调我们的普罗米修斯服务器，因此需要监控当前存在的内容。我希望能够看到它使用了多少磁盘空间。

Prometheus v2.31 通过 apt 安装在 Ubuntu Linux 22.04 LTS 上。

Nigrimmist

Asked: 2022-02-18 09:06:41 +0800 CST

端口已在使用时的Nginx反向代理？

0

我正在尝试使用基本身份验证关闭端口（对于普罗米修斯的推送网关），所以不是 nginx 的大专家，所以有人可以给我和建议我哪里错了吗？

我有 9091 端口，应该在 auth 前面从外部关闭。此端口正在被 pushgateway 使用

我当前的 nginx 配置：

events { }
http {
upstream prometheus {
      server 127.0.0.1:9090;
      keepalive 64;
}

upstream pushgateway {
      server 127.0.0.1:9091;
      keepalive 64;
}

server {
      root /var/www/example;
      listen 0.0.0.0:80;
      server_name __;      
      location / {
            auth_basic "Prometheus server authentication2";
            auth_basic_user_file /etc/nginx/.htpasswd;
            proxy_pass http://prometheus;
      }  
}


server {
      root /var/www/example;
      listen 0.0.0.0:3001;          
      server_name __;      
      location / {
            auth_basic "Pushgateway server authentication";
            auth_basic_user_file /etc/nginx/.htpasswd;
            proxy_pass http://pushgateway;
      } 
}
}

所以基本身份验证适用于：3001，但 9091 仍然打开。我试图改变它的下一个方式：

   server {
      root /var/www/example;
      listen 0.0.0.0:3001;
      listen 0.0.0.0:9091;
      server_name __;      
      location / {
            auth_basic "Pushgateway server authentication";
            auth_basic_user_file /etc/nginx/.htpasswd;
            proxy_pass http://pushgateway;
      } 
}

并且工作正常，但是...... pushgateway 无法开始尝试监听：9091 并抛出“bind:address is already in use”。我怎样才能避免它并将pushgateway隐藏在nginx前面？

Pushgatewa 的配置：

ExecStart=/usr/local/bin/pushgateway --web.listen-address=":9091" --web.telemetry-path="/metrics"  --persistence.file="/tmp/metric.store"  --persistence.interval=5m --log.level="info" --log.format="logger:stdout?json=true"

Patrick

Asked: 2022-02-18 02:30:09 +0800 CST

调试 Prometheus Blackbox Exporter http_2xx probs

0

我们正在使用 Prometheus Blackbox Exporter（blackbox_exporter，版本 0.19.0）来检查 HTTP 端点。
现在我们需要使用fail_if_body_matches_regexp.
当 html 正文中存在某个单词时，检查应该失败。
为此，我们创建了以下 http prob 配置：

Module configuration:
prober: http
timeout: 5s
http:
    valid_http_versions:
        - HTTP/1.1
        - HTTP/2
        - HTTP/2.0
    preferred_ip_protocol: ip4
    ip_protocol_fallback: true
    fail_if_body_matches_regexp:
        - The page is temporarily unavailable
    follow_redirects: true
tcp:
    ip_protocol_fallback: true
icmp:
    ip_protocol_fallback: true
dns:
    ip_protocol_fallback: true

不幸的是，检查没有按预期工作。即使网站包含The page is temporarily unavailable在 html 正文中，检查仍然成功。

Logs for the probe:
ts=2022-02-17T09:46:31.403831228Z caller=main.go:320 module=http_2xx target=https://site.local level=info msg="Beginning probe" probe=http timeout_seconds=5
ts=2022-02-17T09:46:31.403959629Z caller=http.go:335 module=http_2xx target=https://site.local level=info msg="Resolving target address" ip_protocol=ip4
ts=2022-02-17T09:46:31.500911613Z caller=http.go:335 module=http_2xx target=https://site.local level=info msg="Resolved target address" ip=XXX.XXX.XXX.XXX
ts=2022-02-17T09:46:31.501017313Z caller=client.go:251 module=http_2xx target=https://site.local level=info msg="Making HTTP request" url=https://XXX.XXX.XXX.XXX host=site.local
ts=2022-02-17T09:46:31.614236162Z caller=main.go:130 module=http_2xx target=https://site.local level=info msg="Received HTTP response" status_code=200

Metrics that would have been returned:
# HELP probe_failed_due_to_regex Indicates if probe failed due to regex
# TYPE probe_failed_due_to_regex gauge
probe_failed_due_to_regex 0

要检查网站是否在 Prometheus Blackbox Exporter 中正确加载，我想检查测试期间收到的 html 正文。有谁知道这是否可能并且可能有一些进一步的调试提示？

MysteriousPerson

Asked: 2022-01-12 06:40:13 +0800 CST

Kubernetes Nginx 入口控制器指标

3

我试图找到有关 Kubernetes 中 NGINX 入口控制器公开的指标的文档，但到目前为止，我还没有找到任何关于指标及其含义的可靠来源。

例如，有三个不同的request_size指标（sum、bucket、count）。

从我的猜测sum和count相互关联。为了获得平均请求大小，我可能会做类似sum by (method) (request_size_sum{...}) / sum by (method) (request_size_count{...}).

但是bucket，尤其是什么是什么le？

mr.zog

Asked: 2021-09-25 06:51:32 +0800 CST

我可以在 docker-compose 组中跟踪 ONE 容器的日志吗？

0

我仍在努力理解为什么我的 ipmi_exporter 容器不会与我的 Prometheus、Grafana、snmp_exporter 和 alertmanager 在同一个“pod”中运行。当我打开“pod”时， docker -compose 说ipmi_exporter 已启动，但 docker -compose ps找不到容器。如果我的帖子标题中没有明确说明，我希望能够看到包含 ipmi_exporter 启动的日志。

另外，什么是 docker-compose 容器组？Pod 是 K8s 的东西。

Jeffery

Asked: 2021-08-28 02:41:24 +0800 CST

为什么K8S statefulsets volumeClaimTemplates status is pending ，但是pod、pvc、pv都可以？

1

我使用 nfs-subdir-external-provisioner 作为我的 promethues 的自动 pv 供应器（通过 promethues-operator ）我已经成功创建了我们的 sts、pod、pvc、pv，一切看起来都很好。但是如果我使用 kubectl get sts -o yaml ，状态仍然是“阶段：待定”....有人知道吗？

  volumeClaimTemplates:
  - apiVersion: v1
    kind: PersistentVolumeClaim
    metadata:
      creationTimestamp: null
      name: prometheus-k8s-db
    spec:
      accessModes:
      - ReadWriteOnce
      resources:
        requests:
          storage: 5Gi
      storageClassName: managed-nfs-storage
      volumeMode: Filesystem
    status:
      phase: Pending

NAME             READY   AGE
prometheus-k8s   2/2     26m

NAME                                   READY   STATUS    RESTARTS   AGE
prometheus-k8s-0                       2/2     Running   0          28m
prometheus-k8s-1                       2/2     Running   0          28m

NAME                                 STATUS   VOLUME                                     CAPACITY   ACCESS MODES   STORAGECLASS          AGE
prometheus-k8s-db-prometheus-k8s-0   Bound    pvc-77c8035e-fe32-4c0d-8302-930b39979fc1   5Gi        RWO            managed-nfs-storage   3h57m
prometheus-k8s-db-prometheus-k8s-1   Bound    pvc-21989d64-cc89-4aed-bed5-30bd22c0ae35   5Gi        RWO            managed-nfs-storage   3h57m

Toby 1 Kenobi

Asked: 2021-05-06 23:14:54 +0800 CST

Prometheus 未连接到 GKE 中的警报管理器

1

我使用 helm（在“monitoring”命名空间中）将 kube-prometheus-stack 15.3.1 安装到 GKE 集群中。我使用values.yaml来打开某些组件的入口，并将 SMTP 信息和接收者详细信息添加到警报管理器中。在大多数情况下，一切似乎都很好，除了 Prometheus 发出了许多警报，而且我没有收到任何警报电子邮件。

一个触发警报是：

PrometheusNotConnectedToAlertmanagers

Prometheus 监控/prometheus-kube-prometheus-stak-prometheus-0 没有连接到任何Alertmanagers

另一个是：

PrometheusOperatorSyncFailed

监控命名空间中的控制器警报管理器无法协调 1 个对象。

我还尝试打开警报管理器的入口并指向alerts.mydomiain.com它，但是当我尝试任何 GET 请求（例如alerts.mydomain.com/v2/status）时，我总是会收到 502 服务器错误。

我需要做什么才能让我的 alertmanager 正常工作？

这是输出kubectl get pods,svc,daemonset,deployment,statefulset -n monitoring：

NAME                                                            READY   STATUS    RESTARTS   AGE
pod/kube-prometheus-stack-grafana-58f7fcb497-hm72h              2/2     Running   0          30h
pod/kube-prometheus-stack-kube-state-metrics-6d588499f5-d957b   1/1     Running   0          2d3h
pod/kube-prometheus-stack-operator-54f89674c9-k8ml7             1/1     Running   0          2d3h
pod/kube-prometheus-stack-prometheus-node-exporter-22vpd        1/1     Running   0          3h57m
pod/kube-prometheus-stack-prometheus-node-exporter-2qsl9        1/1     Running   0          3h57m
pod/kube-prometheus-stack-prometheus-node-exporter-4d27n        1/1     Running   0          7h36m
pod/kube-prometheus-stack-prometheus-node-exporter-7rlnk        1/1     Running   0          4h47m
pod/kube-prometheus-stack-prometheus-node-exporter-7xlf4        1/1     Running   0          4h51m
pod/kube-prometheus-stack-prometheus-node-exporter-9mfnt        1/1     Running   0          3h57m
pod/kube-prometheus-stack-prometheus-node-exporter-9zblf        1/1     Running   0          2d3h
pod/kube-prometheus-stack-prometheus-node-exporter-bdcjj        1/1     Running   0          2d3h
pod/kube-prometheus-stack-prometheus-node-exporter-bs54w        1/1     Running   0          4h47m
pod/kube-prometheus-stack-prometheus-node-exporter-fp95h        1/1     Running   0          2d3h
pod/kube-prometheus-stack-prometheus-node-exporter-h4zhw        1/1     Running   0          2d3h
pod/kube-prometheus-stack-prometheus-node-exporter-pz8js        1/1     Running   0          3h58m
pod/kube-prometheus-stack-prometheus-node-exporter-rrrhk        1/1     Running   0          27h
pod/kube-prometheus-stack-prometheus-node-exporter-rszlt        1/1     Running   0          2d3h
pod/kube-prometheus-stack-prometheus-node-exporter-s62wq        1/1     Running   0          4h47m
pod/kube-prometheus-stack-prometheus-node-exporter-w9dmb        1/1     Running   0          5h32m
pod/kube-prometheus-stack-prometheus-node-exporter-xqmxk        1/1     Running   0          4h51m
pod/prometheus-kube-prometheus-stack-prometheus-0               2/2     Running   1          30h

NAME                                                     TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)          AGE
service/kube-prometheus-stack-alertmanager               NodePort    10.125.4.161    <none>        9093:30903/TCP   2d3h
service/kube-prometheus-stack-grafana                    NodePort    10.125.7.177    <none>        80:32444/TCP     2d3h
service/kube-prometheus-stack-kube-state-metrics         ClusterIP   10.125.2.56     <none>        8080/TCP         2d3h
service/kube-prometheus-stack-operator                   ClusterIP   10.125.4.171    <none>        443/TCP          2d3h
service/kube-prometheus-stack-prometheus                 NodePort    10.125.13.11    <none>        9090:30090/TCP   2d3h
service/kube-prometheus-stack-prometheus-node-exporter   ClusterIP   10.125.10.231   <none>        9100/TCP         2d3h
service/prometheus-operated                              ClusterIP   None            <none>        9090/TCP         2d3h

NAME                                                            DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
daemonset.apps/kube-prometheus-stack-prometheus-node-exporter   17        17        17      17           17          <none>          2d3h

NAME                                                       READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/kube-prometheus-stack-grafana              1/1     1            1           2d3h
deployment.apps/kube-prometheus-stack-kube-state-metrics   1/1     1            1           2d3h
deployment.apps/kube-prometheus-stack-operator             1/1     1            1           2d3h

NAME                                                           READY   AGE
statefulset.apps/prometheus-kube-prometheus-stack-prometheus   1/1     42h

José Pedro Machado

Asked: 2020-12-19 05:38:32 +0800 CST

外部指标的峰值会在不应该的情况下扩展 HPA

2

我有一个用于 HPA 的指标，问题是该指标有尖峰，为了避免这种情况，我在 prometheus 的记录规则中使用了一段时间内的平均值，但将其导出到 stackdriver（在 gke ) 我正在使用 stackdriver-prometheus-sidecar 并且它不会将记录的指标发送到stackdriver。

关于如何导出此指标的任何想法？我发现的其他解决方案是使用 v2beta2 hpa 并更改行为以更改按比例放大的稳定窗口，但这仅在 kubernetes 上的 v1.18 上可用，而 GCP 在稳定通道上只有 1.17 版，知道吗？

Rovanion

Asked: 2020-12-16 02:56:05 +0800 CST

如何配置 Prometheus 的 Alertmanager 的日志级别？

2

我已经设置了 Prometheus 的 Alertmanager 来管理来自 Prometheus 的警报。我收到了从 Prometheus 到 Alertmanager 的警报，但故事到此结束。Alertmanager 永远不会将警报发送到我的电子邮件端点。

为了弄清楚警报在 Alertmanager 内部的确切位置结束了它们的旅程，我想将日志级别从 info 转换为 debug，但一直无法弄清楚如何。即使现在找到日志似乎也是一个艰难的问题，它不在/var/log并且journalctl -u alertmanager包含的内容太少，以至于可能在某个地方还有另一个日志。

配置 Alertmanager的手册页没有提到调试级别。我查看了提到 log 的源代码，发现该设置应该命名为log.level. 将以下代码段添加到配置 YAML 也无济于事：

log:
  level: debug

因为 Alertmanager 无法启动，无法解析其配置文件。

为什么我在 grafana 中看到 rate[1m] 的恒定图表？

普罗米修斯公开了自己的任何指标？（例如它使用的磁盘空间）

端口已在使用时的Nginx反向代理？

调试 Prometheus Blackbox Exporter http_2xx probs

Kubernetes Nginx 入口控制器指标

我可以在 docker-compose 组中跟踪 ONE 容器的日志吗？

为什么K8S statefulsets volumeClaimTemplates status is pending ，但是pod、pvc、pv都可以？

Prometheus 未连接到 GKE 中的警报管理器

外部指标的峰值会在不应该的情况下扩展 HPA

如何配置 Prometheus 的 Alertmanager 的日志级别？

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

问题[prometheus](server)