我们正在 GCP 上构建数据管道,并选择 Bigtable 作为原始事件的数据仓库。我的问题是 - 我找不到正确监控集群的方法。仪表板提供了数量有限的指标,如果有任何方法可以轻松地将它们连接到 StackDriver,就像 GCP 上的所有其他服务都已设置一样,这些指标可以起到作用。
是否可以使用 Stackdriver 监控 Bigtable?如果没有,是否有另一种推荐的方法来实现这一目标?
我发现这篇文章解释了如何获取有关针对 Bigtable 运行的请求的报告,但这在尝试接收有关整个集群健康状况的总体情况时并没有帮助我。
Google Cloud Bigtable 将服务器端指标导出到 Stackdriver;您可以在Bigtable 文档以及Stackdriver 指标列表中找到更多信息。
此外,如果您为 Bigtable 使用与 HBase 兼容的 Java 客户端,您可以在客户端导出 Dropwizard 指标,这将为您提供详细的客户端性能指标,例如端到端请求延迟,您可以跟踪这些指标您自己,例如,通过您自己的Graphite实例。
这些指标并不是要替代 Bigtable 的 Stackdriver 指标,而是为了补充这些指标,我们建议在查看服务器端指标的同时跟踪客户端指标。
请注意,现在可以通过 Stackdriver Monitoring API 查询 Bigtable 指标: https ://cloud.google.com/monitoring/api/metrics#gcp-bigtable
您还可以通过 Stackdriver UI 创建提醒和定义 Google Cloud Bigtable 指标的自定义仪表板:https ://app.google.stackdriver.com/