跳到主要内容

可观测性

可观测性按“先监控告警、后日志”的顺序推进,避免低成本集群一开始承担过重的日志存储开销。

监控

默认组件:

  • kube-prometheus-stack
  • Prometheus
  • Grafana
  • Alertmanager
  • node-exporter
  • kube-state-metrics

初始 values:

gitops/infrastructure/monitoring/kube-prometheus-stack-values.yaml

验收:

kubectl --context aliyun-guangzhou -n monitoring get pods
kubectl --context tencent-guangzhou -n monitoring get pods
kubectl --context aliyun-guangzhou -n monitoring port-forward svc/kube-prometheus-stack-grafana 3000:80

日志

默认低成本路线:

  • Fluent Bit 采集容器日志。
  • OpenSearch 单节点存储。
  • 后续再接 OpenSearch Dashboards。

初始 values:

gitops/infrastructure/logging/fluent-bit-values.yaml
gitops/infrastructure/logging/opensearch-values.yaml

日志阶段验收重点是能按集群、namespace、Pod 和容器维度查询。