可观测性
可观测性按“先监控告警、后日志”的顺序推进,避免低成本集群一开始承担过重的日志存储开销。
监控
默认组件:
- kube-prometheus-stack
- Prometheus
- Grafana
- Alertmanager
- node-exporter
- kube-state-metrics
初始 values:
gitops/infrastructure/monitoring/kube-prometheus-stack-values.yaml
验收:
kubectl --context aliyun-guangzhou -n monitoring get pods
kubectl --context tencent-guangzhou -n monitoring get pods
kubectl --context aliyun-guangzhou -n monitoring port-forward svc/kube-prometheus-stack-grafana 3000:80
日志
默认低成本路线:
- Fluent Bit 采集容器日志。
- OpenSearch 单节点存储。
- 后续再接 OpenSearch Dashboards。
初始 values:
gitops/infrastructure/logging/fluent-bit-values.yaml
gitops/infrastructure/logging/opensearch-values.yaml
日志阶段验收重点是能按集群、namespace、Pod 和容器维度查询。