Экосистема: мониторинг, логи, managed-кластеры
Кластер — это только основа; вокруг него выросла экосистема для наблюдаемости и удобной эксплуатации.
В продакшене Kubernetes почти всегда дополняют мониторингом, централизованными логами и берут как managed-сервис у облака.
Вы умеете разворачивать приложения, масштабировать и обновлять их. Финальный шаг — понять, что окружает кластер в реальной эксплуатации и куда расти дальше.
Мониторинг: что происходит в кластере
Нужно видеть метрики: загрузку CPU/памяти, число запросов, ошибки. Стандарт де-факто — Prometheus (собирает метрики) и Grafana (рисует дашборды). Prometheus периодически опрашивает поды по HTTP-эндпоинту с метриками, хранит временные ряды и умеет слать алерты (например, «память пода у лимита»).
- Prometheus — сбор и хранение метрик, алерты.
- Grafana — визуализация метрик на дашбордах.
- Ставится обычно одним Helm-чартом (kube-prometheus-stack).
Логирование: собрать логи со всех подов
Логи отдельных подов смотрят через kubectl logs, но при сотнях подов нужен централизованный сбор. Агент на каждом узле читает логи всех контейнеров и шлёт в общее хранилище, где их можно искать:
- Сборщики: Fluent Bit, Fluentd, Promtail.
- Хранилище и поиск: Loki (от Grafana), Elasticsearch/OpenSearch.
Managed-кластеры: не админить control plane самому
Поднимать и обслуживать control plane (etcd, бэкапы, обновления, безопасность) — серьёзная работа. Облака предлагают managed Kubernetes: они держат control plane за вас, вы управляете только нагрузками.
| Облако | Сервис |
| AWS | EKS (Elastic Kubernetes Service) |
| Google Cloud | GKE (Google Kubernetes Engine) |
| Azure | AKS (Azure Kubernetes Service) |
Прелесть в том, что kubectl и манифесты — те же самые. Навык переносится на любой кластер: локальный kind, EKS или GKE — команды не меняются.
Куда дальше
- Helm поглубже — писать собственные чарты.
- GitOps (ArgoCD, Flux) — кластер синхронизируется с Git автоматически.
- RBAC и безопасность — права доступа, политики, сетевые политики.
- Операторы — кастомные контроллеры для сложных приложений.
Итог
- Мониторинг — Prometheus + Grafana; логи — Fluent Bit/Loki/Elasticsearch.
- EKS, GKE, AKS — managed-кластеры: облако держит control plane.
- kubectl и манифесты одинаковы везде — навык полностью переносим.