監視
監視とアラートの設定について説明します。
監視スタック
Bazbiiシステムでは、Grafana Cloud(マネージドサービス)を使用して監視・可観測性を実現しています。
Grafana Cloud
Grafana Cloudは、Prometheus互換メトリクス、Loki互換ログ、Tempo互換トレースを統合的に提供するマネージドサービスです。
- メトリクス: Grafana Cloud Prometheus互換エンドポイント
- ログ: Grafana Cloud Loki互換エンドポイント
- トレース: Grafana Cloud Tempo互換エンドポイント
- 可視化: Grafanaダッシュボード
OpenTelemetry
アプリケーションからテレメトリデータを収集するために、OpenTelemetry Collectorを使用します。
- ログ、メトリクス、トレースをOTLP形式でGrafana Cloudへ送信
- アプリケーション側の実装負荷を最小化
詳細: 監視スタックの構成については、インフラストラクチャとインフラ構成を参照してください。
監視対象
システムメトリクス
- CPU、メモリ使用率
- リクエスト数、エラー率
- レイテンシ(P50, P95, P99)
ドメインイベント
- 投稿作成数
- フィード取得数
- 認証エラー数
インフラ
- データベース接続数
- キャッシュヒット率
- 外部API呼び出し
アラート
設定対象
- エラー率の急増
- レイテンシの悪化
- リソース使用率の高騰
- データベース接続エラー