11. ObservabilityとFeedback Loop

なぜAI開発プロセスを観測するのか
AI駆動開発では、アプリケーションのログだけでなく、AIがどう作業したかも観測対象になります。
理由は、AIの失敗を次回のルールに変えるためです。
観測基盤の位置づけ
AI開発プロセスの観測基盤は、開発イベントを記録するツールです。
記録するもの:
複数軸イベントモデル
開発イベントを1つのログに流すだけでは「何が起きたか」しかわかりません。 誰が・どの工程で・何のルールに対しての3軸で記録すると、問題の原因を特定しやすくなります。
たとえば「テストが落ちた」だけでなく、「実装エージェントが、実装フェーズで、型安全ガードレイルに引っかかった」まで追跡できます。
| 軸 | 記録する観点 | 例 |
|---|---|---|
| Agent | 誰が何をしたか | session start/stop、エージェント起動/終了、コマンド実行 |
| Process | どの工程で起きたか | ワークフロー境界、ファイル編集 |
| Guardrail | 何が検出・制御されたか | ガードレイル検出、品質チェック、制御イベント |
この3軸を掛け合わせることで、「どのエージェントが、どのフェーズで、どんな違反を起こしやすいか」をデータとして把握し、ルールやスキルの改善に直接つなげられます。
改善提案の役割
観測データと開発セッションの内容をもとに改善提案をします。
- 開発中の失敗
- 観測基盤に記録
- 分析
- 改善提案
- ルール / スキル / ガードレイル / DSL
- 次回から自動適用
改善例
| 観測された問題 | 改善先 |
|---|---|
| 同じコマンドミスが多い | エディタ Hook |
| 同じテスト漏れが多い | テスト検査ルール |
| 仕様漏れが多い | 仕様テンプレート |
| 特定の手順を毎回説明している | スキル化 |
| 生成ファイル編集が多い | Guardrailをwarnからblockへ |
| リリース後の手戻りが多い | release gate追加 |
fail-openの考え方
観測基盤は大事ですが、観測基盤が止まっただけで開発が止まると困ります。
そのため、観測基盤は基本的にfail-openです。
つまり:
- 記録できれば記録する
- 記録できなくても開発は止めない
- 品質ゲートとは役割を分ける
ランタイム観測との違い
| 観測対象 | 目的 |
|---|---|
| ランタイム観測 | 本番アプリが正常に動いているか |
| AI開発プロセス観測 | AI開発の進め方が改善しているか |
両方が必要です。
結論
AI駆動開発は、導入して終わりではありません。
作業ログ、ガードレイル違反、検査結果をもとに、開発システム自体を育てていく必要があります。
開発を重ねるほど、AIが動くレールが強くなる。
これがFeedback Loopの狙いです。