9. Guardrails — AIが越えてはいけない柵

Guardrailとは

Guardrailは、AIや人間がやってはいけない操作を止める仕組みです。

例:

「やってはいけません」とMarkdownに書くだけでは、AIが忘れることがあります。
人間も急いでいると破ります。

そのため、Guardrailには段階があります。

DSLでは、Guardrailを3つに分けます。

同じ制約でも、適用場所や強さは変えたいからです。

例: 生成ファイル保護

これにより、エディタ操作中にも止まり、コミット時にも止まります。

エディタ・Git・CIで段階的に止める

新しいGuardrailをいきなりblockすると、開発が止まる可能性があります。

そこで段階導入します。

DSLから以下を生成します。

# DSLからHookやポリシーを生成するコマンド例
generate-guardrails --config ./dsl-config.yaml

生成物の例:

悪い操作:

git commit --no-verify -m "skip checks"

Guardrailがある場合:

GuardrailはAIへのお願いではありません。
AIや人間の判断とは独立して、危険操作を物理的に止める仕組みです。

DSLで宣言的に管理することで、Guardrailを増やしても破綻しにくくなります。