Spécification d’architecture – Système multi‑agents gouverné (VS Code)¶
1. Objectif du document¶
Définir une architecture cible permettant : - le développement logiciel assisté par plusieurs agents LLM spécialisés, - une orchestration efficace sans coût API au token, - une gouvernance stricte, traçable et auditable, - un human‑in‑the‑loop limité aux décisions de sens.
Cette architecture est pensée pour une mise en œuvre progressive dans VS Code.
2. Principes fondateurs¶
- Séparation stricte des rôles : aucun agent ne cumule orchestration, production et jugement.
- Asymétrie des responsabilités : produire ≠ décider ≠ juger.
- Traçabilité first‑class : toute décision structurante doit être persistée.
- Souveraineté et coût prévisible : priorité aux LLM locaux ; usage SaaS limité et non critique.
- Auditabilité : chaque livrable doit pouvoir être évalué indépendamment de la conversation.
3. Rôles du système¶
3.1 Orchestrateur – Claude Code¶
Responsabilité : orchestration tactique d’un workflow.
Claude : - découpe une user story en tâches, - déclenche des agents spécialisés, - collecte leurs livrables, - confronte des points de vue techniques, - converge vers une proposition complète, - déclenche des gates vers le PMO.
Contraintes : - Claude ne décide jamais de la conformité finale. - Claude n’est pas le producteur principal de code. - Claude n’interagit avec le PMO qu’aux gates.
3.2 Agents spécialisés (LLM locaux)¶
Responsabilité : production ou validation spécialisée.
Exemples : - Agent Sécurité - Agent Cloud - Agent Backend - Agent Tests
Caractéristiques : - chacun travaille en isolation, - chacun possède un périmètre de code strict, - aucun agent ne dialogue directement avec un autre.
Sorties attendues : - livrables structurés (code, rapports, YAML, tests), - respect d’un contrat d’interface et d’invariants explicites.
3.3 PMO (Project Management Office)¶
Responsabilité : autorité normative et juge de légitimité.
Le PMO : - définit le cadre normatif (objectifs, invariants, interdits), - évalue les livrables consolidés, - rend des verdicts structurés : GO, RESERVE, NON_CONFORME, ESCALADE.
Le PMO : - ne code pas, - ne corrige pas, - n’orchestré pas, - ne dialogue pas avec les agents.
Il juge, sur la base de règles écrites.
3.4 Humain¶
Responsabilité : décision de sens.
L’humain intervient uniquement lorsque : - le PMO déclenche une escalade, - une règle est ambiguë, - un compromis stratégique est requis.
ChatGPT (usage conversationnel) peut être utilisé comme outil de réflexion, sans rôle opérationnel.
4. Flux global de fonctionnement¶
User Story
↓
Claude (orchestration)
↓
Agents spécialisés (travail isolé)
↓
Claude (confrontation & synthèse)
↓
Gate PMO
↓
Verdict PMO
↓
GO / Rework / Escalade humaine
5. Gates PMO¶
Les gates sont les seuls points de communication Claude → PMO.
Types de gates : - CONFORMITY_CHECK - AMBIGUITY - EXCEPTION - CLOSURE
Contenu transmis : - dossier de livraison consolidé, - hypothèses déclarées, - preuves de conformité.
6. Verdict PMO (format canonique)¶
pmo_verdict:
workflow: US-XX
status: NON_CONFORME | RESERVE | GO | ESCALADE
reason: "Règle INV-04 violée"
required_action: "Clarifier garantie de cohérence"
escalation: true|false
7. Cohabitation des agents – règles strictes¶
- Les agents ne dialoguent jamais entre eux.
- Chaque agent produit une vérité partielle indépendante.
- Claude est le seul médiateur.
- Les conflits sont rendus visibles, jamais lissés.
8. Gestion du code¶
8.1 Frontières de code¶
- Aucun fichier n’est modifié par deux agents.
- Les interactions passent par des interfaces contractuelles.
8.2 Code Contract (exemple)¶
code_contract:
module: storage-layer
interfaces:
- KeyProvider
invariants:
- "No plaintext key outside HSM"
forbidden:
- "Direct filesystem access"
9. Rôle de Claude vis‑à‑vis du code¶
Claude : - définit l’architecture, - vérifie la complétude, - assemble les composants, - documente.
Claude n’est pas le codeur principal.
10. Tableau de bord PMO (VS Code)¶
Une extension VS Code dédiée : - agrège les verdicts PMO multi‑workflow, - affiche les statuts globaux, - met en évidence les actions humaines requises, - permet la navigation vers les artefacts.
Le tableau de bord est : - passif, - non décisionnel, - centré sur la gouvernance.
11. Bénéfices clés¶
- autonomie maximale des workflows,
- réduction drastique du bruit cognitif,
- coût prévisible,
- souveraineté des données,
- auditabilité et crédibilité long terme.
12. Principe clé final¶
Les agents produisent.
Claude orchestre.
Le PMO juge.
L’humain tranche.
Ce document constitue la base normative pour toute implémentation future.