Spécification d’architecture – Système multi‑agents gouverné (VS Code)¶

1. Objectif du document¶

Définir une architecture cible permettant : - le développement logiciel assisté par plusieurs agents LLM spécialisés, - une orchestration efficace sans coût API au token, - une gouvernance stricte, traçable et auditable, - un human‑in‑the‑loop limité aux décisions de sens.

Cette architecture est pensée pour une mise en œuvre progressive dans VS Code.

2. Principes fondateurs¶

Séparation stricte des rôles : aucun agent ne cumule orchestration, production et jugement.
Asymétrie des responsabilités : produire ≠ décider ≠ juger.
Traçabilité first‑class : toute décision structurante doit être persistée.
Souveraineté et coût prévisible : priorité aux LLM locaux ; usage SaaS limité et non critique.
Auditabilité : chaque livrable doit pouvoir être évalué indépendamment de la conversation.

3. Rôles du système¶

3.1 Orchestrateur – Claude Code¶

Responsabilité : orchestration tactique d’un workflow.

Claude : - découpe une user story en tâches, - déclenche des agents spécialisés, - collecte leurs livrables, - confronte des points de vue techniques, - converge vers une proposition complète, - déclenche des gates vers le PMO.

Contraintes : - Claude ne décide jamais de la conformité finale. - Claude n’est pas le producteur principal de code. - Claude n’interagit avec le PMO qu’aux gates.

3.2 Agents spécialisés (LLM locaux)¶

Responsabilité : production ou validation spécialisée.

Exemples : - Agent Sécurité - Agent Cloud - Agent Backend - Agent Tests

Caractéristiques : - chacun travaille en isolation, - chacun possède un périmètre de code strict, - aucun agent ne dialogue directement avec un autre.

Sorties attendues : - livrables structurés (code, rapports, YAML, tests), - respect d’un contrat d’interface et d’invariants explicites.

3.3 PMO (Project Management Office)¶

Responsabilité : autorité normative et juge de légitimité.

Le PMO : - définit le cadre normatif (objectifs, invariants, interdits), - évalue les livrables consolidés, - rend des verdicts structurés : GO, RESERVE, NON_CONFORME, ESCALADE.

Le PMO : - ne code pas, - ne corrige pas, - n’orchestré pas, - ne dialogue pas avec les agents.

Il juge, sur la base de règles écrites.

3.4 Humain¶

Responsabilité : décision de sens.

L’humain intervient uniquement lorsque : - le PMO déclenche une escalade, - une règle est ambiguë, - un compromis stratégique est requis.

ChatGPT (usage conversationnel) peut être utilisé comme outil de réflexion, sans rôle opérationnel.

4. Flux global de fonctionnement¶

User Story
    ↓
Claude (orchestration)
    ↓
Agents spécialisés (travail isolé)
    ↓
Claude (confrontation & synthèse)
    ↓
Gate PMO
    ↓
Verdict PMO
    ↓
GO / Rework / Escalade humaine

5. Gates PMO¶

Les gates sont les seuls points de communication Claude → PMO.

Types de gates : - CONFORMITY_CHECK - AMBIGUITY - EXCEPTION - CLOSURE

Contenu transmis : - dossier de livraison consolidé, - hypothèses déclarées, - preuves de conformité.

6. Verdict PMO (format canonique)¶

pmo_verdict:
  workflow: US-XX
  status: NON_CONFORME | RESERVE | GO | ESCALADE
  reason: "Règle INV-04 violée"
  required_action: "Clarifier garantie de cohérence"
  escalation: true|false

7. Cohabitation des agents – règles strictes¶

Les agents ne dialoguent jamais entre eux.
Chaque agent produit une vérité partielle indépendante.
Claude est le seul médiateur.
Les conflits sont rendus visibles, jamais lissés.

8. Gestion du code¶

8.1 Frontières de code¶

Aucun fichier n’est modifié par deux agents.
Les interactions passent par des interfaces contractuelles.

8.2 Code Contract (exemple)¶

code_contract:
  module: storage-layer
  interfaces:
    - KeyProvider
  invariants:
    - "No plaintext key outside HSM"
  forbidden:
    - "Direct filesystem access"

9. Rôle de Claude vis‑à‑vis du code¶

Claude : - définit l’architecture, - vérifie la complétude, - assemble les composants, - documente.

Claude n’est pas le codeur principal.

10. Tableau de bord PMO (VS Code)¶

Une extension VS Code dédiée : - agrège les verdicts PMO multi‑workflow, - affiche les statuts globaux, - met en évidence les actions humaines requises, - permet la navigation vers les artefacts.

Le tableau de bord est : - passif, - non décisionnel, - centré sur la gouvernance.

11. Bénéfices clés¶

autonomie maximale des workflows,
réduction drastique du bruit cognitif,
coût prévisible,
souveraineté des données,
auditabilité et crédibilité long terme.

12. Principe clé final¶

Les agents produisent.
Claude orchestre.
Le PMO juge.
L’humain tranche.

Ce document constitue la base normative pour toute implémentation future.