Aller au contenu

PD-273 — Retour d'expérience

1. Résumé

PD-273 a corrigé 3 checks Prolog de conformité PV-AUDIT-001 passant de PARTIEL à OK (24/24 conforme). Les 3 gates ont convergé en v1 (GO) avec des scores moyens de 8.875, 9.0 et 9.125.

2. Métriques

  • Durée : ~2h (partie d'une session batch de 3 stories)
  • Gates : 3 gates, 3 GO en v1 (0 itération de correction)
  • Fichiers modifiés : 4 (1 Python, 2 Prolog, 1 TypeScript)
  • Lignes modifiées : ~20 lignes

3. Points forts

  1. Approche hybride efficace : Combiner modification de extract-facts.py + modification Prolog + alias TypeScript couvre les 3 gaps avec des changements minimaux.
  2. Prolog comme test déterministe : Le rapport run_audit. fournit une preuve de conformité immédiate et reproductible.
  3. Convergence v1 systématique : Comme PD-272, les stories de conformité formelle convergent en v1 (pattern confirmé sur 2/2 stories).

4. Points d'amélioration

  1. Reviews LLM surestiment les écarts sur les stories Prolog : Les reviews P1 (Gates ⅗/8) ont produit 70-80% de faux positifs, principalement car le contexte "conformité formelle Prolog" est mal compris par les LLM reviewers.
  2. OpenCode external_directory : Le problème d'accès aux fichiers hors du projet principal persiste. Les reviews/plans sont souvent écrits dans le mauvais répertoire.

5. Learnings

  • [PROLOG AUDIT] Normaliser les atomes dans extract-facts.py évite les écarts sémantiques entre faits générés et règles Prolog
  • [PROLOG AUDIT] Ajouter un alias TypeScript est plus sûr que modifier la règle Prolog quand le nom de méthode est spécifique
  • [PROLOG AUDIT] Les stories de conformité formelle convergent systématiquement en v1 — pattern pour PD-274

6. Gates

Gate Score Verdict Itérations
3 (CONFORMITY_CHECK) 8.875 GO 1
5 (AMBIGUITY) 9.0 GO 1
8 (CLOSURE) 9.125 GO 1

7. Faux positifs par gate

Gate Total écarts P1 Faux positifs Taux
3 10 7 70%
5 8 7 87.5%
8 1 0 0%

8. Dépendances

  • PD-272 (DONE) : même pattern de correction (trigger immutabilité)
  • PD-250 (DONE) : séquence audit_destruction_seq créée

9. Recommandations pour PD-274

  1. Appliquer la même approche hybride (extract-facts + Prolog + code backend)
  2. S'attendre à un taux de faux positifs élevé dans les reviews LLM
  3. Le run Prolog swipl est la preuve de conformité définitive

10. Améliorations process

10.1 Contexte Prolog pour reviews LLM (moyenne)

Fichier cible : templates/prompts/gate-review-*.md Modification : Injecter une note contextuelle pour les stories domaine crypto-proof : "Ce domaine utilise des checks Prolog déterministes. Les 'codes d'erreur' et 'mécanismes de détection' sont des conventions de la spec, pas des features à implémenter." ROI estimé : Réduction de 50% des faux positifs en Gate ⅝

10.2 Template besoin conformité formelle (basse)

Fichier cible : templates/outputs/PD-XX-besoin-formel.md Modification : Créer un template spécialisé pour les stories de conformité formelle (gap analysis → spec → correction → run Prolog) ROI estimé : Accélération étape 0-1