CLAUDE.md Task Delegation — economiser 50% de tokens via subagents¶
Resume¶
Pawel Huryn partage un bloc CLAUDE.md pour optimiser la delegation de taches aux subagents Claude Code. Promesse : -50% de tokens en une semaine. Le principe : spawner des subagents pour isoler le contexte et paralleliser, mais PAS quand le raisonnement de synthese doit rester dans le parent.
Contenu du bloc (version corrigee)¶
## Task Delegation
Spawn subagents to isolate context, parallelize independent work, or offload
bulk mechanical tasks. Don't spawn when the parent needs the reasoning, when
synthesis requires holding things together, or when spawn overhead exceeds
the task cost.
Correction en thread : la version initiale contenait des regles anti-recursion (subagents qui ne spawnent pas de subagents). Huryn les a retirees apres decouverte que Claude Code les bloque nativement ("subagents cannot spawn other subagents" — doc officielle).
Points techniques interessants du thread¶
- Subagent = contexte isole. Le parent conversation est perdu. CLAUDE.md + env sont conserves (caches). C'est par design : la compression est la feature.
CLAUDE_CODE_FORK_SUBAGENT=1: flag experimental qui preserve le prefixe entier de la conversation dans le subagent. Nouveau, a tester./compactagressif : Huryn compact avant 200K, apres chaque etape majeure. Pas a 80% du contexte.- Delegation vers d'autres modeles : Huryn delegue a d'autres modeles pour la generation d'images (via skills/tools). Pattern multi-modele, pas juste multi-agent.
Analyse critique¶
Ce qui est solide :
- Le principe "spawner pour isoler, pas pour deleguer du jugement" est juste. C'est exactement ce qu'on fait en step 6b : chaque agent a un perimetre strict, invariants a respecter, pas de communication inter-agents.
- Le flag
CLAUDE_CODE_FORK_SUBAGENT=1est a tester — il pourrait ameliorer la qualite des subagents en step 6b en preservant le contexte spec/plan au lieu de le reinjecter via prompt.
Ce qui est exagere :
- "50% de tokens" est un claim marketing. Le gain reel depend du workflow. Sur un workflow deja optimise (cache-first, subagents isoles), le gain marginal sera plus faible.
- Le bloc CLAUDE.md propose est tres generique. Nos regles d'assemblage cache-first (
workflow-rules.md) sont plus specifiques et plus efficaces.
Pertinence ProbatioVault¶
Modere — 2 points a evaluer.
-
CLAUDE_CODE_FORK_SUBAGENT=1: a tester sur step 6b. Si le fork preserve le prefixe (spec + tests + plan + contracts), ca eliminerait le besoin de le reinjecter dans chaque prompt agent. Gain potentiel en tokens ET en coherence. -
/compactagressif : notre workflow ne compact pas explicitement entre les etapes. A evaluer si un compact systematique apres chaque step reduirait la derive sur les sessions longues (One Ring).