Aller au contenu

oh-my-claudecode + dev-browser : orchestration multi-agents et browser sandbox pour Claude Code

Resume

Deux outils qui etendent Claude Code dans des directions complementaires. oh-my-claudecode est un framework d'orchestration multi-agents : 19+ agents specialises, routing automatique multi-modeles (Claude, Codex, Gemini), execution parallele via tmux, apprentissage par extraction de patterns en skills reutilisables. HUD temps reel + analytics cout/tokens. dev-browser est un CLI qui donne aux agents un navigateur sandbox via Playwright dans QuickJS WASM — plus rapide et moins couteux que les alternatives MCP, sessions persistantes, connexion a Chrome existant.

Analyse critique

oh-my-claudecode :

L'approche multi-LLM (Claude + Codex + Gemini en parallele) est le vrai differenciateur. L'orchestration tmux avec workers paralleles est similaire a ce que ProbatioVault fait avec /gov-lord (One Ring + Ringbearers), mais en plus generaliste. Les 19+ agents specialises et le routing automatique de modeles sont ambitieux. Le skill learning (extraction de patterns gagnants en fichiers portables) rappelle OpenSpace mais en local.

A nuancer : le projet est jeune, la qualite de l'orchestration multi-LLM depend enormement du routing — envoyer la mauvaise tache au mauvais modele est pire que pas d'orchestration du tout.

dev-browser :

Le sandwich Playwright + QuickJS WASM est malin : l'agent ecrit du JavaScript qui s'execute dans un sandbox isole (pas d'acces au systeme hote). Plus leger que lancer un serveur MCP Playwright complet. Sessions persistantes = un agent peut reprendre une navigation en cours. La connexion a un Chrome existant evite de relancer un navigateur a chaque tache.

Le claim "plus rapide et moins couteux que les alternatives MCP" est plausible : QuickJS WASM a moins d'overhead que le protocole MCP complet, et le sandbox est plus leger qu'un browser headless lance par MCP.

Pertinence ProbatioVault

Impact modere sur deux axes :

  1. oh-my-claudecode vs /gov-lord (TODO #24) : Notre architecture One Ring + Ringbearers via claude-peers-mcp est plus structuree (workflow 11 etapes, gates PMO, Jira sync). Mais oh-my-claudecode montre que le multi-LLM routing est faisable et utile. A surveiller pour le routing Claude/Codex dans les step 6b (agents implementation). Le HUD temps reel et les analytics cout/tokens sont des features qu'on pourrait adapter.

  2. dev-browser vs Playwright MCP Evaluator (TODO #9b) : dev-browser pourrait etre une alternative plus legere a notre plan d'utiliser @playwright/mcp pour l'evaluateur UI (step 7 Phase 2). Avantage : sandbox natif, pas de serveur MCP a lancer, sessions persistantes. A tester avant de coder le wrapper run-playwright-evaluator.sh.