Creer un langage de programmation entier avec Claude Code¶
Resume¶
Ankur Sethi a construit "Cutlet", un langage de programmation complet (compilateur bytecode, GC mark-and-sweep, heritage prototypal, vectorisation via meta-operateur @) en 4 semaines avec Claude Code. Sa methodologie : conversation exploratoire → plan atomique ecrit dans plans/doing/ → review humaine → execution agentique en Docker isole. Guardrails : tests generes avant le code, ASan/UBSan/LSan, clang-tidy, scripts d'introspection du pipeline compilateur. Le critere de selection du probleme : "les criteres de succes sont-ils verifiables automatiquement ?"
Analyse critique¶
L'article est un vrai signal. La methodologie est rigoureuse et documentee : l'humain designe, revoit les plans, pose les guardrails. Claude execute. Le critere de selection du probleme est pertinent — un compilateur est ideal pour les LLM (tres documente, tres contraint, testable deterministe).
Ce qui merite du recul :
- Pas from scratch : Cutlet est largement inspire de Lua/Python, presents dans les donnees d'entrainement. Claude ne "cree" pas un langage, il recombine des patterns connus. Impressionnant, mais pas de la creation ex nihilo.
- Domaine ideal : compilateurs = testable automatiquement. Ca ne se transfere pas a tous les domaines (l'auteur le reconnait — ses experiences sur les UI ont echoue).
- Cout absent : 4 semaines de Claude Code en mode agentique Docker non supervise, pas de chiffrage en tokens/dollars.
- Limites techniques : pas de gestion d'erreurs complete, pas d'I/O fichier. Claude ignore les outils de navigation (
ctags,cscope) et preferegrep.
L'honnetete sur l'attribution est rare : "je ne considere pas que c'est mon travail". La reflexion sur la dependance comportementale ("comme une machine a sous") est aussi une nuance qu'on voit rarement dans ce type de retour.
Pertinence ProbatioVault¶
Impact modere — l'approche valide notre workflow de gouvernance :
- Plans atomiques + review humaine = notre etape 4 (plan) + gate 5
- Tests avant code = notre etape 2 (tests) avant etape 6 (implementation)
- Isolation agentique = notre
claude -pen subprocess
La difference fondamentale : Sethi fait confiance a un seul agent sans validation croisee. Ca marche parce que le compilateur a des tests deterministes. Sur du code metier sans suite de tests exhaustive (notre cas : crypto, blockchain, conformite legale), la separation auteur/revieweur (Art. II) reste indispensable.