Claw Code et le dilemme copyright du code AI-generated¶
Resume¶
Gergely Orosz (The Pragmatic Engineer, 2.2M vues) met en lumiere Claw Code : une reimplementation Python/Rust de Claude Code realisee par IA (Codex) a partir du source TypeScript leake. 156K stars GitHub. Anthropic fait des DMCA sur les repos partageant le TS original, mais la rewrite dans un autre langage pretend echapper au copyright. Gergely pose le vrai dilemme : si Anthropic revendique que Claude Code est "close to 100% AI-generated", est-ce que ce code est copyrightable ? Et si oui, ca invalide leur propre business model (les utilisateurs perdraient aussi leurs droits sur le code genere par Claude).
Analyse critique¶
Le dilemme juridique — quatre couches¶
Couche 1 : Le droit actuel (US Copyright Office, 2023-2026)
Le US Copyright Office a tranche a plusieurs reprises : les oeuvres purement generees par IA ne sont pas copyrightables. La protection copyright exige un "auteur humain" avec un degre suffisant de "creative control". Le code genere par un prompt de haut niveau ("build me an auth module") a une protection faible. Le code ecrit ligne par ligne par un humain avec assistance IA a une protection plus forte. La zone grise : le code ecrit par un humain qui utilise Claude Code en mode agentique — qui est l'auteur ?
Anthropic revendique publiquement que Claude Code ecrit "close to 100%" du code avec des "high-level prompts". C'est un aveu fatal pour le copyright : si l'humain ne fournit que le prompt, le creative control est minimal, et la protection copyright est fragile.
Couche 2 : Le paradoxe Anthropic
Si Anthropic revendique le copyright sur Claude Code (pour bloquer les rewrites), ils doivent demontrer un creative control humain suffisant. Mais ils markettent exactement l'inverse ("l'IA fait tout"). Deux positions incompatibles :
- Position marketing : "Claude Code ecrit 100% du code" → pas de copyright (pas d'auteur humain)
- Position juridique : "Nos ingenieurs ont creative control" → copyright valide, mais le marketing est mensonger
Le dilemme s'etend aux utilisateurs : si le code genere par Claude pour les clients d'Anthropic n'est pas copyrightable, c'est un risque business enorme pour tout l'ecosysteme.
Couche 3 : Le "clean-room" qui n'en est pas un
Claw Code se presente comme une "cleanroom reimplementation". C'est faux au sens juridique. Un vrai clean-room exige que les developpeurs n'aient jamais vu le code original (cf. Phoenix Technologies vs IBM BIOS, 1984). Ici, le code TS leake a ete utilise comme input direct pour Codex qui a fait la traduction. C'est une oeuvre derivee, pas un clean-room.
Comme le note @zeeg (CTO de Sentry) : "Changing copyrighted material does not void IP protections. 'Could you have implemented this without using the source code' is the easy test." La reponse est non.
Mais la defense possible : si le code original n'est pas copyrightable (couche 1), alors il n'y a pas d'oeuvre derivee a proteger.
Couche 4 : La question de la reproductibilite par IA
Le point le plus profond de Gergely : la rewrite a ete faite par Codex "in trivial amount of time". Si n'importe quel agent IA peut traduire un codebase d'un langage a un autre en quelques heures, le code source lui-meme perd sa valeur comme barriere concurrentielle. Ce qui reste :
- Les brevets (procedes, algorithmes)
- L'infrastructure non-reproductible (HSM, WORM, certifications)
- Le know-how operationnel (processus de validation, conformite)
- La marque et la confiance client
Ce que Claw Code revele sur les moats¶
| Moat | Reproductible par IA ? | Force residuelle |
|---|---|---|
| Code source | Oui (traduction triviale) | Faible |
| Architecture (patterns, decisions) | Partiellement (observable dans le code) | Moyenne |
| Infrastructure (HSM, WORM, certs) | Non (physique + reglementaire) | Forte |
| Brevets | Non (protection legale) | Forte |
| Conformite reglementaire (eIDAS, NF Z42-013) | Non (processus humain + audit) | Forte |
| Processus de validation (workflow constitutionnel) | Non (capital organisationnel) | Forte |
| Donnees client / confiance | Non (relation humaine) | Forte |
Le code est devenu le moat le plus faible. L'infra, la conformite et le processus sont les vrais moats.
Mise a jour 2026-04-08 : Le cas chardet confirme le probleme a grande echelle. Dan Blanchard a utilise Claude pour reecrire chardet (130M telechargements/mois) en 5 jours, obtenant un gain de performance x48 et passant la licence de LGPL a MIT. JPlag ne detecte que 1.3% de similarite avec le code original. L'auteur original conteste, la FSF denonce, Bruce Perens (pere de l'Open Source Definition) declare que "l'economie du logiciel est morte". Le mecanisme est identique a claw-code : une IA peut reproduire la fonctionnalite d'un logiciel sans copier le code, contournant les licences copyleft. (source: https://korben.info/chardet-quand-une-ia-reecrit-un-logiciel-open-source-en-cinq-jours-et-change-sa-licence.html, via @CamilleRoux — https://x.com/camilleroux/status/2033488450838544501)
Pertinence ProbatioVault¶
Impact modere, mais strategiquement important.
Impact direct : la copyrightabilite du code ProbatioVault¶
Notre workflow genere du code via Claude (etape 6, jusqu'a 17 agents). La question "est-ce que ce code est copyrightable" nous concerne directement. Trois elements attenuants :
- Nos specs sont humaines (etape 0, PO). Le creative control vient des specifications detaillees, des invariants, des code contracts — pas du code lui-meme.
- La tracabilite est totale (Art. III). On peut demontrer le processus humain derriere chaque decision architecturale (besoin → spec → plan → implementation → review).
- Le code est valide par des humains via les gates PMO. Le jugement humain est documente.
Impact indirect : la valeur probatoire des artefacts logiciels¶
ProbatioVault est un produit de preuve numerique. Si un client veut prouver la paternite de son code et que ce code est AI-generated, la force probante depend de la capacite a demontrer le creative control humain. Notre workflow de gouvernance (11 etapes, tracabilite complete, validation humaine) est exactement le type de processus qui renforce la force probante d'un artefact AI-generated.
Positionnement strategique : ce qui protege ProbatioVault¶
Le code est reproductible. Ce qui ne l'est pas :
- Le brevet sur le procede de scellement probatoire
- L'architecture physique : WORM (immutabilite), HSM (signature materielle), chaine de conformite
- La conformite : eIDAS, NF Z42-013, certifications — un moat reglementaire non-reproductible par IA
- Le workflow constitutionnel : 20+ stories de gouvernance, learnings, invariants. Le capital organisationnel qui garantit que le code est correct, pas juste genere
- La spirale sycophantique (cf. paper MIT archive aujourd'hui) : un agent IA peut reproduire du code, mais il ne peut pas reproduire le processus de validation adversariale qui garantit que le code est correct. C'est exactement ce que notre Art. II (separation des pouvoirs) assure.
Action potentielle¶
Envisager une story dediee : documenter formellement le processus de creative control humain dans le workflow ProbatioVault, pour renforcer la position copyright sur les livrables generes. La tracabilite existe deja (Art. III) — il s'agirait de la formaliser comme preuve de creative control au sens du Copyright Office.