Aller au contenu

Claude Opus/Sonnet 4.6 — 1 million de tokens en GA sans surcoût

Resume

Anthropic lance en disponibilité générale la fenêtre de contexte 1M tokens pour Claude Opus 4.6 et Sonnet 4.6. Tarif standard appliqué sur toute la fenêtre ($5/$25 pour Opus, $3/$15 pour Sonnet par million de tokens), sans premium long-context. Limite médias passée de 100 à 600 images/PDFs. Performance : 78,3% sur MRCR v2, meilleur score frontier à cette longueur de contexte. Max, Team et Enterprise accèdent automatiquement à la fenêtre complète avec moins de compactions de contexte.

Analyse critique

Ce qui change concrètement :

Le pricing était le vrai frein. Un contexte de 800K tokens coûtait historiquement 2-3x le prix standard. Maintenant : tarif plat quelle que soit la longueur. Pour des workflows avec des prompts de 200K-400K tokens (code review multi-fichiers, spec + plan + code), l'équation économique change fondamentalement.

La capacité 6x des médias (100 → 600 images/PDF) signale que le cas d'usage de référence est l'analyse de documents volumineux, pas seulement le code.

Ce qui mérite attention :

78,3% sur MRCR v2 est le score affiché mais MRCR (Multi-hop Reasoning and Comprehension) est un benchmark Anthropic. À prendre avec prudence — les benchmarks propriétaires sur longues fenêtres sont difficiles à vérifier indépendamment.

La note sur les compactions : "reducing context compactions for Max/Team/Enterprise users" — c'est honnête d'Anthropic. Les compactions restent une réalité pour les sessions très longues, le 1M token ne les supprime pas entièrement.

Pertinence ProbatioVault

Impact fort et immédiat.

Workflow de gouvernance :

Etape Contexte estimé Impact 1M
Gate ⅗/8 (spec + tests + plan + code) ~80K-150K Plus de découpage artificiel
Step 6b (spec + contracts + code multi-agents) ~200K-400K Prompt cache-first optimal
REX consolidé multi-stories ~100K-200K Analyse croisée sans limitation

Les 600 images/PDF permettent d'inclure certificats, exports, captures UI dans les reviews d'acceptabilité sans tronquer.

Coût estimé : un prompt gate complet à 300K tokens → ~$0.45 (Sonnet) ou ~$0.75 (Opus). Pas de surcoût vs avant. Actionnable dès maintenant.