Claude Sonnet 4.5 est aussi, selon le géant américain, le modèle le plus avancé pour développer des agents IA en mesure de prendre des décisions dans des situations inédites.
La course à la performance entre les intelligences artificielles (IA) génératives poursuit son rythme effréné. La start-up américaine Anthropic a annoncé lundi le lancement de son nouveau modèle, baptisé Claude Sonnet 4.5 et présenté comme le meilleur au monde pour la programmation informatique. Cette nouvelle génération de modèle de langage (LLM) peut fonctionner en autonomie durant 30 heures d'affilée une fois chargé d'une mission, alors que la version la plus puissante d'Anthropic jusqu'ici, Claude 4 Opus, ne tenait que 7 heures.
À découvrir PODCAST - Écoutez le dernier épisode de notre série Questions Tech
Des programmes d'IA générative peuvent fonctionner seuls plusieurs heures car ils évaluent régulièrement leur propre production et y apportent d'eux-mêmes des changements et des corrections. Claude Sonnet 4.5 a enregistré le meilleur score une fois soumis au système d'évaluation indépendante SWE-Bench Verified, mis au point par des chercheurs des universités américaines de Princeton et Stanford.
Publicité
Anthropic a été créé début 2021 par des anciens d'OpenAI qui estimaient que leur ancien employeur ne faisait pas assez pour contrôler et prévenir les dérives possibles de ses modèles. Depuis novembre 2022 et l'arrivée de ChatGPT (construit sur le modèle GPT-3.5) d'OpenAI, les grands acteurs de l'IA générative se sont lancés dans une course effrénée, qui voit de nouveaux modèles sortir toutes les semaines avec des capacités plus étendues.
Agents IA en mesure de prendre de décisions
Alors qu'Anthropic était considéré, depuis plusieurs mois, comme le plus performant en matière d'IA générative de code informatique, OpenAI a récemment refait son retard. Son assistant le plus récent, GPT-5, lancé début août, arrivait ainsi en tête, jusqu'ici, de certains classements en matière de programmation générée par IA. Claude Sonnet 4.5 est aussi, toujours selon Anthropic, le modèle le plus avancé pour développer des agents IA en mesure de prendre des décisions dans des situations inédites («real-world agents»), pour lesquelles ils n'ont pas été programmés.
La nouvelle cuvée d'Anthropic est également la plus sophistiquée pour les applications qui permettent à un assistant IA d'utiliser un ordinateur comme le ferait un humain («computer use»). Sur demande en langage courant, l'interface peut ainsi faire une recherche sur Google ou effectuer des démarches en ligne en utilisant des informations tirées de l'ordinateur. Cette nouvelle fonctionnalité avait été proposée pour la première fois par Anthropic en octobre 2024. OpenAI a mis en ligne un produit équivalent, Operator, en janvier 2025, suivi, en mars, par Manus, créé par des chercheurs chinois, puis par le Project Mariner de Google, en mai.
[SRC] https://www.lefigaro.fr/secteur/high-tech/anthropic-devoile-le-meilleur-modele-d-ia-au-monde-pour-la-programmation-20250929