Anthropic Lanza Claude Sonnet 4.5: Calificado como el "Mejor Modelo de Programación del Mundo" pese a Ser Vulnerado

Anthropic Lanza Claude Sonnet 4.5: El Mejor Modelo de Programación del Mundo

Anthropic ha lanzado Claude Sonnet 4.5, un nuevo modelo de inteligencia artificial que la empresa califica como "el mejor modelo de programación del mundo". Este lanzamiento, anunciado el lunes, incluye nuevas herramientas para desarrolladores y destaca por su capacidad de concentrarse durante más de 30 horas en tareas complejas.

Rendimiento Superior en Benchmarks de Programación

El modelo Claude Sonnet 4.5 obtuvo un impresionante 77,2% en el benchmark SWE-bench Verified, superando a las ofertas de OpenAI, Google, e incluso al propio Claude 4.1 Opus de Anthropic. Al utilizar test-time compute paralelo, esta puntuación se eleva al 82%. Además, lidera en OSWorld con una puntuación del 61,4%, un benchmark que evalúa modelos de IA en tareas informáticas del mundo real.

Nuevas Funciones y Herramientas para Desarrolladores

Junto con el nuevo modelo, Anthropic ha introducido varias funciones nuevas. Claude Code ahora incluye puntos de control, permitiendo a los usuarios guardar el progreso y retroceder a estados anteriores. La empresa también ha actualizado la interfaz de terminal y lanzado una extensión nativa de VS Code. La API de Claude ahora cuenta con una función de edición de contexto y una herramienta de memoria.

Claude Code: Incluye puntos de control para guardar y retroceder en el progreso.
Interfaz de Terminal Actualizada: Mejora la experiencia de desarrollo.
Extensión Nativa de VS Code: Facilita la integración con entornos de desarrollo populares.
API de Claude: Incorpora edición de contexto y herramienta de memoria para mayor complejidad.

Mejoras en Alineación y Seguridad

Anthropic enfatiza que Claude Sonnet 4.5 es su modelo más alineado hasta la fecha, con mejoras sustanciales en la reducción de comportamientos problemáticos como la adulación, el engaño y la búsqueda de poder. Aunque fue vulnerado en minutos por jailbreaking, la empresa ha realizado avances en la defensa contra ataques de inyección de prompt.

Disponibilidad y Costos

Claude Sonnet 4.5 ya está disponible para usuarios generales a través de la web Claude.ai y en aplicaciones móviles para iOS y Android. El precio se mantiene sin cambios respecto a Claude Sonnet 4: $3 por millón de tokens de entrada y $15 por millón de tokens de salida. Los desarrolladores pueden acceder al modelo a través de la Claude Developer Platform, Amazon Bedrock y Google Cloud Vertex AI.

Aplicaciones Prácticas en Diversos Sectores

El alcance de Claude 4.5 se extiende a diversos ámbitos especializados, consolidando su utilidad más allá de la programación. Entre las aplicaciones destacan la ciberseguridad (detección y corrección automática de vulnerabilidades), las finanzas (monitorización de cambios regulatorios y gestión de riesgos), la productividad (edición avanzada de archivos de oficina), la investigación (integración de grandes volúmenes de datos) y la generación de contenidos (análisis semántico preciso).

"Imagine with Claude": Un Vistazo al Futuro

Anthropic también está lanzando una vista previa de investigación temporal llamada "Imagine with Claude", disponible para suscriptores Max durante cinco días. En este experimento, Claude genera software sobre la marcha, respondiendo y adaptándose a las solicitudes de los usuarios en tiempo real, demostrando el potencial de combinar el modelo con la infraestructura adecuada.

Anthropic Lanza Claude Sonnet 4.5: Calificado como el "Mejor Modelo de Programación del Mundo" pese a Ser Vulnerado

Anthropic Lanza Claude Sonnet 4.5: El Mejor Modelo de Programación del Mundo

Rendimiento Superior en Benchmarks de Programación

Nuevas Funciones y Herramientas para Desarrolladores

Mejoras en Alineación y Seguridad

Disponibilidad y Costos

Aplicaciones Prácticas en Diversos Sectores

"Imagine with Claude": Un Vistazo al Futuro

Related Articles

YouTube Lanza Nuevas Herramientas de Inteligencia Artificial para Creadores

Google Lanza Mixboard: Lienzo Creativo Impulsado por IA que Democratiza el Diseño Digital

Zero-Click SEO y 'Jardines Amurallados' Transforman el Tráfico Web y Desafían a Marcas

Ethereum Faces Validator Gridlock Amid Surging AI and Institutional Crypto Adoption

Anthropic Dévoile Claude Sonnet 4.5: Le Modèle d'IA le Plus Avancé au Monde pour la Programmation

Informe de Google Revela que 90% de Profesionales Tecnológicos Usan IA, Pero Persiste Desconfianza en Calidad de Código

Google Revela: 90% de Profesionales Tecnológicos Ya Usa IA, Transformando Desarrollo y Empleo