Claude Sonnet 4.5 de Anthrope Claude CODE por hasta 30 horas seguidas

El Paisaje de IA continúa su rápido crecimiento con el lanzamiento de Tirar Soneto 4.5, AntrópicoEl último modelo de lenguaje grande principal. La compañía ha hecho un reclamo audaz, describiendo el nuevo modelo como el «mejor modelo de codificación del mundo». Uno de sus aspectos más destacados es su capacidad para codificar sin parar por hasta 30 horas.

Claude Sonnet 4.5 llega solo meses Después de su predecesor, soneto 4. Sin embargo, muestra un salto significativo en la capacidad, especialmente para los desarrolladores. El modelo puntúa un 77.2% en el punto de referencia verificado SWE-Bench. Este último prueba la capacidad de una IA para manejar las solicitudes de extracción de GitHub en el mundo real. Según los informes, esta puntuación permite a Sonnet 4.5 superar los modelos competitivos de Opadai y Google en tareas de codificación.

Además, el modelo ahora lidera el punto de referencia OSWorld, una prueba que mide las tareas de uso de la computadora del mundo real, con una tasa de éxito del 61.4%. Este es un aumento sustancial sobre las versiones anteriores de Claude.

Soneto Claude de Anthrope 4.5: El agente de la resistencia

Lo que realmente separa el soneto 4.5 de su competencia y los modelos anteriores de Claude es su capacidad de trabajo sostenido. Anthrope informa que el modelo ahora puede ejecutarse de manera autónoma durante hasta 30 horas, manteniendo el enfoque y el rendimiento en todo momento. Este es un aumento dramático desde el límite de siete horas visto en el buque insignia anterior, Claude Opus 4.

https://www.youtube.com/watch?v=OXFVKBB7MCG

Esta resistencia transforma el modelo de un asistente simple en un agente capaz. Según los informes, el soneto 4.5 demostró la capacidad de hacer más que simplemente escribir una aplicación. También podría ejecutar proyectos complejos de varios pasos como la implementación de servicios de bases de datos. Registró nombres de dominio e incluso realizó auditorías de seguridad SOC 2, todo sin supervisión humana.

Para apoyar este cambio hacia la autonomía, Antrópico le ha dado al modelo acceso a nuevas características. La lista incluye máquinas virtuales y memoria y una mejor gestión del contexto para procesos de larga duración.

Un ecosistema para los agentes de IA

Más allá de la actualización del modelo central, Anthrope introdujo varias herramientas diseñadas para capacitar a los desarrolladores con Claude:

Actualizaciones de código de Claude: El agente de codificación dedicado de Anthrope recibe el modelo Sonnet 4.5. Las nuevas características incluyen una extensión de código de Visual Studio para ver los cambios en tiempo real, una mejor visibilidad de estado en el terminal y los puntos de control que permiten a los usuarios revertir fácilmente los cambios en el código si el modelo comete errores.

Agente de Claude SDK: Los desarrolladores ahora pueden construir sus propios agentes de IA personalizados utilizando la misma infraestructura central que alimenta el código Claude. El SDK incluye herramientas para la orquestación de agentes, la memoria y la gestión del contexto sobre tareas extendidas.

Imagina con Claude: Anthrope lanzó este experimento temporal de alta gama para mostrar las capacidades del modelo. Permite a los suscriptores de Max interactuar con Claude, ya que genera software e interfaces de usuario en la marcha, sin código preescritado o funcionalidad predeterminada.

Anthrope sostiene que Sonnet 4.5 es su modelo «más alineado» hasta la fecha. Cuenta con grandes mejoras de seguridad diseñadas para resistir los ataques de inyección rápidos y reducir los comportamientos como la sycophancy. Sonnet 4.5 es accesible a través de la API de Claude y la aplicación web Claude.ai, con el precio que sigue siendo consistente con el modelo de soneto 4 anterior.

https://www.youtube.com/watch?v=oz-alrj0ovg

Fuente: Android Headlines

Soneto Claude de Anthrope 4.5: El agente de la resistencia

Un ecosistema para los agentes de IA

Deja un comentario Cancelar respuesta