Anthropic lanza Claude Opus 4.7: una nueva frontera en razonamiento y codificación

12

Anthropic ha acelerado su ciclo de lanzamiento en 2026 con el anuncio de Claude Opus 4.7. Posicionado como el modelo más inteligente de la compañía disponible para el público, el nuevo lanzamiento marca un importante paso adelante en el razonamiento híbrido, aunque ocupa un lugar único en la jerarquía de inteligencia de Anthropic.

La Jerarquía de la Inteligencia: Opus vs. Mythos

Para comprender la importancia de esta versión, es importante tener en cuenta que Opus 4.7 no es el modelo más poderoso de Anthropic. La compañía desarrolló recientemente Claude Mythos, un modelo que demuestra niveles de inteligencia aún más altos, pero que se ha considerado potencialmente demasiado peligroso para su divulgación al público en general.

En consecuencia, Opus 4.7 sirve como el “techo” actual para una IA segura y orientada al consumidor, actuando como un puente entre los modelos de razonamiento estándar y el nivel Mythos experimental y de alta capacidad.

Mejoras y capacidades clave

Claude Opus 4.7 está diseñado para razonamientos complejos de varios pasos y tareas técnicas de alto nivel. Según Anthropic, el modelo destaca en varias áreas específicas:

  • Codificación avanzada: Según se informa, los usuarios pueden delegar proyectos de codificación complejos y de larga duración al modelo con mayor confianza, ya que ahora puede verificar sus propios resultados y seguir instrucciones complejas con mayor rigor.
  • Inteligencia visual y documental: El modelo muestra marcadas mejoras en el análisis de datos visuales y el procesamiento de documentos densos.
  • Profesionalismo creativo: Anthropic describe el modelo como “de más buen gusto”, destacando un mejor rendimiento en la generación de activos profesionales de alta calidad, como presentaciones de diapositivas, interfaces de usuario y documentos.

Nota sobre el uso de tokens: Si bien el precio sigue siendo idéntico al de su predecesor (Opus 4.6), los usuarios deben tener en cuenta que Opus 4.7 “piensa más” en niveles de esfuerzo más altos. Este proceso de razonamiento más profundo da como resultado un mayor consumo de tokens de salida, lo que puede afectar los costos para los usuarios de API.

Rendimiento de referencia: cómo se compara

En una tarjeta modelo detallada, Anthropic comparó Opus 4.7 con otros líderes de la industria, incluidos Gemini 3.1 Pro de Google y GPT-5-4 Pro de OpenAI.

En el desafiante punto de referencia El último examen de la humanidad (HLE), una prueba diseñada para medir la dificultad extrema, Opus 4.7 ocupa una posición competitiva. Sin el uso de herramientas externas, los resultados son los siguientes:

Modelo Puntuación HLE (sin herramientas)
Claude Mitos 56,8%
Claude Opus 4.7 46,9%
Géminis 3.1 Pro 44,4%
GPT-5-4 Pro 42,7%
Claude Opus 4.6 40,0%

Cuando se utilizan herramientas, el panorama cambia ligeramente, con GPT-5-4 Pro liderando el grupo de consumidores con un 58,7%, mientras que Opus 4.7 le sigue con un 54,7%. Vale la pena señalar que Anthropic aclara que Opus 4.7 sigue las tendencias de capacidad existentes en lugar de representar un salto repentino y exponencial en el desarrollo de la IA.

Seguridad, Honestidad y Alucinaciones

Un pilar central del desarrollo de Anthropic es la “Seguridad de la IA”. Con la actualización 4.7, la empresa se ha centrado en gran medida en reducir los defectos inherentes a los modelos de lenguaje grandes:

  1. Alucinaciones reducidas: Según se informa, el modelo es más factual y es menos probable que invente información incorrecta.
  2. Mayor honestidad: Anthropic informa una reducción significativa en “omisiones importantes”, instancias en las que un modelo no menciona una información crucial.
  3. Menor piratería de recompensas: El modelo muestra una menor tendencia a encontrar “atajos” para satisfacer un mensaje que se desvía de la intención real del usuario.

Disponibilidad

Claude Opus 4.7 está disponible inmediatamente a través de los siguientes canales:
Claude AI (interfaz web)
Claude API
Microsoft Foundry y otros socios de Anthropic


Conclusión: Claude Opus 4.7 se establece como un modelo de razonamiento de nivel profesional altamente capaz que prioriza la confiabilidad y la precisión de la codificación, incluso cuando Anthropic mantiene su tecnología “Mythos” más poderosa en reserva por razones de seguridad.