Una reciente filtración de datos del desarrollador de IA Anthropic ha revelado detalles sobre su modelo de próxima generación, Claude Mythos, lo que confirma las especulaciones sobre un salto significativo en las capacidades de IA. La filtración, inicialmente reportada por Fortune, incluía casi 3.000 documentos internos, imágenes y borradores inéditos, exponiendo tanto los lanzamientos de productos planificados como las preocupaciones internas de ciberseguridad.
La filtración y sus orígenes
El incidente se debió a un sistema de gestión de contenidos (CMS) mal configurado. Anthropic subió los datos, pero no logró restringir el acceso público, lo que resultó en la exposición de activos internos sensibles. Estos incluían detalles de los empleados, invitaciones a eventos y, lo más importante, una publicación de blog inédita que describe las capacidades de Claude Mythos.
Claude Mythos: un “cambio radical” en el rendimiento de la IA
Anthropic describe a Claude Mythos como “con diferencia, el modelo de IA más potente que jamás hayamos desarrollado ” y un “cambio radical” en el rendimiento. El modelo se encuentra actualmente en pruebas de acceso temprano con clientes selectos. La filtración también detalla los planes para un nuevo nivel de IA, Capybara, posicionado incluso por encima del modelo Opus actual de Anthropic, que ya se encuentra entre los más avanzados disponibles comercialmente.
Preocupaciones por la ciberseguridad: exploits impulsados por la IA
Los documentos filtrados resaltan los temores internos de Anthropic de que las capacidades avanzadas de Claude Mythos puedan convertirse en armas. La compañía cree que el modelo está “actualmente muy por delante de cualquier otro modelo de IA en capacidades cibernéticas ” y anticipa una “próxima ola de modelos que pueden explotar vulnerabilidades de maneras que superan con creces los esfuerzos de los defensores”. Anthropic comparte de forma proactiva el acceso temprano con las organizaciones para ayudarlas a reforzar sus defensas contra posibles ciberataques impulsados por la IA.
“Al prepararnos para liberar a Claude Capybara, queremos actuar con especial precaución y comprender los riesgos que plantea, incluso más allá de lo que aprendemos en nuestras propias pruebas”.
Este enfoque proactivo subraya la gravedad de la amenaza y sugiere que la próxima generación de IA podría presentar desafíos de ciberseguridad sin precedentes. Los datos filtrados confirman que el siguiente paso en el desarrollo de la IA no consiste sólo en superar los límites, sino también en mitigar preventivamente los riesgos de una tecnología que está evolucionando más rápido de lo que las defensas de seguridad pueden seguir el ritmo.
El lanzamiento de Claude Mythos probablemente remodelará el panorama competitivo de la IA, pero las preocupaciones de seguridad asociadas también señalan la necesidad de una cooperación en toda la industria para garantizar un desarrollo y un despliegue responsables.
