Anthropic Leaks Detalhes de sua IA mais poderosa: Claude Mythos

11

Um recente vazamento de dados do desenvolvedor de IA Anthropic revelou detalhes sobre seu modelo de próxima geração, Claude Mythos, confirmando as especulações sobre um salto significativo nas capacidades de IA. O vazamento, inicialmente relatado pela Fortune, incluiu quase 3.000 documentos internos, imagens e rascunhos não publicados, expondo tanto lançamentos planejados de produtos quanto preocupações internas de segurança cibernética.

O vazamento e suas origens

O incidente resultou de um sistema de gerenciamento de conteúdo (CMS) mal configurado. A Anthropic carregou os dados, mas não conseguiu restringir o acesso público, resultando na exposição de ativos internos confidenciais. Isso incluía detalhes de funcionários, convites para eventos e, o mais importante, uma postagem de blog não publicada descrevendo as capacidades de Claude Mythos.

Claude Mythos: Uma “mudança radical” no desempenho da IA

A Anthropic descreve Claude Mythos como “de longe o modelo de IA mais poderoso que já desenvolvemos ” e uma “mudança radical” no desempenho. O modelo está atualmente em testes de acesso antecipado com clientes selecionados. O vazamento também detalha os planos para um novo nível de IA, Capybara, posicionado ainda acima do atual modelo Opus da Anthropic, que já está entre os mais avançados disponíveis comercialmente.

Preocupações com segurança cibernética: explorações baseadas em IA

Os documentos vazados destacam os temores internos da Anthropic de que as capacidades avançadas de Claude Mythos possam ser transformadas em armas. A empresa acredita que o modelo está “atualmente muito à frente de qualquer outro modelo de IA em capacidades cibernéticas ” e antecipa uma “próxima onda de modelos que podem explorar vulnerabilidades de maneiras que superam em muito os esforços dos defensores”. A Anthropic está compartilhando proativamente o acesso antecipado com as organizações para ajudá-las a reforçar suas defesas contra possíveis ataques cibernéticos impulsionados por IA.

“Ao nos prepararmos para libertar Claude Capybara, queremos agir com cautela extra e compreender os riscos que isso representa – mesmo além do que aprendemos em nossos próprios testes.”

Esta abordagem proativa sublinha a gravidade da ameaça e sugere que a próxima geração de IA poderá introduzir desafios de segurança cibernética sem precedentes. Os dados divulgados confirmam que o próximo passo no desenvolvimento da IA ​​não se trata apenas de ultrapassar limites, mas também de mitigar preventivamente os riscos de uma tecnologia que está a evoluir mais rapidamente do que as defesas de segurança conseguem acompanhar.

A libertação de Claude Mythos provavelmente remodelará o cenário competitivo da IA, mas as preocupações de segurança associadas também sinalizam a necessidade de cooperação em toda a indústria para garantir o desenvolvimento e a implantação responsáveis.