Anthropic rivela dettagli sulla sua intelligenza artificiale più potente: Claude Mythos

14

Una recente fuga di dati da parte dello sviluppatore di intelligenza artificiale Anthropic ha rivelato dettagli sul suo modello di prossima generazione, Claude Mythos, confermando le speculazioni su un salto significativo nelle capacità di intelligenza artificiale. La fuga di notizie, inizialmente segnalata da Fortune, includeva quasi 3.000 documenti interni, immagini e bozze inedite, esponendo sia i rilasci pianificati dei prodotti che le preoccupazioni interne sulla sicurezza informatica.

La fuga di notizie e le sue origini

L’incidente è derivato da un sistema di gestione dei contenuti (CMS) configurato in modo errato. Anthropic ha caricato i dati, ma non è riuscita a limitare l’accesso pubblico, con conseguente esposizione di risorse interne sensibili. Questi includevano dettagli sui dipendenti, inviti a eventi e, soprattutto, un post inedito sul blog che descriveva le capacità di Claude Mythos.

Claude Mythos: un “cambio di passo” nelle prestazioni dell’intelligenza artificiale

Anthropic descrive Claude Mythos come “di gran lunga il modello di intelligenza artificiale più potente che abbiamo mai sviluppato ” e un “cambio di passo” nelle prestazioni. Il modello è attualmente in fase di prova ad accesso anticipato con clienti selezionati. La fuga di notizie descrive inoltre in dettaglio i piani per un nuovo livello di intelligenza artificiale, Capybara, posizionato addirittura sopra l’attuale modello Opus di Anthropic, che è già tra i più avanzati disponibili in commercio.

Preoccupazioni relative alla sicurezza informatica: exploit guidati dall’intelligenza artificiale

I documenti trapelati evidenziano i timori interni di Anthropic secondo cui le capacità avanzate di Claude Mythos potrebbero essere utilizzate come armi. L’azienda ritiene che il modello sia “attualmente molto più avanti rispetto a qualsiasi altro modello di intelligenza artificiale in termini di capacità informatiche ” e prevede “un’ondata imminente di modelli in grado di sfruttare le vulnerabilità in modi che superano di gran lunga gli sforzi dei difensori”. Anthropic sta condividendo in modo proattivo l’accesso anticipato con le organizzazioni per aiutarle a rafforzare le loro difese contro potenziali attacchi informatici guidati dall’intelligenza artificiale.

“Nel prepararci a rilasciare Claude Capybara, vogliamo agire con particolare cautela e comprendere i rischi che comporta, anche oltre ciò che apprendiamo dai nostri test.”

Questo approccio proattivo sottolinea la gravità della minaccia e suggerisce che la prossima generazione di intelligenza artificiale potrebbe introdurre sfide di sicurezza informatica senza precedenti. I dati trapelati confermano che il prossimo passo nello sviluppo dell’intelligenza artificiale non consiste solo nello spingere i confini, ma anche nel mitigare preventivamente i rischi di una tecnologia che si sta evolvendo più velocemente di quanto le difese di sicurezza possano tenere il passo.

Il rilascio di Claude Mythos probabilmente rimodellerà il panorama competitivo dell’intelligenza artificiale, ma i problemi di sicurezza associati segnalano anche la necessità di una cooperazione a livello di settore per garantire uno sviluppo e un’implementazione responsabili.