Anthropic lancia Claude Opus 4.7: una nuova frontiera nel ragionamento e nella codifica

10

Anthropic ha accelerato il suo ciclo di rilascio nel 2026 con l’annuncio di Claude Opus 4.7. Posizionato come il modello più intelligente dell’azienda disponibile al pubblico, la nuova versione segna un significativo passo avanti nel ragionamento ibrido, sebbene occupi un posto unico nella gerarchia dell’intelligenza di Anthropic.

La Gerarchia dell’Intelligenza: Opus vs. Mythos

Per comprendere il significato di questa versione, è importante notare che Opus 4.7 non è il modello più potente in assoluto di Anthropic. La società ha recentemente sviluppato Claude Mythos, un modello che dimostra livelli di intelligenza ancora più elevati ma è stato ritenuto potenzialmente troppo pericoloso per il rilascio al pubblico.

Di conseguenza, Opus 4.7 funge da attuale “tetto” per un’intelligenza artificiale sicura e rivolta al consumatore, fungendo da ponte tra i modelli di ragionamento standard e il livello Mythos sperimentale e ad alta capacità.

Miglioramenti e funzionalità chiave

Claude Opus 4.7 è progettato per ragionamenti complessi in più fasi e compiti tecnici di alto livello. Secondo Anthropic, il modello eccelle in diverse aree specifiche:

  • Codificazione avanzata: Secondo quanto riferito, gli utenti possono delegare progetti di codifica complessi e di lunga durata al modello con maggiore sicurezza, poiché ora può verificare i propri output e seguire istruzioni complesse con maggiore rigore.
  • Intelligenza visiva e documentale: il modello mostra notevoli miglioramenti nell’analisi dei dati visivi e nell’elaborazione di documenti densi.
  • Professionalità creativa: Anthropic descrive il modello come “più raffinato”, sottolineando prestazioni migliori nella generazione di risorse professionali di alta qualità come presentazioni di diapositive, interfacce utente e documenti.

Nota sull’utilizzo dei token: Anche se il prezzo rimane identico a quello del suo predecessore (Opus 4.6), gli utenti devono essere consapevoli che Opus 4.7 “pensa di più” a livelli di impegno più elevati. Questo processo di ragionamento più profondo comporta un consumo maggiore di token di output, che potrebbe incidere sui costi per gli utenti API.

Prestazioni di riferimento: come si confrontano

In una scheda modello dettagliata, Anthropic ha confrontato Opus 4.7 con altri leader del settore, tra cui Gemini 3.1 Pro di Google e GPT-5-4 Pro di OpenAI.

Nell’impegnativo benchmark Humanity’s Last Exam (HLE), un test progettato per misurare la difficoltà estrema, Opus 4.7 occupa una posizione competitiva. Senza l’uso di strumenti esterni, i risultati sono i seguenti:

Modello Punteggio HLE (senza strumenti)
Claude Miti 56,8%
Claude Opus 4.7 46,9%
Gemelli 3.1 Pro 44,4%
GPT-5-4 Pro 42,7%
Claude Opus 4.6 40,0%

Quando vengono utilizzati gli strumenti, il panorama cambia leggermente, con GPT-5-4 Pro in testa al gruppo dei consumatori con il 58,7%, mentre Opus 4.7 segue con il 54,7%. Vale la pena notare che Anthropic chiarisce che Opus 4.7 segue le tendenze delle capacità esistenti piuttosto che rappresentare un salto improvviso ed esponenziale nello sviluppo dell’IA.

Sicurezza, onestà e allucinazioni

Un pilastro fondamentale dello sviluppo di Anthropic è la “sicurezza dell’intelligenza artificiale”. Con l’aggiornamento 4.7, l’azienda si è concentrata molto sulla riduzione dei difetti inerenti ai grandi modelli linguistici:

  1. Allucinazioni ridotte: secondo quanto riferito, il modello è più basato sui fatti e ha meno probabilità di inventare informazioni errate.
  2. Maggiore onestà: Anthropic segnala una significativa riduzione delle “omissioni importanti”, ovvero casi in cui un modello non menziona un’informazione cruciale.
  3. Ricompensa inferiore per l’hacking: il modello mostra una diminuzione della tendenza a trovare “scorciatoie” per soddisfare una richiesta che si discosta dall’intento reale dell’utente.

Disponibilità

Claude Opus 4.7 è immediatamente disponibile attraverso i seguenti canali:
Claude AI (interfaccia web)
API Claude
Microsoft Foundry e altri partner antropici


Conclusione: Claude Opus 4.7 si afferma come un modello di ragionamento di livello professionale altamente capace che dà priorità all’affidabilità e alla precisione della codifica, anche se Anthropic tiene la sua più potente tecnologia “Mythos” di riserva per motivi di sicurezza.