Anthropic heeft zijn releasecyclus in 2026 versneld met de aankondiging van Claude Opus 4.7. Gepositioneerd als het meest intelligente model van het bedrijf dat beschikbaar is voor het publiek, markeert de nieuwe release een belangrijke stap voorwaarts in het hybride redeneren, hoewel het een unieke plaats inneemt in de intelligentiehiërarchie van Anthropic.
De hiërarchie van intelligentie: Opus versus Mythos
Om de betekenis van deze release te begrijpen, is het belangrijk op te merken dat Opus 4.7 niet het absoluut krachtigste model van Anthropic is. Het bedrijf heeft onlangs Claude Mythos ontwikkeld, een model dat een nog hoger niveau van intelligentie aantoont, maar dat te potentieel gevaarlijk wordt geacht voor algemene publieke publicatie.
Bijgevolg fungeert Opus 4.7 als het huidige ‘plafond’ voor veilige, op de consument gerichte AI, en fungeert het als een brug tussen standaard redeneermodellen en de experimentele, krachtige Mythos-laag.
Belangrijkste verbeteringen en mogelijkheden
Claude Opus 4.7 is ontworpen voor complex redeneren in meerdere stappen en technische taken op hoog niveau. Volgens Anthropic blinkt het model uit op een aantal specifieke gebieden:
- Geavanceerde codering: Gebruikers kunnen naar verluidt complexe, langlopende codeerprojecten met meer vertrouwen aan het model delegeren, omdat het nu zijn eigen resultaten kan verifiëren en ingewikkelde instructies met grotere nauwkeurigheid kan volgen.
- Visuele en documentintelligentie: Het model vertoont duidelijke verbeteringen bij het analyseren van visuele gegevens en het verwerken van compacte documenten.
- Creatief professionalisme: Anthropic beschrijft het model als ‘smaakvoller’ en merkt betere prestaties op bij het genereren van professionele middelen van hoge kwaliteit, zoals diapresentaties, gebruikersinterfaces en documenten.
Opmerking over tokengebruik: Hoewel de prijs identiek blijft aan die van zijn voorganger (Opus 4.6), moeten gebruikers zich ervan bewust zijn dat Opus 4.7 “meer nadenkt” bij hogere inspanningsniveaus. Dit diepere redeneringsproces resulteert in een hoger verbruik van outputtokens, wat van invloed kan zijn op de kosten voor API-gebruikers.
Benchmarkprestaties: hoe het zich verhoudt
In een gedetailleerde modelkaart vergeleek Anthropic Opus 4.7 met andere marktleiders, waaronder Google’s Gemini 3.1 Pro en OpenAI’s GPT-5-4 Pro.
Op de uitdagende benchmark Humanity’s Last Exam (HLE) – een test die is ontworpen om extreme moeilijkheidsgraad te meten – neemt Opus 4.7 een concurrentiepositie in. Zonder het gebruik van externe tools zijn de resultaten als volgt:
| Model | HLE-score (geen tools) |
|---|---|
| Claude Mythos | 56,8% |
| Claude Opus 4.7 | 46,9% |
| Gemini 3.1 Pro | 44,4% |
| GPT-5-4 Pro | 42,7% |
| Claude Opus 4.6 | 40,0% |
Wanneer tools worden gebruikt, verandert het landschap enigszins, waarbij GPT-5-4 Pro de consumentengroep leidt met 58,7%, terwijl Opus 4.7 volgt met 54,7%. Het is vermeldenswaard dat Anthropic duidelijk maakt dat Opus 4.7 bestaande capaciteitstrends volgt in plaats van een plotselinge, exponentiële sprong in de AI-ontwikkeling te vertegenwoordigen.
Veiligheid, eerlijkheid en hallucinaties
Een kernpijler van de ontwikkeling van Anthropic is ‘AI-veiligheid’. Met update 4.7 heeft het bedrijf zich sterk gericht op het verminderen van de tekortkomingen die inherent zijn aan grote taalmodellen:
- Minder hallucinaties: Het model is naar verluidt feitelijker en zal minder snel onjuiste informatie verzinnen.
- Verhoogde eerlijkheid: Anthropic rapporteert een aanzienlijke vermindering van het aantal “belangrijke omissies” – gevallen waarin een model er niet in slaagt een cruciaal stukje informatie te vermelden.
- Hacker met lagere beloning: Het model vertoont een verminderde neiging om “snelkoppelingen” te vinden om aan een prompt te voldoen die afwijkt van de werkelijke bedoeling van de gebruiker.
Beschikbaarheid
Claude Opus 4.7 is per direct verkrijgbaar via de volgende kanalen:
– Claude AI (webinterface)
– Claude-API
– Microsoft Foundry en andere Anthropic-partners
Conclusie: Claude Opus 4.7 profileert zich als een zeer capabel, professioneel redeneermodel dat prioriteit geeft aan betrouwbaarheid en codeerprecisie, ook al houdt Anthropic om veiligheidsredenen zijn krachtigste “Mythos”-technologie achter de hand.
