У 2026 році компанія Anthropic прискорила цикл своїх релізів, представивши Claude Opus 4.7. Нова модель позиціонується як найінтелектуальніша з доступних широкому загалу, знаменуючи собою значний крок уперед у галузі гібридного логічного мислення, хоча вона і займає особливе місце в ієрархії інтелекту Anthropic.
Ієрархія інтелекту: Opus проти Mythos
Щоб зрозуміти важливість цього релізу, важливо відзначити, що Opus 4.7 не є абсолютно найпотужнішою моделлю Anthropic. Нещодавно компанія розробила Claude Mythos — модель, яка демонструє ще більший рівень інтелекту, проте вона була визнана потенційно надто небезпечною для публічного доступу.
Отже, Opus 4.7 служить нинішньою стелею для безпечного ІІ, орієнтованого на споживачів, виступаючи сполучною ланкою між стандартними моделями міркування і експериментальним, високопродуктивним рівнем Mythos.
Ключові поліпшення та можливості
Claude Opus 4.7 спроектована для вирішення складних багатоетапних завдань та високорівневих технічних питань. За даними Anthropic, модель перевершує попередників у кількох областях:
- Просунуте програмування: Користувачі можуть з більшою впевненістю делегувати моделі складні, тривалі проекти з написання коду, оскільки тепер вона здатна перевіряти власні результати і суворо дотримуватися заплутаних інструкцій.
- Візуальний інтелект та робота з документами: Модель демонструє помітні покращення в аналізі візуальних даних та обробці об’ємних документів.
- Професійний креатив: Anthropic описує модель як «більше володіє смаком», відзначаючи покращену роботу при створенні якісних професійних матеріалів, таких як презентації, інтерфейси і документи.
Примітка щодо використання токенів: Хоча вартість залишилася ідентичною попередньої версії (Opus 4.6), користувачам слід враховувати, що на високих рівнях складності Opus 4.7 «думає більше». Цей процес більш глибокої міркування призводить до підвищеного споживання вихідних токенів, що може вплинути на витрати користувачів API.
Порівняння продуктивності: бенчмарки
У докладному описі моделі Anthropic порівняла Opus 4.7 з іншими лідерами індустрії, включаючи Google Gemini 3.1 Pro та OpenAI GPT-5-4 Pro.
У складному тесті Humanity’s Last Exam (HLE) – бенчмарку, призначеному для вимірювання екстремальної складності завдань – Opus 4.7 займає конкурентну позицію. Без використання зовнішніх інструментів результати розподілилися так:
| Модель | Результат HLE (без інструментів) |
|---|---|
| Claude Mythos | 56.8% |
| Claude Opus 4.7 | 46.9% |
| Gemini 3.1 Pro | 44.4% |
| GPT-5-4 Pro | 42.7% |
| Claude Opus 4.6 | 40% |
При використанні інструментів розклад трохи змінюється: GPT-5-4 Pro лідирує у споживчому сегменті з результатом 58.7%, а Opus 4.7 слідує за нею з 54.7%. Варто зазначити, що Anthropic уточнює: Opus 4.7 слідує поточним тенденціям розвитку можливостей, а не є результатом раптового експоненційного стрибка у розвитку ІІ.
Безпека, чесність та галюцинації
Фундаментальним принципом розробки Anthropic є “Безпека ІІ”. В оновленні 4.7 компанія зосередилася на мінімізації недоліків, властивих великим мовним моделям:
- Зниження галюцинацій: Повідомляється, що модель стала більш фактичною і рідше вигадує неправильну інформацію.
- Підвищення чесності: Anthropic повідомляє про значне скорочення «важливих перепусток» — випадків, коли модель не згадує критично важливу інформацію.
- Зниження «зламування винагороди» (Reward Hacking): Модель демонструє меншу схильність шукати «найкоротші шляхи» для задоволення запиту, які відхиляються від реальних намірів користувача.
Доступність
Claude Opus 4.7 вже доступна через такі канали:
– Claude AI (веб-інтерфейс)
– Claude API
– Microsoft Foundry та інші партнери Anthropic
Висновок: Claude Opus 4.7 зарекомендувала себе як високопродуктивна модель професійного рівня, орієнтована на надійність і точність програмування, в той час як Anthropic притримує свою найпотужнішу технологію Mythos в резерві з міркувань безпеки.
