Anthropic запускает Claude Opus 4.7: новые горизонты в рассуждениях и программировании

2

В 2026 году компания Anthropic ускорила цикл своих релизов, представив Claude Opus 4.7. Новая модель позиционируется как самая интеллектуальная из доступных широкой публике, знаменуя собой значительный шаг вперед в области гибридного логического мышления, хотя она и занимает особое место в иерархии интеллекта Anthropic.

Иерархия интеллекта: Opus против Mythos

Чтобы понять значимость этого релиза, важно отметить, что Opus 4.7 не является абсолютно самой мощной моделью Anthropic. Недавно компания разработала Claude Mythos — модель, демонстрирующую еще более высокий уровень интеллекта, однако она была признана потенциально слишком опасной для публичного доступа.

Следовательно, Opus 4.7 служит нынешним «потолком» для безопасного ИИ, ориентированного на потребителей, выступая связующим звеном между стандартными моделями рассуждения и экспериментальным, высокопроизводительным уровнем Mythos.

Ключевые улучшения и возможности

Claude Opus 4.7 спроектирована для решения сложных многоэтапных задач и высокоуровневых технических вопросов. По данным Anthropic, модель превосходит предшественников в нескольких областях:

  • Продвинутое программирование: Пользователи могут с большей уверенностью делегировать модели сложные, длительные проекты по написанию кода, так как теперь она способна проверять собственные результаты и более строго следовать запутанным инструкциям.
  • Визуальный интеллект и работа с документами: Модель демонстрирует заметные улучшения в анализе визуальных данных и обработке объемных документов.
  • Профессиональный креатив: Anthropic описывает модель как «более обладающую вкусом», отмечая улучшенную работу при создании качественных профессиональных материалов, таких как презентации, пользовательские интерфейсы и документы.

Примечание по использованию токенов: Хотя стоимость осталась идентичной предыдущей версии (Opus 4.6), пользователям следует учитывать, что на высоких уровнях сложности Opus 4.7 «думает больше». Этот процесс более глубокого рассуждения приводит к повышенному потреблению выходных токенов, что может повлиять на расходы пользователей API.

Сравнение производительности: бенчмарки

В подробном описании модели Anthropic сравнила Opus 4.7 с другими лидерами индустрии, включая Google Gemini 3.1 Pro и OpenAI GPT-5-4 Pro.

В сложном тесте Humanity’s Last Exam (HLE) — бенчмарке, предназначенном для измерения экстремальной сложности задач — Opus 4.7 занимает конкурентную позицию. Без использования внешних инструментов результаты распределились следующим образом:

Модель Результат HLE (без инструментов)
Claude Mythos 56.8%
Claude Opus 4.7 46.9%
Gemini 3.1 Pro 44.4%
GPT-5-4 Pro 42.7%
Claude Opus 4.6 40.0%

При использовании инструментов расклад немного меняется: GPT-5-4 Pro лидирует в потребительском сегменте с результатом 58.7%, а Opus 4.7 следует за ней с 54.7%. Стоит отметить, что Anthropic уточняет: Opus 4.7 следует текущим тенденциям развития возможностей, а не является результатом внезапного экспоненциального скачка в развитии ИИ.

Безопасность, честность и галлюцинации

Фундаментальным принципом разработки Anthropic является «Безопасность ИИ». В обновлении 4.7 компания сосредоточилась на минимизации недостатков, присущих большим языковым моделям:

  1. Снижение галлюцинаций: Сообщается, что модель стала более фактической и реже выдумывает неверную информацию.
  2. Повышение честности: Anthropic сообщает о значительном сокращении «важных пропусков» — случаев, когда модель не упоминает критически важную информацию.
  3. Снижение «взлома вознаграждения» (Reward Hacking): Модель демонстрирует меньшую склонность искать «кратчайшие пути» для удовлетворения запроса, которые отклоняются от реальных намерений пользователя.

Доступность

Claude Opus 4.7 уже доступна через следующие каналы:
Claude AI (веб-интерфейс)
Claude API
Microsoft Foundry и другие партнеры Anthropic


Заключение: Claude Opus 4.7 зарекомендовала себя как высокопроизводительная модель профессионального уровня, ориентированная на надежность и точность программирования, в то время как Anthropic придерживает свою самую мощную технологию «Mythos» в резерве из соображений безопасности.