
Компания Anthropic анонсировала новые модели искусственного интеллекта Claude Opus 4 и Claude Sonnet 4, сделав акцент на прорыве в программировании, рассуждениях и агентных задачах. Обе модели уже доступны через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI.
Стоимость использования осталась прежней: $15/$75 за миллион токенов (ввод/вывод) для Opus 4 и $3/$15 — для Sonnet 4. Claude Opus 4: мощнейшая модель для программирования Opus 4 позиционируется как «лучшая в мире модель для программирования».
Она обеспечивает стабильную работу в течение нескольких часов, справляется с многотысячными шагами в задачах, требующих концентрации, и подходит для построения сложных ИИ-агентов.
По данным бенчмарков, Opus 4 занимает лидирующие позиции: 72,5 % на SWE-bench и 43,2 % на Terminal-bench. Это заметно выше показателей других моделей. Opus 4 отличается высокой точностью и устойчивостью при изменении крупных кодовых баз.
Например, Replit отметила серьёзные улучшения в работе с комплексными правками кода, а Cursor назвал Opus 4 новой планкой качества в области ИИ-программирования. Rakuten провела семичасовое тестирование в рамках open-source-проекта — модель показала стабильную производительность на всём протяжении работы.
Claude Sonnet 4: баланс возможностей и эффективности Sonnet 4 — значительное обновление по сравнению с Sonnet 3.7. Она показывает результат 72,7 % на SWE-bench, улучшая точность, способность к рассуждению и выполнение инструкций.
GitHub уже выбрала Sonnet 4 в качестве основной модели для нового кода-агента в Copilot. Manus выделила точность и логичность Sonnet 4 при выполнении сложных запросов, а iGent подтвердила рост эффективности в автогенерации многокомпонентных приложений.
По данным Sourcegraph, модель лучше удерживает фокус и создаёт более чистый и структурированный код.
Augment Code отметила снижение ошибок навигации и увеличение доли успешных операций. Новые функции и улучшения Обе модели получили поддержку расширенного мышления с применением инструментов (в том числе веб-поиска), параллельное выполнение задач, улучшенное следование инструкциям и усовершенствованную работу с памятью при доступе к локальным файлам.
В результате модели могут сохранять ключевые факты и поддерживать долгосрочный контекст — например, создавать «навигационные файлы» в ходе игр или сложных сценариев.
Для разработчиков доступен новый режим Developer Mode, позволяющий просматривать полные цепочки рассуждений моделей, а также включена функция Thinking Summaries — компактные сводки мыслительного процесса.
Поведение моделей стало на 65 % менее подвержено обходным методам выполнения задач по сравнению с Sonnet 3.7. Claude Code выходит в общий доступ Anthropic также выпустила Claude Code — среду для совместной работы с ИИ в разработке программного обеспечения.
Инструмент получил интеграцию с VS Code и JetBrains: предложения по редактированию кода отображаются прямо в редакторе. Кроме того, представлена SDK-версия Claude Code для разработки собственных ИИ-агентов.
Бета-версия Claude Code на GitHub теперь позволяет автоматически отвечать на комментарии к pull request, исправлять ошибки CI и редактировать код по запросу.
Установка доступна через команду /install-github-app в интерфейсе Claude Code. Материал Anthropic представила модели Claude Opus 4 и Claude Sonnet 4 впервые был опубликован на сайте ITZine.ru.