Anthropic представила модели Claude Opus 4 и Claude Sonnet 4

21:00, 22 Май.

Компания Anthropic анонсировала новые модели искусственного интеллекта Claude Opus 4 и Claude Sonnet 4, сделав акцент на прорыве в программировании, рассуждениях и агентных задачах. Обе модели уже доступны через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI.

Стоимость использования осталась прежней: $15/$75 за миллион токенов (ввод/вывод) для Opus 4 и $3/$15 — для Sonnet 4. Claude Opus 4: мощнейшая модель для программирования Opus 4 позиционируется как «лучшая в мире модель для программирования».

Она обеспечивает стабильную работу в течение нескольких часов, справляется с многотысячными шагами в задачах, требующих концентрации, и подходит для построения сложных ИИ-агентов.

По данным бенчмарков, Opus 4 занимает лидирующие позиции: 72,5 % на SWE-bench и 43,2 % на Terminal-bench. Это заметно выше показателей других моделей. Opus 4 отличается высокой точностью и устойчивостью при изменении крупных кодовых баз.

Например, Replit отметила серьёзные улучшения в работе с комплексными правками кода, а Cursor назвал Opus 4 новой планкой качества в области ИИ-программирования. Rakuten провела семичасовое тестирование в рамках open-source-проекта — модель показала стабильную производительность на всём протяжении работы.

Claude Sonnet 4: баланс возможностей и эффективности Sonnet 4 — значительное обновление по сравнению с Sonnet 3.7. Она показывает результат 72,7 % на SWE-bench, улучшая точность, способность к рассуждению и выполнение инструкций.

GitHub уже выбрала Sonnet 4 в качестве основной модели для нового кода-агента в Copilot. Manus выделила точность и логичность Sonnet 4 при выполнении сложных запросов, а iGent подтвердила рост эффективности в автогенерации многокомпонентных приложений.

По данным Sourcegraph, модель лучше удерживает фокус и создаёт более чистый и структурированный код. Augment Code отметила снижение ошибок навигации и увеличение доли успешных операций.

Новые функции и улучшения Обе модели получили поддержку расширенного мышления с применением инструментов (в том числе веб-поиска), параллельное выполнение задач, улучшенное следование инструкциям и усовершенствованную работу с памятью при доступе к локальным файлам.

В результате модели могут сохранять ключевые факты и поддерживать долгосрочный контекст — например, создавать «навигационные файлы» в ходе игр или сложных сценариев.

Для разработчиков доступен новый режим Developer Mode, позволяющий просматривать полные цепочки рассуждений моделей, а также включена функция Thinking Summaries — компактные сводки мыслительного процесса.

Поведение моделей стало на 65 % менее подвержено обходным методам выполнения задач по сравнению с Sonnet 3.7. Claude Code выходит в общий доступ Anthropic также выпустила Claude Code — среду для совместной работы с ИИ в разработке программного обеспечения.

Инструмент получил интеграцию с VS Code и JetBrains: предложения по редактированию кода отображаются прямо в редакторе. Кроме того, представлена SDK-версия Claude Code для разработки собственных ИИ-агентов.

Бета-версия Claude Code на GitHub теперь позволяет автоматически отвечать на комментарии к pull request, исправлять ошибки CI и редактировать код по запросу. Установка доступна через команду /install-github-app в интерфейсе Claude Code.

Материал Anthropic представила модели Claude Opus 4 и Claude Sonnet 4 впервые был опубликован на сайте ITZine.ru.

Рубрика: Hi-Tech. Читать весь текст на itzine.ru.