digestors.

Понятно, практично, по делу

Anthropic выпустила модель Claude Sonnet 5

Anthropic 30 июня 2026 года выпустила Claude Sonnet 5 — модель с агентскими возможностями, близкими к флагману Opus 4.8, по сниженной вводной цене.

Anthropic выпустила модель Claude Sonnet 5

Условия запуска

  • Развёртывание: модель автоматически установлена по умолчанию для Free и Pro worldwide. Ручного переключения не требуется.
  • Срок вводной цены: до 31 августа 2026 года. После этой даты ставка источником не раскрыта.
  • Формулировка Anthropic: «может составлять планы, использовать браузер и терминал, работать автономно на уровне, который несколько месяцев назад требовал более крупных и дорогих моделей». Это позиционирование самой компании, независимая верификация не приводится.
  • Ярлык TechCrunch: «дешёвый способ запускать агентов». Отражает целевую нишу — снижение себестоимости агентских сценариев.

Бенчмарки из System Card

  • SWE-bench Pro (агентное кодирование): Sonnet 5 — 63,2%. Opus 4.8 — 69,2%. Sonnet 4.6 — 58,1%. Отставание от флагмана 6 п.п., прирост относительно предыдущего поколения 5,1 п.п.
  • OSWorld-Verified (автоматизация рабочего стола): Sonnet 5 — 81,2%. Opus 4.8 — 83,4%. Бейзлайн человека-эксперта — 72,4%. Обе модели выше человеческого бейзлайна; Sonnet 5 отстаёт от Opus на 2,2 п.п.
  • Terminal-Bench 2.1 (агентная работа в командной строке): Sonnet 5 — 80,4%. Sonnet 4.6 — 59,7%. Прирост 20,7 п.п.
  • Humanity's Last Exam с инструментами (graduate-level reasoning с доступом к браузеру и коду): Sonnet 5 — 57,4%. Opus 4.8 — 57,9%. Различие в пределах методологической погрешности.
  • BrowseComp 25 (агентный веб-поиск): Sonnet 5 — 84,7%. Заявленный лимит контекста в этом сценарии — 10 млн токенов.

Что проверить в рабочем процессе

  • Тип ставки. $2/$10 в источнике не отнесены явно к API-тарифу или подписке. При планировании затрат требуется уточнение у Anthropic.
  • Контекстное окно. 10 млн токенов указаны для BrowseComp 25. Универсальным лимитом для всех задач источник их не называет.
  • Условия подписки Free и Pro. Переключение автоматическое. Возможные изменения квот, лимитов запросов или политики хранения данных в материале не описаны.
  • Партнёрская валидация. Cursor (сооснователь Sualeh Asif) и Zapier (старший инженер Daniel Shepard) сообщают, что агенты