Я немного задержался с этим обзором, потому что хотел основательно испробовать Claude 4.5 и подробно рассказать о том, как его использую и как теперь нужно работать с Claude после выхода этой модели.

Что могу сказать - это действительно крутой прорыв для Anthropic.

Главная рекомендация: полностью переходите на Sonnet

Первое, что вы должны сделать сейчас - полностью выключить Opus. Просто поставьте стандартную модель на Sonnet и даже не думайте об Opus. Вы можете оставить Opus Plan Mode - они вырезали этот тоггл из настроек, но его все еще можно задать вручную, если знать, как называется этот режим при выборе модели.

Для себя я создал субагента под названием “Ask Opus”. Opus все еще более мощный, чем Sonnet в плане чистого мышления и широкого кругозора, сложности задач, которые он может решить. Но для стандартных workflow Opus не нужен вообще. Более того, вы будете постоянно упираться в лимиты и только страдать, если продолжите пользоваться Opus, как это было нормой до версии 4.5.

Теперь я просто прошу Sonnet обратиться к Opus для сложных алгоритмов и задач - и мне этого абсолютно достаточно.

Ключевые улучшения Sonnet 4.5

Точное следование инструкциям

Sonnet 4.5 намного точнее следует инструкциям - и это, пожалуй, самое важное для меня улучшение. У меня есть хук, который срабатывает каждый раз при фразе “You’re absolutely right”. Количество триггеров этого хука уменьшилось не меньше чем в четыре раза без каких-либо изменений в воркфлоу или техниках промптинга.

Это огромный прогресс. Claude теперь просто делает то, что от него требуется, и стал намного ближе к GPT-4 в этом плане. У меня есть команда “никогда не заканчивай работу описанием того, что ты сделал - просто молча останавливайся”. Эта инструкция была у меня еще с июня, ни Opus, ни Sonnet 4.0 ей не следовали. Только Sonnet 4.5 начал следовать этой инструкции - теперь как киборг разматывает код и молча останавливается, когда работа закончена.

Параллелизм вызова инструментов

Огромное улучшение - параллелизм вызова инструментов. Opus хоть как-то вызывал инструменты параллельно примерно в 10-15% случаев, Sonnet 4.0 практически никогда не делал этого, хотя обе модели имели доступ к параллельным вызовам.

Sonnet 4.5 был специально постобучен вызывать инструменты параллельно, когда есть такая возможность. Это действительно круто, потому что меньше времени уходит на токены мышления - вместо глупых “а сейчас вызови это”, “а сейчас вызови то”, которые засоряют контекст без смысла. Теперь Sonnet 4.5 вызывает 8 инструментов подряд, они все сразу выполняются, и редактирование происходит в разы быстрее.

Недостатки

Жаль, что у Sonnet все еще только 200 тысяч токенов контекстного окна. Особенно учитывая негативные изменения - постоянные уведомления в контексте после каждого вызова инструмента: “у тебя столько токенов”, “потратил 5000 токенов на этот вызов”, “токенов осталось 15%”.

Claude начал сильно бояться работать и экономить как индус - экономит строчки кода, особенно при чтении файлов. Хотелось бы иметь 400 тысяч токенов, чтобы это не было проблемой. Непонятно, почему Anthropic все еще экономит на контексте вместо того, чтобы его расширить.

Качество мышления

Больше не замечаю разницы с Opus в качестве мышления. Раньше мышление Claude 4.0 на 70% состояло из галлюцинаций и бесконечных споров с самим собой. При простых задачах мышление было бесполезным. У Opus мышление отлично работало, поэтому я сидел на Opus практически всегда.

С Claude 4.5 сделали навсегда включенный режим мышления - и правильно сделали. Sonnet 4.5 действительно правильно использует токены мышления для помощи в работе. Качество мышления теперь на уровне Opus.

Экономические преимущества

Самое крутое изменение - Sonnet 4.5 можно заменить Opus для большей части работы. Из-за подскочившего качества и большего доверия к модели я теперь вообще не могу достигнуть лимитов.

Вчера Claude работал перманентно весь день с 10 утра - я не израсходовал даже 5% недельного лимита. К концу недели трачу максимум 10% еженедельного лимита и ни разу не потратил больше 15% 5-часового лимита, несмотря на то что агент работал постоянно.

Что это значит? Многим людям, кто сейчас на подписке за $200, если вы не гоняете больше 3 агентов параллельно - вам не нужна подписка за $200. Искренне думаю, что можно обойтись подпиской за $100 и никогда не достигать лимитов.

Влияние на продуктивность

Это сильно расширило возможности. В программировании я теперь могу работать не над двумя проектами, а над пятью сразу. Теперь я могу позволить себе больше переписываний, больше экспериментов, больше proof-of-concept реализаций, которые потом могу выкинуть и не жалеть о потраченных токенах.

Из-за того что Sonnet 4.5 еще и намного быстрее чем Opus и даже быстрее Sonnet 4.0, я могу с космической скоростью производить прототипы и тестировать их - все на той же подписке, которая у меня была.

Пожалуй, это одно из лучших обновлений Claude, которое когда-либо выходило. Я даже начал использовать Sonnet периодически в обычном чат-боте, потому что иногда он дает лучшие результаты, чем Opus. Невероятно, но факт.