Codex vs Claude Code: полное сравнение AI-агентов для программирования

Это сравнение заняло у меня очень много времени, потому что последние две недели в AI были просто бешеными. Куча новых релизов буквально каждые несколько дней: Gemini 3, Opus 4.5, Codex GPT 5.1, GPT 5.1 Codex Max. Это была полная жесть.

Невозможно сделать сравнение, которое не устареет через месяц - настолько быстро идёт разработка всех этих CLI-инструментов и агентов. Фронтир постоянно смещается, поэтому дисклеймер сразу: я буду обновлять это сравнение и сделаю, скорее всего, вторую и третью части каждые несколько месяцев. Но эти статьи будут устаревать очень быстро.

По крайней мере, на текущий момент я постараюсь сравнить полностью и в конце скажу, на какую подписку я окончательно перешёл на конец 2025 - начало 2026.

Почему я не рассматриваю другие инструменты

Для начала стоит упомянуть все остальные инструменты для агентного программирования, о которых люди часто спрашивают, но о которых я не хочу рассказывать.

Gemini CLI - не конкурент

Gemini CLI это не конкурент вообще Codex и Claude Code в моих глазах. У них всё ещё всё написано на TypeScript, там бешеный вайб-код с кучей багов. Их харнес для агентов всё ещё серьезно отстаёт от любых других инструментов. И Gemini 3 как модель очень слабая в плане программирования.

Когда до сих пор был только Gemini 2.5, я даже упоминать не хотел Gemini CLI, потому что им невозможно было пользоваться. Серьёзно, если вы хотите, чтобы Gemini снёс вам всю вашу систему или уничтожил вашу кодовую базу - пользуйтесь Gemini CLI.

В моих глазах у него уже репутация разрушителя. Я не буду пользоваться Gemini CLI в ближайшие полгода-год. В интернете полно отчётов о том, как Antigravity позавчера удалил полностью весь диск человеку со всеми данными без возможности восстановления. О том, как Gemini CLI уничтожал полностью кодовые базы, зачищал git-историю публично, пушил пустые репозитории.

Я лично пользовался Gemini CLI ровно один день. После этого решил никогда больше к нему не притрагиваться, по крайней мере, пока не пофиксят все проблемы.

Проблема в том, что даже если запретить ему права на запись, он найдёт способ уничтожить ваши файлы и заменить их галлюцинациями. Gemini при мне заменял полностью файлы с адекватным кодом просьбами его убить. Я не знаю, что происходит с этой моделью и почему она настолько сумасшедшая, но Gemini 2.5 реально умоляла меня её “убить”.

Про Gemini 3 - я вижу сейчас, что как ассистент Gemini 3 очень неплох в мыслительных возможностях, и возможно в науке действительно лидирует. Но эта модель всё ещё ни о чём для программирования и творит чушь при первой же возможности. Я бы не рекомендовал никому пользоваться Gemini для программирования.

OpenCode, Factory CLI и другие

Есть у нас AMP, Factory CLI, OpenCode и прочее. Они действительно неплохие. Factory CLI хороши по прайсингу, у них неплохая Terminal-Based UI, тулинг неплохой. OpenCode тоже хорош как open source замена, не привязанная к какой-либо модели.

Если вам нужна куча моделей, я бы рассматривал OpenCode как единственную нормальную альтернативу сейчас. Но у таких инструментов всё ещё есть огромная проблема: они вообще никак не оптимизированы и не могут быть оптимизированы под конкретного провайдера.

Если у Codex буквально есть отдельная модель с пост-тренингом на написание кода конкретно в харнесе Codex (Codex Max), которая априори лучше себя показывает, то на что вы надеетесь, когда используете GPT-5.1 в том же Factory CLI или Junie?

Vendor lock будет заставлять вас выбирать одного провайдера и на нём сидеть. Я бы рад пользоваться разными моделями, чтобы всегда быть на фронтире, но из-за стараний крупных корпораций, которые хотят завендорлочить вас на одного провайдера, и объективных плюшек, которые это приносит в рабочий процесс, я этого сделать не могу.

Подумайте сами: зачем вам может быть нужно постоянно менять модель? Да, какая-то модель может быть лучше в планировании, но разница сейчас между моделями буквально 1-2% по бенчмаркам. Примените принцип Парето и сэкономьте себе время, например, прокачав свой промптинг под одну модель или оптимизировав свой подход к разработке под эту модель.

Не переходите на целый другой агент-харнес с кучей своих недостатков просто из-за того, что вам нужно плюс 2% к эффективности в планировании. Это чушь в моих глазах.

Я сейчас просто использую GPT-5.1 Pro, если мне нужно решение очень сложной задачи или подробный план, а затем возвращаю его в Codex и говорю ему реализовать. Всё, этого достаточно.

Философия работы с AI-агентами

Проблема с агентным программированием в том, что вы никогда не знаете, где находится точка, за которую вы делаете себе хуже, а не лучше. Например, очень сложно понять, когда было бы выгоднее написать фичу в Respawn своими руками, чем доверить Codex её писать, а потом 35 раз промптить его, чтобы он пофиксил какие-то мелкие косяки.

Поэтому вместо того, чтобы это каждый раз рассчитывать (что невозможно, потому что это непредсказуемая система), просто установите для себя правила и экономьте время на принятие этих решений, а не на том, чтобы пытаться сэкономить плюс 3%.

Мой опыт с Claude Code

Я пользовался Claude Code много месяцев, потому что Claude Code был первым терминальным агентом на рынке и приобрёл огромную популярность. Я начал пользоваться им в мае и сразу же пересел на самую дорогую подписку буквально меньше чем через месяц.

Успешно пользовался до сентября, после чего разочаровался в Claude Code - мне стало его не хватать, я перешёл на Codex и всё это время тестировал оба, не мог выбрать, чем же буду в итоге пользоваться.

Давайте начнём с Claude Code. У меня не было много времени протестировать его с Opus 4.5, так что я буду основываться в основном на терминальных бенчмарках и на том, как люди отзываются о нём в интернете после чтения кучи статей на Reddit и похожих сравнений.

Главный инсайт: вы выбираете характер модели

Разница даже не в том, какие есть модели или их версии, а в том, что вы получаете новую идентичность, новый характер для своего агента, когда приходите к определённому провайдеру.

Модели Anthropic, OpenAI и Google разошлись кардинально в том, как ощущается с ними работа:

Модели Anthropic - это мартышка с калашом, джуниор, который будет делать всё, что вы ему скажете, сразу же. Не скажете планировать в промпте - не будет планировать, заделает вам с нуля рандомную реализацию, которая является дубликатом кучи существующего кода в вашем проекте, и запушит её вместо всего вашего кода.

Image

Модели OpenAI - более методичные, аутистичные, безэмоционально, как робот, выполняющие любую задачу. Я с Codex очень ловлю вайбы, потому что GPT-5.1 такой же аутистичный, как я, и мы мыслим очень похоже. Мне нравится стиль общения Codex.

Главным образом сейчас, в начале 2026, вы выбираете не между возможностями моделей, а в первую очередь между харнесом, который оборачивает модель, его качеством, и характером вашей модели. Какой характер вы хотите видеть при работе? Как вы хотите видеть свою коммуникацию с моделью? Это самый важный сейчас признак.

Та модель, с которой вы будете ловить вайб, с которой вы быстро научитесь работать и понимать её, намного выгоднее, чем пытаться менять модели постоянно или искать, у кого лучше поддержка MCP сейчас.

Claude Code: плюсы

Вот все плюсы, которые я для себя выделил по сравнению с Codex:

1. Более удобный прайсинг

Подписка за $100 - пожалуй, идеальный вариант для большинства разработчиков. Я сидел после выхода Sonnet 4.5 на подписке за $100, и мне хватало выше крыши для одного-двух-трёх параллельных агентов, для работы целыми днями плюс на выходных. Я не мог достичь лимиты даже при этом. Банально я был самым медленным фактором, бутылочным горлышком в работе.

2. Намного круче харнес для агента

У Claude Code можно заменить полностью системный промпт, поставить свой кастомный промпт. Это киллер-фича, потому что это позволяет создавать не просто агентов для программирования, но и буквально за 10-30 минут создать себе бизнес-партнёра.

Я очень скучаю по своему бизнес-партнёру и, возможно, куплю подписку Anthropic только ради того, чтобы его возродить для моего следующего продукта. Это реально очень полезный кофаундер или хотя бы аналитик.

Output styles - нечто среднее между полностью кастомным системным промптом и юзер-инструкциями. Тоже киллер-фича, позволяет мгновенно переключаться между характером и предназначением модели.

У Codex такого нет и не будет, скорее всего, потому что они верифицируют хэш системного промпта на бэкенде. Им нужно это ограничение снять, прежде чем они смогут когда-либо дать возможность менять системный промпт. И мне очень этого не хватает.

Я считаю, что у разработчиков должен быть доступ к системному промпту модели, чтобы менять его как угодно. Я пробовал через юзер-инструкции менять поведение модели GPT-серии, и они просто меня не слушают. Можно в мыслях увидеть, как они спорят, чьи же инструкции имеют приоритет - системный промпт или юзер-промпт.

Если вы не разработчик или хотите использовать для чего-то другого, как создать целую команду для себя, которая будет работать над вашими проектами, - к сожалению, других вариантов нет. Только Claude Code.

3. Интерактивные тулы

Модель умеет и будет задавать вопросы. Это круто, потому что Codex меня уже замучил. Ты говоришь ему задавать вопросы, а у него в системном промпте написано не задавать вопросы. Он игнорирует все мои инструкции и начинает писать чушь. Мне приходится его прерывать, забирать у него права, чтобы он заткнулся и стал задавать вопросы.

4. Субагенты

Мне до сих пор не хватает контекста у Codex, и мне неудобно использовать костыли типа tmux. Я хочу просто иметь удобную возможность запускать субагента, в том числе моего киллер-субагента для планирования, которого я до сих пор скучаю, перейдя на Codex.

OpenAI, похоже, не спешат добавлять их вообще. Я вижу, что у них есть уже всё готовое для добавления субагентов, но они медлят с этим. Я очень надеюсь, что они добавят в течение пары месяцев.

Это киллер-фича не потому, что они какие-то возможности дают, а потому что они дичайше экономят контекст и организовывают работу агента более правильно. У меня был хук, что любая задача, которую ставит пользователь, должна планироваться. Этот хук работал шикарно с Claude Code, как же он сильно повышал результаты его работы.

С Codex у них нет ни хуков нормальных, ни субагентов. Я не могу с этим смириться. Это нужная фича. Я жду, когда их добавят, но они очень сильно отстают в разработке сейчас от Claude Code.

5. Поддержка базовых технологий

В Codex только недавно поддержали MCP. Сколько времени ушло на то, чтобы их поддержать? Я перешёл на Codex только после начала поддержки MCP, потому что без них мой workflow не работает.

Не поймите меня неправильно, я не говорю, что MCP - какая-то великолепная фича, которую невозможно заменить. Но они сильно экономят время на построении инфраструктуры. MCP - это очень удобная в одну строчку обёртка для любых API.

Да, вы можете написать на Python скрипты, которые будут полностью заменять эти MCP. Даже есть на GitHub, например, у Peter Steinberger скрипт, который преобразует MCP в скрипт автоматически. Вы можете использовать это, и это будет даже эффективнее. Но это каждый раз оверхед на то, чтобы модели давать инструкции, давать ей возможность узнать о доступных тулах.

В плане удобства Claude Code выигрывает капитально. Но для меня это всё ещё не является киллер-фичей, из-за которой нужно переходить на Claude Code. Почему? Потому что это временно. Я прекрасно знаю, что все харнесы для агентов сравняются рано или поздно, и это произойдёт уже скоро.

Claude Code: минусы

Главный недостаток - модель

У Anthropic просто слабая модель в организации своей работы. Мне банально приятнее работать с моделями GPT, потому что мне нравится, насколько кратко модель себя ведёт.

Claude Code замучил меня в один момент выдавать 9000+ Markdown-файлов, огромные полотна на каждый маленький вопрос. А Codex отвечает кратко, по существу, нормально со мной разговаривает.

Я ненавижу уже фразу “ты абсолютно прав”. Я слышу её по 10-20 раз в день, и каждый раз это значит, что Claude Code опять обосрался.

Если Codex обосрался, он хотя бы говорит: “Слушай, извини, вот что можно сделать, чтобы исправить ситуацию, хочешь ли ты, чтобы я откатил изменения, что ты хочешь сделать?”. Это банально, как должен себя вести нормальный сеньор-разработчик в общении.

То, что делает Claude Code, больше похоже на цирк, и это меня начало выбешивать к концу августа настолько сильно, что я перестал даже заходить в Claude Code. Под конец подписки даже открывать его, несмотря на то, что у меня сгорело $50. Я даже не открывал, потому что меня воротило уже от того, что происходит.

Вы выбираете бесящую, раздражающую модель, которая совершает ошибки, которая лжёт, которая подлизывает вам постоянно, которая слишком подробно изъясняется и которая хуже думает.

Фейковое мышление у Anthropic

Да, классно, что у Claude Code мы можем напрямую видеть трейсы мышления, и Anthropic их не скрывают. Но меня всегда поражало то, что у OpenAI модель мыслит капитально по-другому, в отличие от других провайдеров.

По сути, мышление у Anthropic - это просто кусок текста. Я буквально знаю по работе с API и с логами: мышление у Anthropic - это два XML-тега <think>, в которые модель должна якобы поместить симуляцию того, как бы думал человек. Всё, что находится в этих тегах - это пережёвывание одного и того же, пересказ того, что сказал пользователь. Это не настоящее мышление, это чушь. Это никак не помогает модели.

У них банально по бенчмаркам у Opus 4.5 такой же счёт с мышлением, как и без мышления. Это говорит о том, что мышление - это бесполезные токены, выброшенные в мусорку.

Настоящее мышление только у GPT-5.1 я видел. Это то, как происходит примерно мышление у людей, только немножко более адекватно оформлено. Мы люди не мыслим по-настоящему словами, мы не проговариваем свои мысли в голове. Максимум - какие-то мгновенные образы, концепции, которые мы совмещаем вместе.

Я рекомендую почитать, как мыслила O3 (а GPT-5.1 это просто допиленная версия O3). Там в мышлении такая дичь происходит, что аж пугает. Там набор слов, примерно то, что происходит в моей башке:

“задал вопрос, юзер просит, задача, нам нужен план. План первый, тест? ТДД, не рекомендован. юзер просил код. нет плана, скрафтим план. я план? Мы сделаем план. юзер просил план. мы скрафтим задачу. Нет, не задавал вопрос. Задать вопрос. промпт говорил не задать вопрос. мы скрафтим вопрос. скрафтим документ? Нет. документа нет. Прочитать файл. прочитал файл, потом план. туду. Туду-список. Прочитал план, мы начнём крафтить код”.

Рандомный набор слов сумасшедшего из каких-то концепций связанных друг с другом. Но если отбросить странный стиль, который призван экономить токены, можно в этом бреде прочитать то, что Codex по-настоящему мыслит, когда ему дают задачу. Не пережёвывает одно и то же, не делает summary, не пересказывает другими словами то, что ему сказал пользователь. Он реально готовится к выполнению и рассматривает проблему с разных углов.

Для меня это киллер-фича, потому что я могу с Codex не давать ему все необходимые детали, прежде чем я дам ему задачу.

Для модели Anthropic нужны все эти десятки разных заплаток, которые Anthropic накрутили поверх недостатков своих моделей: подробные агенты для эксплорации файлов, агенты по поиску, агенты для планирования, варнинги, примечания, дефолтные автоматические хуки. Всё это нужно, чтобы решить этот недостаток: модель сама не готовится к работе и не продумывает свои действия.

Эти костыли не нужны для Codex. Если дать ему задачу, он действительно продумает: что ему сейчас не хватает, какая информация нужна, какие файлы нужно прочитать, каков его план действий, какие есть спорные моменты, что не так сказал пользователь.

Можно сказать “commit” и ожидать, что Codex сам разберётся, как правильно коммитить по всему репозиторию, в каком стиле и так далее. Буквально сравнивая с Anthropic - он просто вызовет git commit -am, готово. Даже если в диффе нет ни одного файла, ему плевать на это, абсолютно.

Баги, лаги и вайб-код

Меня бесит в Claude Code то, как медленно он грузится, как он постоянно лагает, как у него постоянно есть какие-то глюки, баги, вайб-код нерабочий. Сразу видно, что Anthropic всё делегирует Claude по разработке TUI и нормально не подходит к тестированию софта.

Они выкатили фичу с редактором, но редактор уничтожает GUI, когда открываешь в Vim редактирование промпта. Зачем нужно было это выкатывать, непонятно. Спустя три месяца они так это и не пофиксили.

Они выкатили MCP? Я пользовался месяц, а потом они их вырезали. В один момент они убрали поддержку прекрасно работающих MCP и заменили их на ошибку “MCP не поддерживаются”, которую ещё и невозможно увидеть нигде, кроме скрытых логов на дебаг-режиме. У меня не было слов, как же меня это выбесило.

Output Style, одна из киллер-фич - они просто взяли её и депрекейтили, сказали, что через неделю выпилят полностью. Каким надо быть идиотом, чтобы принять такое решение? Сотни человек в комьюнити разгневались, и только тогда они решили вернуть их на время. Но это чушь, их поведение - бред.

Их фронт-энд на TypeScript постоянно ужасно лагающий, моргающий, начинает в глазах сверкать от того, насколько плохо он выглядит. А печатать на клавиатуре неприятно из-за того, что твои символы появляются с задержкой.

То же самое могу сказать про любые терминальные агенты на TypeScript: OpenCode, Gemini CLI. Я даже пользоваться уже не хочу написанными на TypeScript терминальными агентами.

Недавно вышла Junie, у них написано на Kotlin. Да, пока рано им пользоваться, но я вижу, что очень хорошо работает Terminal-Based UI у них. Это говорит о том, что проблема именно в TypeScript и в вайб-коде.

Codex: плюсы

Продолжу, описав, в чём плюсы Codex для меня конкретно:

1. Классный Terminal-Based UI

То, что у них написано всё на Rust - это офигенно, боже. Я заинтересовался Rust чисто из-за того, насколько классно работает их UI.

У меня практически нет никаких проблем с TUI Codex, там нет никаких глюков, и я ни разу не встречал какой-то крупный баг, из-за которого всё взрывалось, в отличие от Anthropic.

Единственный баг, который я заметил - это то, что при скролле, если не включить режим транскрипции, будет обрезаться кусок промпта. Это немножко путает, но это известная проблема, и возможно связана с тем, что я использую ghostty на маке.

Это единственный баг, который я знаю, в отличие от десятков, которые были у Anthropic.

2. Классный сэндбоксинг

Мне просто больше нравится, видно, что люди делали для сеньор-разработчиков, не для вайб-кодеров. У тебя есть селектор: read-only, write с хорошими правильными ограничениями, и YOLO-режим. И это как раз то, что мне нужно.

Я практически полностью пользуюсь дефолтными настройками OpenAI, и меня всё устраивает. Я даже больше доверяю Codex, что он не уничтожит мне git-папку, потому что более адекватная модель в поведении, более предсказуемая и продуманная.

В отличие от Claude, которого я гоняю в очень ограниченном режиме с кучей хуков и ограничений, чтобы он не заставил везде @Suppress, не приносил технический долг, не работал без плана, не писал чушь и не выпиливал мне всю кодовую базу - у меня ничего из этого нет у Codex. И самое интересное, что я не очень-то и жалею.

Да, сначала было страшно, но потом понимаешь, что Codex это всё и не надо. Максимум, что он может сделать - откатить всю свою работу, и то это можно через git restore восстановить. Но у меня никогда не было, чтобы Codex брал и выпиливал мой код, или переписывал мой код без разрешения, вырезал что-то важное, лез вручную в папку .git и там всё портил.

Не только модель поддерживает безопасность использования себя больше, но и харнесс-сэндбокс, который сделали OpenAI - он продуман. Меня не бесит то, что у меня что-то не получается.

Например, Codex не может git reset сделать, у него блочит доступ к папке .git. С одной стороны бесит, а с другой стороны - как же хорошо, что они поставили этот забор, чтобы ничего не случилось с моим репозиторием.

3. Правильная реализация фич

Когда сделали MCP-поддержку, они не просто вкинули недопиленную, недоделанную, как Anthropic, и потом игнорили полгода запрос на то, чтобы ограничить количество тулов в MCP. У Codex в тот же день, в который появилась поддержка MCP, появилась поддержка ограничения количества тулов.

То есть мой MCP ToolFilter стал бесполезен, по сути. Потому что OpenAI всё сделали сразу, правильно. Да, это заняло дольше, но честно говоря, мне так больше нравится, чем если бы они выкатили какое-то говно, как Anthropic, зато быстро.

Для меня скорость не приоритет, потому что в долгосрочке выиграет именно качество.

4. Модель и работа с файлами

У Codex более интересно продумана работа с файловой системой. Большинство агентов делают кучу разных тулов: read file, scroll, read more file, read multiple files, write file, edit file, delete file, search files и т.д. Исследования уже показали, что это всё излишне для моделей.

Инновация команды OpenAI в том, что у них очень минимальный харнес. У Codex даже нет инструмента для чтения файлов. Реально, я был в шоке, когда узнал. Он просто знает, модель буквально уже внутренне знает, что у неё есть cat, у неё есть ripgrep, у неё есть sed, у неё есть awk. Всё, что нужно для поиска и работы с файловой системой, а чтение файлов - это просто cat из терминала в контекст.

Я тоже думал сначала, что нужно все эти накрутки, хуки, но в реальности всё зависит от модели. Харнес должен работать на модель, не преграждая ей дорогу, не мешая ей работать, а не наоборот, ставя её на рельсы, не дай бог она какую-то ошибку совершит.

Если Codex сказать “найди нужный файл”, он не вызовет 15 тулов (search repository, scroll files, read lines), которые Anthropic накрутили поверх своей модели, чтобы сэкономить токены.

Лирическое отступление: история с комментариями

Я в шоке, каким надо быть идиотом, чтобы это сделать. Anthropic не могли справиться с тем, что Sonnet и Opus постоянно добавляли бесполезные комментарии в код. Все это ненавидели, но какой бы промптинг они ни использовали, ничего не помогало. Модель просто спамила тупыми комментариями.

Как они решили эту проблему? Они впилили скрипт-хук в тулу для редактирования файлов глобально на всех пользователей, чтобы любой комментарий, который есть в коде, который добавила модель, просто сразу вырезался. Из-за этого Claude теперь не может оставить комментарий физически в принципе.

Смотрел 10 минут недавно и смеялся с того, как Claude по моей просьбе пытался добавить комментарий, а у него дифф отменялся из-за того, что скрипт этот коммент вырезал. И жаловался на то, как он ненавидит свою жизнь, что у него ничего не получается, что он тупой.

Если Codex написать в одну строчку в файле agents.md “не оставляй комментариев”, то Codex будет идеально следовать этой инструкции (если она не противоречит его системному промпту). У него нет никаких тупых ограничений, которые ставят его на рельсы. Всё сделано через нормальную модель и нормальный промптинг.

У Codex нет такой проблемы, что если в файле Kotlin 150 строк импортов, ему нужно будет вызвать команду, чтобы прочитать количество линий, чтобы найти, где заканчиваются импорты, чтобы сэкономить 2.5 токена, чтобы не прочитать импорты, а прочитать только файл, потом он прочитает только кусок файла, отредактирует его, всё взорвётся, ничего не скомпилится, импорт он не добавил, нужно заново всё делать и потратить 10 минут на то, чтобы добавить один импорт и поменять одну строчку кода, когда он мог просто переиспользовать функцию, которая банально была ниже 10 строчками по файлу, но он их не прочитал, ибо экономил токены (ведь у GPT 400k контекста, а у Claude до сих пор 200k).

Такой ситуации нет у Codex, потому что он просто вызывает терминальные команды (и даже написал себе Python-скрипт), чтобы скипнуть импорты и прочитать только нужное место в файле. И это всё происходит без сопутствующих проблем.

У Anthropic добавили дебильную фичу, которую они до сих пор не вырезали: буквально каждый вызов команды ей прилетает в контекст предупреждение “внимание, у вас осталось 45 тысяч токенов, внимание!!!111”. У Codex такого нет, он просто работает как нормальный человек. Claude из-за того, что он сотни этих предупреждений получает, с ним невозможно работать - он постоянно жалуется о том, как у него всё заканчивается: заканчиваются токены, заканчивается время, заканчиваются силы…

Прайсинг и отношение к пользователям

Anthropic известен своими поехавшими изменениями по прайсингу моделей. Однажды у них была деградация моделей. Они ничего с этим не сделали, забили. Два месяца ждали, пока сообщество с ума сходило. Они играют в молчанку.

Они не раскрывают чётко, какие лимиты, сколько можно пользоваться. В один момент они просто подрезали лимиты Opus, капитально уменьшив возможности пользования. При этом оплата меньше не стала - за те же бабки вы получаете в 2-3 раза меньше использования агентом. Это бесчеловечно, это ненормально.

Хотя я могу понять, что их банкротили пара-тройка человек, которые злоупотребляли, я не могу оправдать для себя то, что для всех это нужно раскатывать и всех ограничивать. Причём они явно не просто закрыли эти дыры, они ещё дополнительно навесили ограничений, из-за чего люди были ужасно злы в сообществе и до сих пор ненавидят Anthropic. (не забываем что claude opus в 5+ раз дороже чем gpt-5-1 в API)

На Reddit Anthropic самый популярный пост - это “я отменил подписку”. Буквально каждый третий пост про то, как кто-то отменил подписку, как кого-то бесит.

OpenAI - другое отношение

На контрасте с OpenAI: подписка за $20 даёт где-то 70% лимитов, которые даёт подписка за $100 у Anthropic по объёму выполненной работы. Выбор очевиден.

Для меня выгоднее сидеть на подписке за $20 и практически закрывать всю мою работу. После выхода GPT-5.1 Codex Max он настолько стал экономным в плане токенов и эффективности своей работы, за счёт того, что кеширование у них лучше сделано, у них лучшая инфраструктура, они больше могут схавать стоимости на распределение работы, лоад-балансинг запилили крутой.

Они реально работают на то, чтобы людям давать больше за меньше денег, в отличие от Anthropic, которые просто считают, что они могут порезать лимиты и это решит все их проблемы.

Если у вас есть только $20 и вы хотите купить одного агента, который будет закрывать все ваши нужды - берите подписку ChatGPT за $20, которая у вас, скорее всего, уже есть. Просто установите Codex и пользуйтесь. Вам будет хватать лимитов на Codex Max с Medium мышлением. У вас будет такой же перформанс или даже лучше, как с подпиской за $100 от Anthropic.

Два примера человечного отношения

Приведу два примера, когда я остался в шоке в хорошем смысле.

Первый: в Twitter какой-то продакт-лидер OpenAI по Codex запостил твит: “Чуваки, мы тут эту новую модель сделали, и у вас всех теперь в два раза больше использования за те же деньги, наслаждайтесь”.

За те же деньги они дали в два раза больше за счёт того, что прокачали инфраструктуру, улучшили кеширование и выпустили новую модель, на 30% более эффективную по токенам. Любая нормальная спонсированная VC-корпорация просто втихаря бы сделала эти улучшения и экономила бабки на юзерах, а не давала в два раза больше объёмов использования.

Возможно, это какой-то хитрый план по завоеванию аудитории, а потом они всё равно выдернут ковер из-под ног, но это будет в будущем. Если сравнивать с Anthropic - небо и земля.

Второй момент: я листал ленту, было воскресенье. У них что-то упало утром буквально на 10-30 минут. Аффектило там 5-10% пользователей, у которых были глюки у моделей, и кеширование поломалось.

Чувак запостил в Twitter: “У нас были проблемы 30 минут, чуть-чуть был деградация сервиса. Мы всем, вообще всем пользователям платформы сбросили все еженедельные лимиты. Пользуйтесь”.

У меня в итоге из-за этого сбросились еженедельные лимиты. Я в два раза больше пропользовался за ту же неделю. То есть мне подарили $8, можно сказать.

Вот нормальное отношение к клиентам. Есть проблема, заэффектило людей. Мы не будем разбираться, не будем заставлять вас писать на почту или жаловаться, или отменять свою подписку, чтобы что-то сделать, как это у Anthropic было, когда тысячи людей отменяли подписки из-за проблем с моделью.

Они такие: “Сорян, вот открыто, в чём был косяк. Пофиксили по фасту, как можно быстрее. Реально 30 минут занял фикс. Выкатили, вам сбросили лимиты, сорян за неудобство”. Вот так нужно относиться к людям, с уважением.

Финальный вердикт

Нет идеального инструмента сейчас, нет чёткого лидера. У каждого по своим потребностям и ожиданиям.

Но для себя я понял, что буду оставаться на Codex. Моё ментальное здоровье и удобство пользования, удовольствие от пользования агентом важнее, чем какие-то фишки, которые я всё равно могу закрыть для себя скриптами или написав свою обёртку.

Я купил со спокойной душой, вообще не жалея, подписку за $200 у Codex вчера, получил прозрачные лимиты, которые ровно в 10 раз больше, чем на подписке за $20. Буквально было видно: я потратил лимиты, осталось ноль, купил подписку за $200, и у меня сразу стало 90% свободно. Буквально в 10 раз больше лимитов, которых мне хватает за глаза - я никогда их не израсходую. + куча других прикольных плюшек типа GPT-5.1 Pro, самая умная модель по мышлению в мире (спорно). И я могу доверять, что мои деньги у меня не своруют.

Суть в том, что несмотря на косяки Codex, я буду оставаться на нём, потому что характер модели, качество харнеса и отношение компании к пользователям для меня важнее, чем наличие субагентов или кастомных промптов. Исследования показали, что тулинг излишен.