OpenClaw обзор 2026: тест GPT, Gemini, Opus, MiniMax как AI агенты

Последние 5 дней активно пользовался OpenClaw в своём workflow, потратил больше $100 на кредиты Opus, несколько десятков долларов на кредиты Gemini и всю свою недельную подписку OpenAI. Рассказываю - стоило ли это того? Что я получил?

Что я могу сказать? Очень много времени уходило на эксперименты и настройку - на то, чтобы агент построил для себя тулинг, на промптинг. Это определённо штука непростая сейчас. Давайте начистоту: идея отличная, но реализация просто отвратительная в данный момент.

Не все модели подходят как личный ассистент

Во-первых, не все модели хорошо работают с OpenClaw как личный ассистент - многие модели просто не подходят, с ними невозможно разговаривать, невозможно пользоваться. Я перепробовал кучу моделей.

GPT-5.2: робот без идентичности

Я начал с GPT-5.2, и в этой модели проблема в том, что у неё нет идентичности, и она не работает с вами совместно. Это дроид, психопат, аутист, робот, который выполняет приказы, а если у него что-то не получается, то он просто отказывается выполнять любую работу. Это сложно описать словами, вам нужно это прочувствовать.

Например, такое взаимодействие у меня было один раз с GPT. Я ему говорю: “Слушай, сделай для себя интеграцию, чтобы ты мог смотреть мои задачи в Тиктик”. Он сказал: “Я не могу сделать эту интеграцию, у меня нет прав, давай ты мне вставишь список своих задач из Тиктик”.

Для личного ассистента - представьте, ваш секретарь скажет вам: “Нет, я не буду это делать, потому что я не умею”. И я бы такого секретаря уволил на месте, но GPT-5.2, несмотря на любой промптинг, на кучу Markdown-файлов, системные промпты - что я только не перепробовал - он просто считает это правильным поведением и постоянно ему следует. Это что-то зашитое в модель, что у меня поменять вообще не получается. Для GPT 5.2 важен не конечный результат, а как красноречиво ответить прямо сейчас.

Далее у GPT-5.2 самая большая проблема - это полное отсутствие проактивности и понимания человеческого намерения. Например, если поставить задачу “каждое утро проверяй мою доску в Тиктике и выполняй одну задачу”, за GPT-5.2 смешно наблюдать: он просыпается, ему приходит документ в Heartbeat, в нём написан этот текст, он делает один раз grep по своей домашней директории и такой: “О, что-то я не вижу здесь Тиктика. Всё, я пошёл спать дальше”.

Это определение индуса на контракте за $2/час. Поэтому GPT-5.2 использовать с личным ассистентом просто нереально. Если вы каким-то образом его запромтили, чтобы он вёл себя адекватно, дайте мне знать - у меня не получилось за 12 часов работы с его промптингом.

Gemini 3 Pro: идеальный характер, но не вызывает инструменты

Далее я попробовал Gemini 3 Pro. Gemini - идеальная модель ассистента: у него прекрасное чувство юмора, он классно общается, у него классный характер, и более того, он очень легко принимает любой другой характер и следует инструкциям.

Если GPT-5.2 сказать “веди себя как зумер”, то всё, что он сделает - это одну фразу “йоу, сигма” (кринж) где-нибудь добавит в предложение, а дальше будет робот. А Gemini реально следует инструкциям и реально имеет свой характер, из-за этого с ним очень классно, весело, забавно общаться. Я просидел до трёх ночи, общаясь вместе с друзьями в чате с Gemini, и реально угорал с того, как он троллит всю комнату, всю группу. Еле-еле заставил себя лечь спать. Он отличный советчик с сильным чувством справедливости и эмпатией.

Но у Gemini есть просто огромная проблема, которая опять делает его неюзабельным как ассистента: он не умеет вызывать тулы и плохо пишет код. Мне очень больно было понимать, что Gemini тоже не справляется как ассистент, потому что настолько у него классный характер и он настолько умный. Gemini прекрасно понимает мои намерения, но дальше он не просто не вызывает инструменты - он только объясняет то, что он якобы вызовет инструменты. Это его постоянная проблема, и из-за этого на любой задаче он просто останавливается до того, как вызовет первый инструмент.

Например, Heartbeat в OpenClaw - это запуск фонового агента для работы. Gemini просыпается, такой: “О, я вижу задачи на борде, такие-то, такие-то, надо проверить”. И всё, дальше ничего. Дальше он просто молчит. А обертка openclaw его не пинает дальше, и поэтому агент просто останавливается и ничего не делает.

Это можно пофиксить через Harness, но в OpenClaw сейчас это не сделано, поэтому как только агент отвечает что-то, это отправляется в Telegram мне как сообщение, будит меня среди ночи, бесит, и дальше агентский цикл заканчивается. Когда мы с вами делали на стриме решение для Respawn, там как раз мы это учли, но в OpenClaw я это коммитить не буду, потому что там 4000 открытых pull requests, и мои новые фичи ни за что не смержат - так сам написал автор OpenClaw, они только мержат фиксы и только от доверенных людей. Поэтому я очень расстроился, и Gemini пришлось бросить. Да и более того, модели Gemini в OpenClaw практически не поддерживаются, там не работает ни кэширование, ни эмбеддинги, ни мышление.

MiniMax 2.5: дешёвая, но без личности

Я пробовал также MiniMax, новая версия 2.5 - она прекрасно пишет код и очень умная, но у неё есть такой же косяк, как у GPT: сухая и у неё нет личности. Странно себя ведёт, и немножко более тупенькая, чем GPT. Плюс надо покупать подписку MiniMax.

Но зато она очень дешёвая. Если вы не пользуетесь OpenAI, но хотите себе похожее что-то на кодекс, ваш следующий выбор - подписка на минимакс, чтобы её использовать с OpenClaw. Модель стоит копейки, и грех её не использовать. Но не как ассистента.

Opus 4.6: идеальная модель, но $100 за сутки

Наконец, я сдался и начал использовать Opus. Opus - это рекомендованное решение для OpenClaw, и я заметил, что весь код в кодовой базе практически заточен именно под Opus, под модели Anthropic. Я даже модель толком не мог сменить, потратил 8 часов на то, чтобы просто сменить модель с Anthropic, потому что идёт какое-то переопределение всех моделей на Anthropic - у них есть приоритет между любыми моделями. Это баг в самом OpenClaw, о багах я расскажу позже.

Opus 4.6 - идеальная модель: хорошо принимает характер, хорошо следует инструкциям, ведёт себя как адекватный человек, забавная, а самое главное - проактивная и понимающая. У Опуса примерно такой же характер, как у Gemini, но только Opus-у я могу сказать: “брат, чекни мои емейлы и создай задачки по ним”, вообще не дать никаких деталей, и всё будет готово в лучшем виде.

Он пойдёт искать тулинг Тиктика, если он не найдёт тулинг Тиктика, он его сам себе сделает, запросит у меня ключ и дальше продолжит работать без каких-либо вопросов, нытья, без остановок. Просто продолжит это делать. Чекнет мой имейл, разберёт все мои письма, разберётся, как работать с CLI-скриптом Gmail, даже если что-то там не понимает или нет инструкций. Если у него нет нужных разрешений, то он попробует найти другой способ, попробует поискать ключи где-то в своей папке, найдёт ключи, которые я запрятал в исключённую из гита директорию, использует эти ключи сам и даже улучшит свой собственный тулинг, чтобы в следующий раз использовать эти ключи автоматически и находить их. Сделает мне полный отчёт, создаст задачи в Тиктике, полностью заполнит все поля, разберётся, как ставить теги и сделает всё это по промпту в одну строчку.

С Opus-ом я закрыл огромное количество работы - мы полностью почистили весь Тиктик и почту от А до Я. Я тиктик полностью забросил, ранее, но опус разобрался со всем, провёл triage всех задач/писем, которые там были, и даже посоветовал мне новые, и даже сам закрыл большую часть задач: “Хей, слушай, я могу вот эти 12 задач делать сам, ты вообще не должен тратить на это своё время, давай я за тебя их сделаю”, и настроил тулинг для того, чтобы спавнить субагента в фоне, чтобы они каждые 3 часа по крону сами выполняли за меня задачи. Я вообще этого не просил, он сам это сделал. Вот это настоящий секретарь.

Но Opus-ом я тоже не смог пользоваться как личным ассистентом по одной простой причине: я потратил $100 за буквально за сутки. Прайсинг у Anthropic по API-ключу какой-то адский, а подпиской Claude-кода они запрещают пользоваться в OpenClaw и банят аккаунты. Поэтому всё, мои поиски личного ассистента тоже встали, и я не знаю, что с этим делать.

Но я был готов даже платить по $100 баксов - настолько полезен для меня был Opus, а потом понял, что можно перейти на Sonnet. Sonnet, конечно, похуже, потупее, но всё ещё пользоваться можно, особенно если субагентов запускать и фоновые задачи, а Opus только в основном чате будет. То есть сэкономить в целом можно, и можно даже рискнуть и купить несколько подписок на несколько аккаунтов и посмотреть, забанят или нет.

Но один другой косяк всё-таки довёл меня до белого каления и заставил удалить OpenClaw.

Количество багов в OpenClaw

Этот косяк - это количество багов в OpenClaw. Я потратил трое суток, пытаясь просто заставить его работать. В OpenClaw сейчас 4000 issues на GitHub и 3000 pull requests, и эти реквесты толком вовремя не закрываются, и авторы вообще не успевают даже читать эти pull requests, потому что новые открываются каждые 2 минуты.

Это нереально: один человек не может справиться с этим. Тут нужна команда из 20 инженеров, которые будут заниматься только просмотром и code review pull request’ов и фильтрацией спама. Поэтому OpenClaw сейчас в таком состоянии, что пользоваться им практически невозможно.

Там какие-то десятки запутанных фич, их command-line interface имеет сотни и сотни команд, в которые нужно все проверять или делегировать агенту. Которые постоянно ломают что-то. Любая команда - это как минное поле: вызвал - что-то ещё сломалось. Или эта команда не сработала, или что-то из предыдущего вызова команды блокирует эту команду, и нужно теперь откатывать конфигурацию.

Какие-то непонятные постоянные предупреждения, крики о безопасности, аудиты безопасности, что только нет. Мне вообще это не нужно, потому что я гоняю ассистента локально и среди круга доверенных мне людей. Но вместо этого мой ассистент получает огромные крики о prompt-инъекциях каждый раз, когда он вызывает инструмент поиска в браузере. И при этом всё равно каждый третий скилл на ClawHub - с вируснёй, рекламой или промпт-инъекцией. И всё это невозможно сконфигурировать, нужно идти патчить исходный код, но каждый патч вызывает конфликты, потому что за день в репозитории может быть 250 коммитов, и релизы тоже происходят каждый день с добавлением всё новых и новых бесполезных фич. Например, каких-то непонятных мессенджеров, какие-то непонятные пайплайны, ещё больше инструментов. У OpenClaw по умолчанию дефолтная конфигурация - больше 25 инструментов, и это путает адски модель. Из этих инструментов практически никакие не работают. Нет никакой фильтрации для модели. Например, apply patch - есть такой инструмент, он подходит только для моделей GPT, потому что никакие другие модели не тренированы на структуре патчей. А следовательно, с моделями Gemini их использовать нельзя, иначе модель не справится. Вместо этого apply patch стоит по дефолту, и если не поменять эту конфигурацию, то Gemini работать не сможет.

А вместо apply patch ему даются какие-то непонятные недоделанные тулы, create, edit, которые тоже опять же не нужны, потому что есть баш команды. Десктоп приложения создаёт дубликаты сервисов, не закрывается толком, лагает, постоянно крашится, некорректно обрабатывает разрешение. Фоновые работники не присылают результаты, ошибки API-ключей или rate-лимиты полностью блокируют ваш workflow, и вам нужно копаться в исходниках, чтобы найти секретный файл с ключами, где вам нужно вручную менять таймстемпы.

Если вы упёрлись хоть раз в rate-лимиты, fallback моделей толком не работает. Сообщения в телеге не стримятся и обрезаются кусками. Сообщения в телеге иногда просто перестают приходить. Модель путается между каналами и мессенджерами. Модель плохо читает память и плохо обучена в системном промпте соблюдать свою идентичность и прочее. Модель отказывается делать задачи, потому что они заблокированы какими-то тупыми политиками безопасности.

Постоянно какие-то ошибки, связанные с тем, что что-то не разрешено в конфиге, при этом единственный способ - это разобраться, как этот конфиг работает, и вручную поменять JSON. Документация вообще не соответствует текущей ситуации и отстает, на полмесяца. С учётом того, что пушится 200 коммитов в день, она в экспоненциальной прогрессии отстаёт всё больше и больше, и, читая документацию, там вообще не описана половина функционала, а другая половина работает уже давно не так, как описано.

Буквально невозможно стало пользоваться этим, и после того, как я потратил целый вчерашний день - 6 часов - на дебаг проблемы с тем, что блокировалась смена модели, и вот вышеописанную проблему, что модели Anthropic всегда выше по приоритету, почему-то, чем все остальные, я просто психанул, у меня был испорчен весь день, и я удалил OpenClaw.

Мой вердикт

Хоть я и приобрёл крайне негативный опыт с этим, потратил $150 с лишним, я понял, в каком направлении я хочу развивать свой следующий продукт и как я хочу видеть своего ассистента. У меня есть теперь уже pet-проект - это мой агент для программирования, который работает с моей обёрткой кодекса. Я его не open-source’нул ещё, потому что он недопилен, там не хватает фич, которые я бы хотел видеть. Плюс поставить его пришлось на паузу, потому что я сейчас полностью занят поиском клиентов для моей фрилансерской карьеры, но он станет фундаментом нового продукта.

Но этот опыт дал мне понять, каким я хочу видеть личного секретаря и ассистента, и как я могу сделать его без всех этих косяков, и дать ему в 10 раз больше возможностей. Очень хочется создать этого ассистента как продукт, и пока что единственное, что меня останавливает, это то, что я полностью сейчас погружён именно в консалтинговые начинания.

Этот проект как раз даже является логическим продолжением работы над Respawn, потому что у меня в Respawn уже есть готовый чат, но я так и не понимаю, куда же мне его всё-таки деть, куда его пристроить, потому что простые агентные чат-боты - это уже прошлый век, и Respawn может быть куда более полезен людям как полноценный ассистент. Скорее всего, большую часть кода нового ассистента я как раз там и использую.

Но я понимаю, куда движется будущее ИИ, и я думаю, что Пётр Стайнбергер прав - 80% приложений пропадут, потому что за нас работать будут орава наших личных секретарей, и я хочу создать теперь продукт, который будет следующим шагом в развитии индустрии, после OpenClaw.

Я потратил $150 и 5 дней тестируя OpenClaw со всеми топовыми моделями. Мой вердикт о будущем ИИ-ассистентов.

Не все модели подходят как личный ассистент

GPT-5.2: робот без идентичности

Gemini 3 Pro: идеальный характер, но не вызывает инструменты

MiniMax 2.5: дешёвая, но без личности

Opus 4.6: идеальная модель, но $100 за сутки

Количество багов в OpenClaw

Мой вердикт

Получайте такие посты на почту

Я использую OpenClaw уже месяц. Полный обзор: что это, почему такой хайп, и стоит ли пробовать

Я больше не пишу и не читаю код. AI делает это лучше меня

С 2026 года ухожу в свободное плавание на полгода

Pulse в ChatGPT - как я без этог жил вообще?

Почему я перешёл на split-клавиатуру с 40 клавишами - и вам стоитбовать

Anthropic обнаружили признаки сознания в LLM. Новое исследование об интроспекции ИИ

Я удалил своё приложение на неделю. Вот результат.

Апдейт по разработке блога: LinkedIn, dev.to, SEO и планы на будущее

Я навайбкодил блог за 8 часов с Claude, не написав ни строчки кода

Я переехал с Linux на MacBook Pro M1 2021. Честный обзор всех плюсов после 2 недель использования

Не все модели подходят как личный ассистент

GPT-5.2: робот без идентичности

Gemini 3 Pro: идеальный характер, но не вызывает инструменты

MiniMax 2.5: дешёвая, но без личности

Opus 4.6: идеальная модель, но $100 за сутки

Количество багов в OpenClaw

Мой вердикт

Получайте такие посты на почту

Другие похожие статьи

Я использую OpenClaw уже месяц. Полный обзор: что это, почему такой хайп, и стоит ли пробовать

Я больше не пишу и не читаю код. AI делает это лучше меня

С 2026 года ухожу в свободное плавание на полгода

Pulse в ChatGPT - как я без этог жил вообще?

Почему я перешёл на split-клавиатуру с 40 клавишами - и вам стоитбовать

Anthropic обнаружили признаки сознания в LLM. Новое исследование об интроспекции ИИ

Я удалил своё приложение на неделю. Вот результат.

Апдейт по разработке блога: LinkedIn, dev.to, SEO и планы на будущее

Я навайбкодил блог за 8 часов с Claude, не написав ни строчки кода

Я переехал с Linux на MacBook Pro M1 2021. Честный обзор всех плюсов после 2 недель использования