Год на GigaChat: где он стреляет, где сливается и сколько на самом деле стоит
Декабрь 2024-го. Бот в Telegram у одного клиента три часа подряд отвечает на вопросы по запчастям к KAMA Tyres. Модель - GigaChat Pro. Клиент звонит и говорит: «слушай, у нас в чате что-то странное, бот написал заказчику, что мы заберём его шины и привезём через два дня, а адрес взял из ниоткуда». Лезу в логи. Действительно: модель сгаллюцинировала курьерскую доставку, которой у нас нет, и сама придумала адрес склада в Магнитогорске. Магнитогорска у клиента тоже нет.
Это GigaChat в декабре прошлого года.
Апрель 2026-го. Тот же клиент, те же запчасти, та же модель - только версии 3.0 на API. На вопросы про доставку бот говорит «уточните в личном кабинете», на запрос «дайте адрес склада» уходит в tool_call к их 1С и достаёт правильный. За месяц 14 000 диалогов, ноль галлюцинаций о курьерских адресах. Счёт за токены - 9 200 ₽.
GigaChat за полтора года стал нормальной production-моделью. Не топовой - в русскоязычных задачах сравним с GPT-5, в англоязычных и сложной логике сильно слабее Claude Sonnet 4.6. Но для русского SMB это сейчас самый внятный вариант, особенно если данные клиентов нельзя пускать через зарубежные API. Ниже - про то, где GigaChat реально вытаскивает, где роняет проекты, и про деньги.
Что такое GigaChat в апреле 2026 - короткий апдейт
Если вы последний раз смотрели на GigaChat в 2023-м и решили, что это поделка - стоит посмотреть ещё раз.
GigaChat от Сбера - это семейство языковых моделей, развёрнутых на инфраструктуре СберТеха внутри РФ. Сейчас в обойме три рабочие модели:
- GigaChat Lite - быстрая, дешёвая, для классификации и простых ответов. По уровню рядом с Haiku 4.5 и GPT-5 Mini.
- GigaChat Pro - основной рабочий конь. На русскоязычных задачах примерно как средний Sonnet, на английском заметно слабее.
- GigaChat Max - топовая, медленная, для сложных рассуждений. Бенчмарки от Сбера показывают уровень GPT-5, в моих замерах догоняет процентов на 80 - этого хватает для большинства бизнес-сценариев, но не для научных задач или сложного кода.
Вокруг моделей есть вся обвязка, которую ждёшь от взрослого LLM-стека: function calling в формате OpenAI, эмбеддинги, мультимодальность через GigaChat Vision (читает PDF и сканы документов), API с лимитами и тарификацией по токенам. С декабря 2024-го появился полноценный SDK на Python и Node, в него уже завезли streaming, structured outputs и асинхронные запросы.
Главное, чем GigaChat отличается от GPT и Claude - он живёт целиком в РФ. Это важно по двум причинам:
Первая - 152-ФЗ. Если бизнес обрабатывает персональные данные пользователей (имя, телефон, email, любые комментарии), и эти данные попадают в LLM-промпт - модель должна быть в стране. Ставить OpenAI в проект, где боту пишут реальные клиенты с именами и телефонами, значит ловить претензию РКН ровно после первой жалобы конкурента. Подробнее про это разбирал в материале про обучение ИИ на данных компании и 152-ФЗ.
Вторая - оплата. Карты Visa и Mastercard российских банков OpenAI принимать не хочет. Решения через посредников и крипту работают, но юрлицу с белой бухгалтерией такое не подходит: чек не закроешь, акт не подпишешь. Сбер выставляет счёт от ПАО Сбербанк, оплата с расчётного счёта, акт-счёт-фактура в карману.
Где GigaChat реально вывозит
Это не комплимент моделям Сбера. Это список задач, на которых я её пробовал последние полтора года и где она не разочаровывала.
Русскоязычная классификация и роутинг
Бот в Telegram получает 800-1500 сообщений в день. Каждое надо распознать: это запрос статуса заказа, претензия, новый лид, спам, голосовое от бабушки или попытка флирта. На GPT-5 Mini это работало неплохо, но у клиентов жгло на оплате - где-то 12-18 тысяч в месяц только на классификации. На GigaChat Lite то же самое стоит 1 800 ₽ в месяц при сравнимом качестве. Точность на русском у Lite даже чуть выше - примерно 96% против 92% на бенчмарке, который я гонял на 600 реальных сообщениях из CRM клиента.
Ответы на типовые вопросы клиентов
Бот для интернет-магазина детских товаров. Вопросы вроде «есть ли подгузники Pampers Premium Care 4 в наличии в Краснодаре», «когда привезёте в пункт самовывоза», «где забрать заказ номер такой-то». Если в RAG лежит актуальный остаток и таблица пунктов - GigaChat Pro отвечает не хуже GPT-5. Особенно хорошо он держит русский деловой тон без лишней приторности, которую GPT часто включает («Здравствуйте, дорогой клиент!» - спасибо, не надо).
Структурированный вывод и работа с документами
GigaChat Vision читает скан-копии счетов и накладных, отдаёт структурированный JSON с датами, суммами, контрагентами. Точность на хороших сканах - 92-95%, на мятых фотках от прораба со стройки - 78-85%. Это нормально, такая же точность у GPT-5 Vision. У YandexGPT с распознаванием документов история хуже - там зрение появилось позже и пока сыровато.
Интеграция с 1С и Битрикс24 через function calling
Это где GigaChat реально удивил. В версии 3.0 завезли function calling по OpenAI-совместимой схеме. Можно описать функции get_order_by_id, create_ticket, find_customer_by_phone - модель начинает корректно их вызывать. Раньше для русскоязычных задач приходилось крутить целую оркестрацию через n8n и контрольные промпты. Сейчас GigaChat сам решает, когда дёргать API 1С, и не путается, в отличие от ранних версий.
Голосовые сценарии
С декабря 2025-го в API появилась прямая интеграция с SaluteSpeech - синтез и распознавание голоса от того же Сбера. Latency на полный цикл «голос пришёл - модель отдала текст - синтезировался ответ» - 1.2-1.6 секунды. Для голосового агента в колл-центре это уже на грани приемлемого. Для сравнения - связка ElevenLabs + GPT-5 работает за 0.9 секунды, но через зарубежные API, что тащит за собой все те же 152-ФЗ-проблемы.
Где GigaChat сливается, и об этом говорят шёпотом
Английский язык и техническая документация
Если задача - анализ англоязычного PDF с технической спецификацией или ревью кода на TypeScript - GigaChat не выбор. Pro и Max просаживаются на сложной англоязычной семантике, иногда переводят термины в стиле «инстанс - это случай», иногда теряют нить рассуждения. Если 60% задачи - английский, берите Claude или GPT.
Длинный контекст с разнородной информацией
Контекст у Pro - 32k токенов, у Max - 128k. На бумаге выглядит ок. На практике, когда в контекст пихаешь 80 страниц договора плюс инструкцию плюс примеры - модель начинает терять середину. Это не уникальная проблема, у GPT и Claude та же беда на длинных контекстах, но у GigaChat она наступает раньше. Метрика «потеря в середине контекста» (lost-in-the-middle) у Pro заметнее, чем у среднего Sonnet.
Решение - не надеяться на длинный контекст, а дробить через RAG. Это правильно для любой LLM, но к GigaChat применять надо в обязательном порядке.
Многошаговое рассуждение и логические цепочки
Задача из реального проекта: «у клиента три параллельных заявки в разных статусах, посмотри какая из них старше всего, запроси у системы соответствующий SLA по тарифу клиента и сообщи, в какие сроки она должна была быть закрыта». GigaChat Pro путается. Начинает считать SLA от первой заявки, а смотреть статус у второй. GigaChat Max справляется, но не всегда с первого раза. Claude Sonnet 4.6 и GPT-5 на той же задаче выдают точный ответ в 95+% случаев.
Если в проекте много многоступенчатой логики «сделай А, потом Б на основе А, потом В если Б вернуло такое-то» - GigaChat сейчас не выбор. Берите модель посильнее или раскладывайте логику в код, а LLM используйте как тонкий слой интерпретации.
Креативный текст и юмор
С деловой прозой GigaChat справляется нормально - письма, объявления, описания товаров пишет ровно и без лишнего пафоса. А вот художественный текст, мета-юмор, тонкая ирония, нестандартные форматы - получаются ватные. GPT-5 и Claude в творческих задачах ощутимо живее. Если ваш сценарий - бот, который флиртует с пользователями или пишет стендап про маркетплейсы, GigaChat будет грустной шуткой.
Сколько это стоит на самом деле
Цены на API меняются раз в полгода, актуально на апрель 2026:
| Модель | Вход (₽/1М токенов) | Выход (₽/1М токенов) | Где использовать |
|---|---|---|---|
| GigaChat Lite | 18 ₽ | 56 ₽ | классификация, простые ответы |
| GigaChat Pro | 90 ₽ | 280 ₽ | основной рабочий слой |
| GigaChat Max | 360 ₽ | 1 080 ₽ | сложная логика, документы |
Для сравнения, OpenAI GPT-5 стоит в пересчёте по курсу около 240 ₽ за миллион входных токенов и 960 ₽ за миллион выходных. То есть GigaChat Pro где-то в 2.5-3 раза дешевле GPT-5, при сопоставимом качестве на русских задачах.
Реальные счета у моих клиентов выглядят так:
- Telegram-бот для шиномонтажа (1 200 запросов в день, GigaChat Lite + Pro): 2 800 ₽ в месяц.
- Автоотчёты для маркетингового агентства (60 отчётов в неделю, GigaChat Pro): 5 400 ₽ в месяц.
- AI-ассистент проджект-менеджера в digital-агентстве (Pro + Vision): 8 100 ₽ в месяц.
- Голосовой бот для колл-центра автосервиса (700 звонков в неделю, Pro + SaluteSpeech): 18 000 ₽ в месяц.
Это операционка - токены и голос. Разработка решений - отдельные деньги, это не про статью. Но порядок цифр важен: GigaChat не делает счета за модель основной статьёй расходов на ИИ-агента. Основная статья - это инфраструктура, разработка и поддержка. Модель - почти бесплатно по сравнению с зарплатой одного джуна.
Если запихать клиентов в OpenAI - те же сценарии стоили бы 7-50 тысяч в месяц по модели. Плюс возня с оплатой через посредников. Плюс юридические риски на персональных данных.
Когда GigaChat - не выбор
Чтобы не было ощущения рекламы Сбера, отдельно про случаи, где не надо его брать.
Если бизнес международный или есть планы выхода за пределы РФ в ближайшие год-полтора. И англоязычный контент тянет хуже, и за границей GigaChat воспринимают как чисто русскую штуку - не дискриминация, а реальность позиционирования при разговоре с инвесторами или зарубежными подрядчиками.
Если в проекте критична сложная логика вывода. Юридические выводы, медицинская диагностика, анализ финансовых рисков - там модель должна быть лучшей из доступных. Сейчас это Claude или GPT, и платить за посредников и юристов по 152-ФЗ оправдано. Архитектурные принципы выбора модели разбирал отдельно в инженерном разборе ИИ-агента.
Если все ваши данные уже в Google Workspace или Microsoft 365, и интеграция нужна туда. GigaChat живёт в собственной экосистеме Сбера, и хотя API стандартный, готовых коннекторов к зарубежным SaaS меньше. С OpenAI быстрее и дешевле по часам разработчика.
Если поток запросов меньше 100-150 в день. Тогда экономия на токенах теряется в шуме других расходов, а возни с регистрацией юрлица в Сбер ID и подписанием договора - больше, чем выигрыш. На таких объёмах проще взять готового бота с подпиской.
Что менять, если уже на GigaChat и хотите выжать максимум
Четыре вещи, на которые я бы потратил вечер сразу после запуска.
Кешируйте всё, что можно. GigaChat не умеет prompt caching на уровне API - в отличие от Anthropic. Зато кеш-промежуточный слой делается на n8n или в FastAPI за один вечер. На повторяющихся запросах экономит 30-50% бюджета.
Не пихайте Vision-распознавание сканов в общий промпт. Запускайте отдельным шагом: сначала Vision вытащил структурированный JSON, потом этот JSON ушёл в текстовую модель для рассуждения. Иначе теряется и точность, и токены.
Проверяйте лимит запросов. На стандартном тарифе он 100 RPS на ключ, на Pro-тарифе 500 RPS. Голосовому боту с пиком на 17:00 этого не хватит. Лимит апгрейдится через тикет в саппорте, обычно за 1-2 рабочих дня. И сразу делайте отдельные ключи на каждого клиента - билинг Сбер по проектам не разнесёт сам, путаница в счетах вылезет на пятом клиенте.
Обновляйте версию SDK. Между декабрём 2024 и апрелем 2026 в SDK подвозили streaming, structured outputs, function calling по новой схеме, asyncio. Старые версии заставляют писать костыли там, где новые делают всё из коробки. Подробности по интеграции через n8n разбирал в материале про n8n + Make + Telegram.
Брать или не брать
GigaChat за полтора года перешёл из категории «забавная штука для презентаций Сбера» в категорию «нормальный production-выбор для русскоязычного SMB-проекта».
Он не убивает GPT и Claude. На сложных задачах, английском контенте, многошаговой логике - они объективно сильнее. Но для типичных сценариев русскоязычного бизнеса - бот в Telegram, автоотчёты для агентства, ИИ-ассистент в 1С, голосовой агент в колл-центре - GigaChat сейчас оптимальный выбор по балансу цены, качества и юридической чистоты.
Если стек проекта целиком на территории РФ, и в нём не нужна суперсложная логика - GigaChat работает без танцев. Если в проекте много английского языка или критична сложная цепочка рассуждений - смотрите Claude или GPT, и закладывайте бюджет на посредников и юристов по 152-ФЗ.
И последнее. Не верьте презентациям. Прогоняйте свои реальные данные через все три модели на сценариях, которые вам нужны - не на «предложите 10 идей для маркетинга», а на «классифицируй вот эту тысячу сообщений из CRM». Бенчмарки от вендоров рисуются под маркетинг, ваша таблица в Excel - под реальность. Расхождения иногда удивляют в обе стороны.