Декабрь 2024-го. Бот в Telegram у одного клиента три часа подряд отвечает на вопросы по запчастям к KAMA Tyres. Модель - GigaChat Pro. Клиент звонит и говорит: «слушай, у нас в чате что-то странное, бот написал заказчику, что мы заберём его шины и привезём через два дня, а адрес взял из ниоткуда». Лезу в логи. Действительно: модель сгаллюцинировала курьерскую доставку, которой у нас нет, и сама придумала адрес склада в Магнитогорске. Магнитогорска у клиента тоже нет.

Это GigaChat в декабре прошлого года.

Апрель 2026-го. Тот же клиент, те же запчасти, та же модель - только версии 3.0 на API. На вопросы про доставку бот говорит «уточните в личном кабинете», на запрос «дайте адрес склада» уходит в tool_call к их 1С и достаёт правильный. За месяц 14 000 диалогов, ноль галлюцинаций о курьерских адресах. Счёт за токены - 9 200 ₽.

GigaChat за полтора года стал нормальной production-моделью. Не топовой - в русскоязычных задачах сравним с GPT-5, в англоязычных и сложной логике сильно слабее Claude Sonnet 4.6. Но для русского SMB это сейчас самый внятный вариант, особенно если данные клиентов нельзя пускать через зарубежные API. Ниже - про то, где GigaChat реально вытаскивает, где роняет проекты, и про деньги.

Что такое GigaChat в апреле 2026 - короткий апдейт

Если вы последний раз смотрели на GigaChat в 2023-м и решили, что это поделка - стоит посмотреть ещё раз.

GigaChat от Сбера - это семейство языковых моделей, развёрнутых на инфраструктуре СберТеха внутри РФ. Сейчас в обойме три рабочие модели:

  • GigaChat Lite - быстрая, дешёвая, для классификации и простых ответов. По уровню рядом с Haiku 4.5 и GPT-5 Mini.
  • GigaChat Pro - основной рабочий конь. На русскоязычных задачах примерно как средний Sonnet, на английском заметно слабее.
  • GigaChat Max - топовая, медленная, для сложных рассуждений. Бенчмарки от Сбера показывают уровень GPT-5, в моих замерах догоняет процентов на 80 - этого хватает для большинства бизнес-сценариев, но не для научных задач или сложного кода.

Вокруг моделей есть вся обвязка, которую ждёшь от взрослого LLM-стека: function calling в формате OpenAI, эмбеддинги, мультимодальность через GigaChat Vision (читает PDF и сканы документов), API с лимитами и тарификацией по токенам. С декабря 2024-го появился полноценный SDK на Python и Node, в него уже завезли streaming, structured outputs и асинхронные запросы.

Главное, чем GigaChat отличается от GPT и Claude - он живёт целиком в РФ. Это важно по двум причинам:

Первая - 152-ФЗ. Если бизнес обрабатывает персональные данные пользователей (имя, телефон, email, любые комментарии), и эти данные попадают в LLM-промпт - модель должна быть в стране. Ставить OpenAI в проект, где боту пишут реальные клиенты с именами и телефонами, значит ловить претензию РКН ровно после первой жалобы конкурента. Подробнее про это разбирал в материале про обучение ИИ на данных компании и 152-ФЗ.

Вторая - оплата. Карты Visa и Mastercard российских банков OpenAI принимать не хочет. Решения через посредников и крипту работают, но юрлицу с белой бухгалтерией такое не подходит: чек не закроешь, акт не подпишешь. Сбер выставляет счёт от ПАО Сбербанк, оплата с расчётного счёта, акт-счёт-фактура в карману.

Где GigaChat реально вывозит

Это не комплимент моделям Сбера. Это список задач, на которых я её пробовал последние полтора года и где она не разочаровывала.

Русскоязычная классификация и роутинг

Бот в Telegram получает 800-1500 сообщений в день. Каждое надо распознать: это запрос статуса заказа, претензия, новый лид, спам, голосовое от бабушки или попытка флирта. На GPT-5 Mini это работало неплохо, но у клиентов жгло на оплате - где-то 12-18 тысяч в месяц только на классификации. На GigaChat Lite то же самое стоит 1 800 ₽ в месяц при сравнимом качестве. Точность на русском у Lite даже чуть выше - примерно 96% против 92% на бенчмарке, который я гонял на 600 реальных сообщениях из CRM клиента.

Ответы на типовые вопросы клиентов

Бот для интернет-магазина детских товаров. Вопросы вроде «есть ли подгузники Pampers Premium Care 4 в наличии в Краснодаре», «когда привезёте в пункт самовывоза», «где забрать заказ номер такой-то». Если в RAG лежит актуальный остаток и таблица пунктов - GigaChat Pro отвечает не хуже GPT-5. Особенно хорошо он держит русский деловой тон без лишней приторности, которую GPT часто включает («Здравствуйте, дорогой клиент!» - спасибо, не надо).

Структурированный вывод и работа с документами

GigaChat Vision читает скан-копии счетов и накладных, отдаёт структурированный JSON с датами, суммами, контрагентами. Точность на хороших сканах - 92-95%, на мятых фотках от прораба со стройки - 78-85%. Это нормально, такая же точность у GPT-5 Vision. У YandexGPT с распознаванием документов история хуже - там зрение появилось позже и пока сыровато.

Интеграция с 1С и Битрикс24 через function calling

Это где GigaChat реально удивил. В версии 3.0 завезли function calling по OpenAI-совместимой схеме. Можно описать функции get_order_by_id, create_ticket, find_customer_by_phone - модель начинает корректно их вызывать. Раньше для русскоязычных задач приходилось крутить целую оркестрацию через n8n и контрольные промпты. Сейчас GigaChat сам решает, когда дёргать API 1С, и не путается, в отличие от ранних версий.

Голосовые сценарии

С декабря 2025-го в API появилась прямая интеграция с SaluteSpeech - синтез и распознавание голоса от того же Сбера. Latency на полный цикл «голос пришёл - модель отдала текст - синтезировался ответ» - 1.2-1.6 секунды. Для голосового агента в колл-центре это уже на грани приемлемого. Для сравнения - связка ElevenLabs + GPT-5 работает за 0.9 секунды, но через зарубежные API, что тащит за собой все те же 152-ФЗ-проблемы.

Где GigaChat сливается, и об этом говорят шёпотом

Английский язык и техническая документация

Если задача - анализ англоязычного PDF с технической спецификацией или ревью кода на TypeScript - GigaChat не выбор. Pro и Max просаживаются на сложной англоязычной семантике, иногда переводят термины в стиле «инстанс - это случай», иногда теряют нить рассуждения. Если 60% задачи - английский, берите Claude или GPT.

Длинный контекст с разнородной информацией

Контекст у Pro - 32k токенов, у Max - 128k. На бумаге выглядит ок. На практике, когда в контекст пихаешь 80 страниц договора плюс инструкцию плюс примеры - модель начинает терять середину. Это не уникальная проблема, у GPT и Claude та же беда на длинных контекстах, но у GigaChat она наступает раньше. Метрика «потеря в середине контекста» (lost-in-the-middle) у Pro заметнее, чем у среднего Sonnet.

Решение - не надеяться на длинный контекст, а дробить через RAG. Это правильно для любой LLM, но к GigaChat применять надо в обязательном порядке.

Многошаговое рассуждение и логические цепочки

Задача из реального проекта: «у клиента три параллельных заявки в разных статусах, посмотри какая из них старше всего, запроси у системы соответствующий SLA по тарифу клиента и сообщи, в какие сроки она должна была быть закрыта». GigaChat Pro путается. Начинает считать SLA от первой заявки, а смотреть статус у второй. GigaChat Max справляется, но не всегда с первого раза. Claude Sonnet 4.6 и GPT-5 на той же задаче выдают точный ответ в 95+% случаев.

Если в проекте много многоступенчатой логики «сделай А, потом Б на основе А, потом В если Б вернуло такое-то» - GigaChat сейчас не выбор. Берите модель посильнее или раскладывайте логику в код, а LLM используйте как тонкий слой интерпретации.

Креативный текст и юмор

С деловой прозой GigaChat справляется нормально - письма, объявления, описания товаров пишет ровно и без лишнего пафоса. А вот художественный текст, мета-юмор, тонкая ирония, нестандартные форматы - получаются ватные. GPT-5 и Claude в творческих задачах ощутимо живее. Если ваш сценарий - бот, который флиртует с пользователями или пишет стендап про маркетплейсы, GigaChat будет грустной шуткой.

Сколько это стоит на самом деле

Цены на API меняются раз в полгода, актуально на апрель 2026:

МодельВход (₽/1М токенов)Выход (₽/1М токенов)Где использовать
GigaChat Lite18 ₽56 ₽классификация, простые ответы
GigaChat Pro90 ₽280 ₽основной рабочий слой
GigaChat Max360 ₽1 080 ₽сложная логика, документы

Для сравнения, OpenAI GPT-5 стоит в пересчёте по курсу около 240 ₽ за миллион входных токенов и 960 ₽ за миллион выходных. То есть GigaChat Pro где-то в 2.5-3 раза дешевле GPT-5, при сопоставимом качестве на русских задачах.

Реальные счета у моих клиентов выглядят так:

  • Telegram-бот для шиномонтажа (1 200 запросов в день, GigaChat Lite + Pro): 2 800 ₽ в месяц.
  • Автоотчёты для маркетингового агентства (60 отчётов в неделю, GigaChat Pro): 5 400 ₽ в месяц.
  • AI-ассистент проджект-менеджера в digital-агентстве (Pro + Vision): 8 100 ₽ в месяц.
  • Голосовой бот для колл-центра автосервиса (700 звонков в неделю, Pro + SaluteSpeech): 18 000 ₽ в месяц.

Это операционка - токены и голос. Разработка решений - отдельные деньги, это не про статью. Но порядок цифр важен: GigaChat не делает счета за модель основной статьёй расходов на ИИ-агента. Основная статья - это инфраструктура, разработка и поддержка. Модель - почти бесплатно по сравнению с зарплатой одного джуна.

Если запихать клиентов в OpenAI - те же сценарии стоили бы 7-50 тысяч в месяц по модели. Плюс возня с оплатой через посредников. Плюс юридические риски на персональных данных.

Когда GigaChat - не выбор

Чтобы не было ощущения рекламы Сбера, отдельно про случаи, где не надо его брать.

Если бизнес международный или есть планы выхода за пределы РФ в ближайшие год-полтора. И англоязычный контент тянет хуже, и за границей GigaChat воспринимают как чисто русскую штуку - не дискриминация, а реальность позиционирования при разговоре с инвесторами или зарубежными подрядчиками.

Если в проекте критична сложная логика вывода. Юридические выводы, медицинская диагностика, анализ финансовых рисков - там модель должна быть лучшей из доступных. Сейчас это Claude или GPT, и платить за посредников и юристов по 152-ФЗ оправдано. Архитектурные принципы выбора модели разбирал отдельно в инженерном разборе ИИ-агента.

Если все ваши данные уже в Google Workspace или Microsoft 365, и интеграция нужна туда. GigaChat живёт в собственной экосистеме Сбера, и хотя API стандартный, готовых коннекторов к зарубежным SaaS меньше. С OpenAI быстрее и дешевле по часам разработчика.

Если поток запросов меньше 100-150 в день. Тогда экономия на токенах теряется в шуме других расходов, а возни с регистрацией юрлица в Сбер ID и подписанием договора - больше, чем выигрыш. На таких объёмах проще взять готового бота с подпиской.

Что менять, если уже на GigaChat и хотите выжать максимум

Четыре вещи, на которые я бы потратил вечер сразу после запуска.

Кешируйте всё, что можно. GigaChat не умеет prompt caching на уровне API - в отличие от Anthropic. Зато кеш-промежуточный слой делается на n8n или в FastAPI за один вечер. На повторяющихся запросах экономит 30-50% бюджета.

Не пихайте Vision-распознавание сканов в общий промпт. Запускайте отдельным шагом: сначала Vision вытащил структурированный JSON, потом этот JSON ушёл в текстовую модель для рассуждения. Иначе теряется и точность, и токены.

Проверяйте лимит запросов. На стандартном тарифе он 100 RPS на ключ, на Pro-тарифе 500 RPS. Голосовому боту с пиком на 17:00 этого не хватит. Лимит апгрейдится через тикет в саппорте, обычно за 1-2 рабочих дня. И сразу делайте отдельные ключи на каждого клиента - билинг Сбер по проектам не разнесёт сам, путаница в счетах вылезет на пятом клиенте.

Обновляйте версию SDK. Между декабрём 2024 и апрелем 2026 в SDK подвозили streaming, structured outputs, function calling по новой схеме, asyncio. Старые версии заставляют писать костыли там, где новые делают всё из коробки. Подробности по интеграции через n8n разбирал в материале про n8n + Make + Telegram.

Брать или не брать

GigaChat за полтора года перешёл из категории «забавная штука для презентаций Сбера» в категорию «нормальный production-выбор для русскоязычного SMB-проекта».

Он не убивает GPT и Claude. На сложных задачах, английском контенте, многошаговой логике - они объективно сильнее. Но для типичных сценариев русскоязычного бизнеса - бот в Telegram, автоотчёты для агентства, ИИ-ассистент в 1С, голосовой агент в колл-центре - GigaChat сейчас оптимальный выбор по балансу цены, качества и юридической чистоты.

Если стек проекта целиком на территории РФ, и в нём не нужна суперсложная логика - GigaChat работает без танцев. Если в проекте много английского языка или критична сложная цепочка рассуждений - смотрите Claude или GPT, и закладывайте бюджет на посредников и юристов по 152-ФЗ.

И последнее. Не верьте презентациям. Прогоняйте свои реальные данные через все три модели на сценариях, которые вам нужны - не на «предложите 10 идей для маркетинга», а на «классифицируй вот эту тысячу сообщений из CRM». Бенчмарки от вендоров рисуются под маркетинг, ваша таблица в Excel - под реальность. Расхождения иногда удивляют в обе стороны.