Если ставите LLM в продакшен и работаете в РФ, между западными моделями и собственной серверной фермой есть удобная средняя дорожка - российские облачные LLM. Их две основных: YandexGPT от Yandex Cloud и GigaChat от Сбера. Обе доступны по API, обе работают на русских серверах, обе закрывают 152-ФЗ. Различаются по цене, скорости, качеству на разных задачах и удобству интеграции.

За последний год я ставил оба варианта десяткам клиентов. Тут раскладываю что выбирать под каких клиентов и под какие сценарии, на основе живых тестов и цифр из биллинга.

Регистрация и старт

YandexGPT. Заводите аккаунт в Yandex Cloud (можно через корп. почту, можно через личную). Создаёте платёжный аккаунт, привязываете карту или расчётный счёт ИП/ООО. Создаёте сервис-аккаунт, выпускаете API-ключ. От нуля до первого запроса - 20-40 минут, если до этого не пользовались Yandex Cloud.

GigaChat. Регистрируетесь на developers.sber.ru через Сбер ID. Включаете GigaChat API в кабинете, получаете credentials (Client ID + Authorization Key). Документы: согласие на обработку, потом подключают тариф. От нуля до первого запроса - 1-3 рабочих дня, если на стороне Сбера никто не тянет.

GigaChat выигрывает по поддержке корпоративных клиентов (живой менеджер, договор оферты). YandexGPT выигрывает по скорости старта (всё self-service, без живых людей).

Цены в реальных деньгах (май 2026)

Беру самые ходовые модели каждой платформы.

ПараметрYandexGPT ProGigaChat Pro
Контекстное окно8 тыс. токенов32 тыс. токенов
Цена за 1М input-токенов~480 ₽~600 ₽
Цена за 1М output-токенов~960 ₽~1 200 ₽
Бесплатный тариф для тестов1М токенов/мес1М токенов/мес
Запросов в секундудо 10 (можно расширить)до 20
Embeddingsда (отдельный pricing)да (0,1 ₽ / 1000 токенов)

YandexGPT дешевле примерно на 20%. GigaChat даёт в 4 раза больше контекста за раз (32k vs 8k токенов), что критично если работаете с длинными документами или диалогами.

Для типового SMB-проекта (FAQ-бот с 5-10 тысячами сообщений в месяц) бюджет на токены выходит:

  • YandexGPT: 3-7 тыс. ₽/мес
  • GigaChat: 4-9 тыс. ₽/мес

Это не та сумма, по которой стоит выбирать. Решает качество и удобство.

Live-тесты на 5 одинаковых задачах

Гонял обе модели на типичных SMB-сценариях. Тестировались YandexGPT Pro (yandexgpt-2/latest) и GigaChat Pro. Промпт один на двоих, без специальной заточки.

Задача 1: FAQ-бот для интернет-магазина

Промпт: "Ты консультант магазина электроники. Отвечай только по фактам из базы. Если ответа нет - говори 'уточняю у менеджера'. Тон дружелюбный, без канцелярита."

Результат: обе хорошо. YGPT короче и более прямой. GigaChat теплее, добавляет вежливые обороты. Для разных аудиторий выбор разный: молодые клиенты - YGPT, более возрастные - GigaChat.

Задача 2: Классификация входящих писем

Промпт: разбить 100 примеров писем на 5 категорий (жалоба, заказ, гарантия, прочее, спам). Эталон проверен вручную.

  • YandexGPT: точность 89%, путал жалобы с гарантийными случаями
  • GigaChat: точность 92%, систематически чаще угадывал контекст

GigaChat выигрывает на структурных задачах. Разница не радикальная, но видна.

Задача 3: Парсинг счёта из текстового описания

Дать модели текст счёта (без структуры), вытащить JSON: контрагент, ИНН, сумма, НДС, дата, перечень позиций.

  • YandexGPT: 78% успешных парсингов, чаще ошибается в распознавании ИНН и сумм с пробелами
  • GigaChat: 86%, точнее в работе с числами и форматом российских документов

GigaChat явно лучше понимает локальные бизнес-форматы (УПД, КС-2, счета-фактуры).

Задача 4: Генерация описаний товаров для маркетплейса

Промпт: "Сгенерируй продающее описание товара по характеристикам. Длина 200-300 символов. Без слов 'инновационный', 'уникальный', 'качественный'."

  • YandexGPT: тексты ровнее, литературнее, чаще попадает в лимит длины
  • GigaChat: тексты эмоциональнее, чаще нарушает лимит, иногда возвращается к запрещённым словам

Для контента ровнее YGPT. Для эмоциональных категорий (косметика, мода, подарки) GC лучше попадает в тон.

Задача 5: Длинный документ - выжимка договора на 20 страниц

GigaChat: справляется в один запрос (32k токенов хватает). YandexGPT: приходится резать документ на куски (8k предел), потом склеивать выжимки - получается дороже в итоге и медленнее.

На задачах с длинным контекстом GigaChat безоговорочно лучше.

Сводная таблица: что куда

СценарийYandexGPTGigaChat
FAQ-бот с короткими ответамиХорошоХорошо
Классификация писем / заявокOKЛучше
Парсинг российских документов (1С, УПД, КС)OKЛучше
Генерация контента (карточки товаров, статьи)ЛучшеOK
Работа с длинными документами (>5 страниц)ПлохоЛучше
Голосовой агент с TTSЛучше (SpeechKit под рукой)OK (SaluteSpeech)
Стоимость на средних объёмахДешевле на 20%Дороже
Интеграция с Yandex Cloud (Functions, Object Storage)Лучше-
Интеграция с экосистемой Сбера (СберCRM, СберПлатформа)-Лучше
Поддержка корпоративных клиентовБазоваяСильнее

152-ФЗ и серверы

Обе платформы держат серверы в РФ, обе подходят под 152-ФЗ. Различия:

  • YandexGPT - можно использовать prompt-protection (запрос не сохраняется на стороне Yandex), есть отдельные тарифы с гарантиями по обработке персданных
  • GigaChat - аналогично, плюс есть on-premise вариант для крупных клиентов (стоит миллионы, для SMB неактуально)

Если у вас обычные клиентские данные (имена, телефоны, заказы), и вы оператор персданных по 152-ФЗ - обе модели подходят. Если у вас финансовые/медицинские/юридические данные особой категории - готовьтесь к договору с обработчиком и DPA, и тут проще через Сбер, у них корпоративная связка налажена.

Что выбирать

Если суммировать:

  • YandexGPT - дешевле, быстрее на коротких задачах, лучше для генерации контента, идеален если ваш стек уже в Yandex Cloud
  • GigaChat - точнее на структурных задачах, лучше с длинными документами, лучше понимает российские бизнес-форматы, удобнее для корпоративных интеграций
  • Если бюджет до 5 тыс. ₽/мес и нужны быстрые ответы - YGPT
  • Если объём текста большой или нужна работа с документами - GigaChat
  • Часто оптимум - гибрид. Например, YGPT для коротких ответов клиентам, GigaChat для тяжёлых документов в фоне

Близкие материалы в блоге: год эксплуатации одного только GigaChat - Год на GigaChat, общая канва как пользоваться нейросетями в SMB - Как пользоваться нейросетями для бизнеса в 2026, а архитектура под несколько LLM в одной системе разбиралась в Мультиагентные системы vs боты.

Если планируете внедрение

Стоимость подключения одной из платформ под ключ в SMB-проект:

  • Подключение API + базовая интеграция с CRM/чат-ботом: 60 000 - 120 000 ₽
  • Гибрид YGPT+GigaChat с роутингом запросов: 150 000 - 250 000 ₽
  • Поддержка с тюнингом промптов и мониторингом: 10 000 - 25 000 ₽/мес

Если есть конкретный сценарий применения, пришлите бриф - подберу платформу под ваш кейс и посчитаю стоимость токенов на ваш реальный объём за месяц. Бесплатно до подписания.

Есть процесс, который пора отдать машине?

Опишите задачу в брифе - верну оценку с ценой и сроками за 24 часа. Бесплатно, до подписания.

Оставить заявку