Внедрение AI в бизнес: ИИ-агенты, RAG и голос под ключ
AI это инженерия, не магия. Беру конкретную задачу, оцениваю окупаемость, делаю прототип на ваших данных, переношу в прод. Без коробок, без подписок на чужие платформы, код остаётся у вас.
ваших данных
с готовым стеком
на типовых задачах
окупаемость
Что вы получаете на выходе
Не презентация, не идея, не пилот. Работающая система, которая делает работу за людей с фиксированной точностью.
6 направлений где AI реально работает
Не "общее ускорение работы". Конкретные функции, где экономия считается часами и рублями в первый-второй месяц.
AI в чате и мессенджерах
Бот с RAG по базе знаний закрывает 60-80% обращений сам, сложные эскалирует с уже собранным контекстом. Время первого ответа: с часов до секунд.
Квалификация лидов и сводки звонков
AI размечает входящие заявки по ICP, ставит score, передаёт менеджеру горячих. Авто-сводка после звонка попадает в карточку. Конверсия растёт на 20-35%.
Парсинг счетов, ТТН и договоров
OCR вытаскивает реквизиты, суммы, риски из PDF и фото. AI-сверка с политикой компании, авто-выгрузка в учётку и ЭДО. 30-90% времени бухгалтера в карман.
Колл-центр на AI
Входящие на типовые вопросы, исходящий обзвон (NPS, доставка, реактивация), маршрутизация на оператора по первым 10 секундам разговора.
AI-помощник по регламентам
RAG по корпоративным документам, истории сделок, технической документации. Сотрудник спрашивает на естественном языке — получает ответ со ссылками на источник.
Карточки, КП, посты, рассылки
Описания товаров для маркетплейсов, инфографика через Kandinsky, шаблоны email-рассылок, тексты постов в соцсетях. От 100 до 1500 SKU в день вместо 5-10 руками.
6 фаз от стратегии до сопровождения
Каждый этап — отдельный артефакт, который можно посмотреть и проверить. Никаких "ещё пилим, через месяц покажу".
Аудит и выбор кейса
5-15 потенциальных AI-сценариев с оценкой окупаемости. Выбираем 1-3 первоочередных. Бесплатно до подписания контракта.
Проектирование архитектуры
Выбор LLM, дизайн памяти, список инструментов, гарантии и эскалация, пайплайн данных. ТЗ + диаграмма + примерные промпты.
Прототип на ваших данных
Минимальный рабочий агент на ваших последних 100-500 кейсах. Сравнение с реальными решениями. Точность ≥85% — двигаемся.
Полная сборка
Production-инфраструктура: интеграции, память (RAG-индекс), мониторинг, защита от prompt injection. Работа в shadow mode.
Переход в прод
Постепенное переключение, по 10-20% трафика в день. Усиленный мониторинг точности. Откат за минуты если что-то не так.
Сопровождение и эволюция
Метрики точности и эскалаций, обновление промптов под бизнес-изменения, миграция на новые модели, доработки.
На каких моделях работаю
Не привязан к одному вендору. Выбираю под задачу: данные / стоимость / точность / приватность.
GigaChat Pro
Топ по русскому. Длинные документы, юридика, структурные задачи. 600 ₽ за миллион input-токенов.
YandexGPT Pro
Дешевле GigaChat на 20%, быстрее. Для генерации контента, коротких ответов, ботов с большим RPS.
Claude 4.7
Топ-качество в мире, лучшие reasoning и code. Сложные агенты, длинная аналитика, разбор документов.
GPT-5 / 4.1
Function calling, зрелая экосистема SDK. Для интеграций с готовыми инструментами и тулзовым паттерном.
Llama 3.3 / Qwen 2.5 / Saiga
На вашем GPU-сервере. Полная приватность. Медицина, банкинг, госконтракты — данные не покидают периметр.
GigaChat / Yandex / E5
Векторизация документов, истории сделок, каталогов. Хранение в pgvector / Qdrant / Milvus.
Что уже сделано
Без имён клиентов (NDA), но цифры и стек реальные.
AI в WhatsApp + Avito + сайт с RAG по каталогу
GigaChat + pgvector + n8n + WABA + AmoCRM. Бот закрывает типовые "когда придёт", "есть ли", "сколько доставка", эскалирует сложные с уже собранным контекстом.
Квалификация лидов + сводки звонков + Telegram-помощник
GigaChat + YandexGPT + SpeechKit + amoCRM. AI размечает входящие заявки, расшифровывает звонки, генерит сводку, подсказывает контраргументы под возражения.
Внутренний помощник на Qwen, локально
Qwen 2.5 72B на GPU клиники + RAG по 3000 регламентов и МКБ-кодов. Врач спрашивает на естественном языке, AI отвечает со ссылкой на источник. Никаких облаков.
Сколько это стоит
Фиксированная цена за фиксированный объём. Без часов разработчика и сюрпризов в счёте.
Один AI-кейс
- FAQ-бот или классификатор
- Базовая RAG-база (до 500 docs)
- 1 канал интеграции
- 60 дней гарантии
- Прототип на ваших данных бесплатно
AI-комплекс
- 2-4 связанных AI-кейса
- RAG на 5-30 тыс. документов
- Интеграции CRM + учётка + мессенджеры
- Дашборды метрик качества
- 90 дней гарантии
- Первый месяц поддержки + LLM-токены
AI в операционке
- 5+ AI-компонентов
- Голосовой колл-центр или отраслевой пакет
- Локальная LLM при необходимости
- Обучение команды и регламенты
- 120 дней гарантии
- Технический партнёр первые 3 мес
Частые вопросы
То, что чаще всего спрашивают перед стартом.
Что если ChatGPT отключат для РФ?
Архитектура агента строится так, что LLM это плагин. Если завтра OpenAI/Anthropic отключают — переключаемся на GigaChat / YandexGPT / Llama за день. На большинстве проектов основная модель сразу российская, чтобы не зависеть от геополитики.
Сколько токенов LLM сжигает агент в месяц?
FAQ-бот на 1000 диалогов/мес = 3-5 тыс. ₽ токенов GigaChat. AI-классификатор на 5000 заявок = ~2 тыс. ₽. Голосовой колл-центр на 5000 звонков/день = 80-150 тыс. ₽/мес (STT+TTS+LLM). До старта закладываем расход в смету.
Что с галлюцинациями? AI может всё придумать.
Защищаемся тремя способами: 1) жёсткие промпты "не выдумывай, при отсутствии данных отвечай не знаю"; 2) RAG — AI отвечает только из проверенных источников; 3) grade-of-confidence — на критичных решениях shadow mode и ручное подтверждение. Точность на типовых задачах после тюнинга — 95-99%.
Можно ли использовать наши данные для обучения чужих моделей?
Нет. У GigaChat и YandexGPT есть режим "без передачи данных на обучение" (включается в API). У OpenAI/Anthropic — тоже (через DPA-соглашение). Для критичных данных используем локальные LLM на вашем сервере. NDA подписывается до старта.
А если AI выдаст неверный ответ клиенту и тот подаст в суд?
На юридически значимых ответах AI всегда работает с подтверждением человеком (типовые шаблоны → проверка менеджером → отправка). На FAQ и информационных — есть disclaimer "автоматический ответ, для уточнения свяжитесь с менеджером". Прецеденты есть только за рубежом и только при отсутствии disclaimer.
Сколько ждать первых результатов?
Прототип на ваших данных — 1-2 недели. Запуск базового AI-сценария — 3-5 недель. Полное внедрение комплекса — 2-6 месяцев. Стабильная окупаемость по метрикам — 2-4 месяца после запуска (нужно время на тюнинг и наполнение RAG-памяти).
Что если у нас очень специфический бизнес?
Универсальные технологии (LLM, OCR, STT, RAG) подходят под любую отрасль. Специфика появляется на этапе аудита и прототипа. Если прототип не показывает достаточной точности — честно говорю, что AI в этом конкретном кейсе не окупится. Идём классической автоматизацией или регламентами.
Можно начать с MVP и расширять?
Это самый правильный путь. Один AI-кейс за 100-200 тыс. ₽, обкатывается 2-3 месяца, по результатам решаем что дальше. 80% наших проектов так и стартуют. Иначе риск вложиться в большой комплекс и обнаружить что нужно было не это.
Кому принадлежит код после запуска?
Вам. Код в вашем репозитории (GitHub/GitLab/локально), доступы у вас, ключи API у вас. Я не привязываю клиента к себе через "коробочное решение". Если завтра захотите работать с другим инженером — он берёт исходники и продолжает.
Что входит в поддержку?
Мониторинг 24/7 с алертами в Telegram, реагирование на сбои (1-2 часа на критичные, до рабочего дня на стандартные), ежемесячный отчёт по метрикам, обновление промптов когда меняются бизнес-процессы, миграция на новые модели если они лучше.
Нужна ли GPU-карта или подойдёт обычный сервер?
Для агентов на облачных LLM (GigaChat/YGPT/Claude) GPU не нужна — обычный VPS за 1.5-3 тыс. ₽/мес. Для локальных LLM (Llama 70B/Qwen) нужна GPU 40-80 ГБ VRAM — это 25-80 тыс. ₽/мес аренды или 400-900 тыс. ₽ покупки. На этапе аудита решаем что вам подходит.
Можно ли увидеть демо?
Часто да. На этапе аудита показываю прототип на ваших реальных данных — например AI размечает ваши последние 50 заявок и сравнивает с тем, как разметили менеджеры. Это бесплатно и занимает 1-2 дня.
Готовы обсудить вашу задачу?
Опишите задачу в 3-5 предложениях. До подписания договора — бесплатный аудит с прототипом на ваших данных и расчётом окупаемости.
Оставить заявку