Noltis · 2026 · работаю в РФ

Внедрение AI в бизнес: ИИ-агенты, RAG и голос под ключ

AI это инженерия, не магия. Беру конкретную задачу, оцениваю окупаемость, делаю прототип на ваших данных, переношу в прод. Без коробок, без подписок на чужие платформы, код остаётся у вас.

0
до пилота на
ваших данных
0
типовых сценариев
с готовым стеком
0
точности модели
на типовых задачах
0
медианная
окупаемость
· визуально

Что вы получаете на выходе

Не презентация, не идея, не пилот. Работающая система, которая делает работу за людей с фиксированной точностью.

user@noltis:~$ ai-agent.send "поможет с возвратом, заказ #4729" > Канал: WhatsApp · Контекст: 14 сообщений · RAG: 3 doc Здравствуйте! Вижу ваш заказ #4729 от 15 мая на 12 800 ₽. Возврат возможен в течение 14 дней. Что предпочитаете - вернуть деньги или обмен на другую модель? > tools: crm.lookup(order=4729), rag.policy("возврат"), nps.update system@noltis:~$ log {"latency": "1.8s", "tokens": 482, "confidence": 0.94} Заявка на возврат создана. Курьер заберёт завтра между 12:00 и 16:00. Деньги вернутся на карту в течение 3 рабочих дней. > handoff: false · ticket: closed · ✓ автоматически
· где окупается

6 направлений где AI реально работает

Не "общее ускорение работы". Конкретные функции, где экономия считается часами и рублями в первый-второй месяц.

Клиентский сервис

AI в чате и мессенджерах

Бот с RAG по базе знаний закрывает 60-80% обращений сам, сложные эскалирует с уже собранным контекстом. Время первого ответа: с часов до секунд.

GigaChatpgvectorWABAChatWoot
Продажи

Квалификация лидов и сводки звонков

AI размечает входящие заявки по ICP, ставит score, передаёт менеджеру горячих. Авто-сводка после звонка попадает в карточку. Конверсия растёт на 20-35%.

SpeechKit STTGigaChatAmoCRMn8n
Документы

Парсинг счетов, ТТН и договоров

OCR вытаскивает реквизиты, суммы, риски из PDF и фото. AI-сверка с политикой компании, авто-выгрузка в учётку и ЭДО. 30-90% времени бухгалтера в карман.

Yandex VisionGigaChatДиадокСБИС
Голос

Колл-центр на AI

Входящие на типовые вопросы, исходящий обзвон (NPS, доставка, реактивация), маршрутизация на оператора по первым 10 секундам разговора.

SpeechKit TTSSpeechKit STTGigaChatAsterisk
Внутренние знания

AI-помощник по регламентам

RAG по корпоративным документам, истории сделок, технической документации. Сотрудник спрашивает на естественном языке — получает ответ со ссылками на источник.

GigaChatpgvectorQdrantSaiga
Контент

Карточки, КП, посты, рассылки

Описания товаров для маркетплейсов, инфографика через Kandinsky, шаблоны email-рассылок, тексты постов в соцсетях. От 100 до 1500 SKU в день вместо 5-10 руками.

GigaChatKandinskyWB Content APIOzon Seller
· как внедряется

6 фаз от стратегии до сопровождения

Каждый этап — отдельный артефакт, который можно посмотреть и проверить. Никаких "ещё пилим, через месяц покажу".

Фаза 1 · 1-2 недели

Аудит и выбор кейса

5-15 потенциальных AI-сценариев с оценкой окупаемости. Выбираем 1-3 первоочередных. Бесплатно до подписания контракта.

Фаза 2 · 1-2 недели

Проектирование архитектуры

Выбор LLM, дизайн памяти, список инструментов, гарантии и эскалация, пайплайн данных. ТЗ + диаграмма + примерные промпты.

Фаза 3 · 1-2 недели

Прототип на ваших данных

Минимальный рабочий агент на ваших последних 100-500 кейсах. Сравнение с реальными решениями. Точность ≥85% — двигаемся.

Фаза 4 · 3-8 недель

Полная сборка

Production-инфраструктура: интеграции, память (RAG-индекс), мониторинг, защита от prompt injection. Работа в shadow mode.

Фаза 5 · 1-2 недели

Переход в прод

Постепенное переключение, по 10-20% трафика в день. Усиленный мониторинг точности. Откат за минуты если что-то не так.

Фаза 6 · ежемесячно

Сопровождение и эволюция

Метрики точности и эскалаций, обновление промптов под бизнес-изменения, миграция на новые модели, доработки.

· выбор LLM

На каких моделях работаю

Не привязан к одному вендору. Выбираю под задачу: данные / стоимость / точность / приватность.

Sber · 32k токенов

GigaChat Pro

Топ по русскому. Длинные документы, юридика, структурные задачи. 600 ₽ за миллион input-токенов.

152-ФЗ32k context600 ₽/М
Yandex · 8k токенов

YandexGPT Pro

Дешевле GigaChat на 20%, быстрее. Для генерации контента, коротких ответов, ботов с большим RPS.

152-ФЗ8k context480 ₽/М
Anthropic · 200k токенов

Claude 4.7

Топ-качество в мире, лучшие reasoning и code. Сложные агенты, длинная аналитика, разбор документов.

не для перс. данных РФ200k context
OpenAI · 128k токенов

GPT-5 / 4.1

Function calling, зрелая экосистема SDK. Для интеграций с готовыми инструментами и тулзовым паттерном.

не для перс. данных РФ128k context
Open source · локально

Llama 3.3 / Qwen 2.5 / Saiga

На вашем GPU-сервере. Полная приватность. Медицина, банкинг, госконтракты — данные не покидают периметр.

152-ФЗлокальноGPU 40-80 GB
Embeddings · для RAG

GigaChat / Yandex / E5

Векторизация документов, истории сделок, каталогов. Хранение в pgvector / Qdrant / Milvus.

152-ФЗpgvectorQdrant
GigaChat YandexGPT Claude 4.7 GPT-5 n8n Диадок Битрикс24 AmoCRM PostgreSQL pgvector RAG Telegram API WABA Yandex SpeechKit RPA ChatWoot Selectel Yandex Cloud 152-ФЗ GigaChat YandexGPT Claude 4.7 GPT-5 n8n Диадок
· кейсы

Что уже сделано

Без имён клиентов (NDA), но цифры и стек реальные.

Интернет-магазин · 800 SKU

AI в WhatsApp + Avito + сайт с RAG по каталогу

+95%
закрытость обращений
2.5 ч/день
у менеджера в карман
40 → 78%
удержание до ответа
2 мес
окупаемость

GigaChat + pgvector + n8n + WABA + AmoCRM. Бот закрывает типовые "когда придёт", "есть ли", "сколько доставка", эскалирует сложные с уже собранным контекстом.

B2B-агентство · 5 менеджеров

Квалификация лидов + сводки звонков + Telegram-помощник

+22%
конверсия в сделку
−30%
времени на админку
×5
скорость заполнения CRM
3 мес
окупаемость

GigaChat + YandexGPT + SpeechKit + amoCRM. AI размечает входящие заявки, расшифровывает звонки, генерит сводку, подсказывает контраргументы под возражения.

Клиника · 80 врачей

Внутренний помощник на Qwen, локально

152-ФЗ
compliant
0%
данных наружу
8 →1 мин
поиск регламента
GPU
сервер клиники

Qwen 2.5 72B на GPU клиники + RAG по 3000 регламентов и МКБ-кодов. Врач спрашивает на естественном языке, AI отвечает со ссылкой на источник. Никаких облаков.

· цены и пакеты

Сколько это стоит

Фиксированная цена за фиксированный объём. Без часов разработчика и сюрпризов в счёте.

Старт

Один AI-кейс

100-200 тыс. ₽ / единоразово
Срок 3-5 недель
  • FAQ-бот или классификатор
  • Базовая RAG-база (до 500 docs)
  • 1 канал интеграции
  • 60 дней гарантии
  • Прототип на ваших данных бесплатно
Запросить смету
Глубокий

AI в операционке

600 тыс - 1.5 млн ₽ / единоразово
Срок 3-6 месяцев
  • 5+ AI-компонентов
  • Голосовой колл-центр или отраслевой пакет
  • Локальная LLM при необходимости
  • Обучение команды и регламенты
  • 120 дней гарантии
  • Технический партнёр первые 3 мес
Запросить смету
· FAQ

Частые вопросы

То, что чаще всего спрашивают перед стартом.

Q01

Что если ChatGPT отключат для РФ?

Архитектура агента строится так, что LLM это плагин. Если завтра OpenAI/Anthropic отключают — переключаемся на GigaChat / YandexGPT / Llama за день. На большинстве проектов основная модель сразу российская, чтобы не зависеть от геополитики.

Q02

Сколько токенов LLM сжигает агент в месяц?

FAQ-бот на 1000 диалогов/мес = 3-5 тыс. ₽ токенов GigaChat. AI-классификатор на 5000 заявок = ~2 тыс. ₽. Голосовой колл-центр на 5000 звонков/день = 80-150 тыс. ₽/мес (STT+TTS+LLM). До старта закладываем расход в смету.

Q03

Что с галлюцинациями? AI может всё придумать.

Защищаемся тремя способами: 1) жёсткие промпты "не выдумывай, при отсутствии данных отвечай не знаю"; 2) RAG — AI отвечает только из проверенных источников; 3) grade-of-confidence — на критичных решениях shadow mode и ручное подтверждение. Точность на типовых задачах после тюнинга — 95-99%.

Q04

Можно ли использовать наши данные для обучения чужих моделей?

Нет. У GigaChat и YandexGPT есть режим "без передачи данных на обучение" (включается в API). У OpenAI/Anthropic — тоже (через DPA-соглашение). Для критичных данных используем локальные LLM на вашем сервере. NDA подписывается до старта.

Q05

А если AI выдаст неверный ответ клиенту и тот подаст в суд?

На юридически значимых ответах AI всегда работает с подтверждением человеком (типовые шаблоны → проверка менеджером → отправка). На FAQ и информационных — есть disclaimer "автоматический ответ, для уточнения свяжитесь с менеджером". Прецеденты есть только за рубежом и только при отсутствии disclaimer.

Q06

Сколько ждать первых результатов?

Прототип на ваших данных — 1-2 недели. Запуск базового AI-сценария — 3-5 недель. Полное внедрение комплекса — 2-6 месяцев. Стабильная окупаемость по метрикам — 2-4 месяца после запуска (нужно время на тюнинг и наполнение RAG-памяти).

Q07

Что если у нас очень специфический бизнес?

Универсальные технологии (LLM, OCR, STT, RAG) подходят под любую отрасль. Специфика появляется на этапе аудита и прототипа. Если прототип не показывает достаточной точности — честно говорю, что AI в этом конкретном кейсе не окупится. Идём классической автоматизацией или регламентами.

Q08

Можно начать с MVP и расширять?

Это самый правильный путь. Один AI-кейс за 100-200 тыс. ₽, обкатывается 2-3 месяца, по результатам решаем что дальше. 80% наших проектов так и стартуют. Иначе риск вложиться в большой комплекс и обнаружить что нужно было не это.

Q09

Кому принадлежит код после запуска?

Вам. Код в вашем репозитории (GitHub/GitLab/локально), доступы у вас, ключи API у вас. Я не привязываю клиента к себе через "коробочное решение". Если завтра захотите работать с другим инженером — он берёт исходники и продолжает.

Q10

Что входит в поддержку?

Мониторинг 24/7 с алертами в Telegram, реагирование на сбои (1-2 часа на критичные, до рабочего дня на стандартные), ежемесячный отчёт по метрикам, обновление промптов когда меняются бизнес-процессы, миграция на новые модели если они лучше.

Q11

Нужна ли GPU-карта или подойдёт обычный сервер?

Для агентов на облачных LLM (GigaChat/YGPT/Claude) GPU не нужна — обычный VPS за 1.5-3 тыс. ₽/мес. Для локальных LLM (Llama 70B/Qwen) нужна GPU 40-80 ГБ VRAM — это 25-80 тыс. ₽/мес аренды или 400-900 тыс. ₽ покупки. На этапе аудита решаем что вам подходит.

Q12

Можно ли увидеть демо?

Часто да. На этапе аудита показываю прототип на ваших реальных данных — например AI размечает ваши последние 50 заявок и сравнивает с тем, как разметили менеджеры. Это бесплатно и занимает 1-2 дня.

Готовы обсудить вашу задачу?

Опишите задачу в 3-5 предложениях. До подписания договора — бесплатный аудит с прототипом на ваших данных и расчётом окупаемости.

Оставить заявку
Обсудить задачу →