С какими системами учёта вы работаете?

С большинством популярных. Подключаюсь через API и выстраиваю единую модель данных. Если нестандартное решение - разберёмся на встрече.

Можно начать без системы учёта?

Да. Могу выстроить процесс так, чтобы система появилась позже. Но для роста она почти всегда нужна.

Сколько времени занимает запуск?

Первые результаты через 7-14 дней при наличии доступов. Дальше развиваем итерациями по 1-2 недели.

Сколько это стоит?

Зависит от объёма. Обсудим на встрече и я назову конкретную цифру. Без скрытых платежей.

Я не технарь, разберусь ли?

Да. Я сам настраиваю всё техническое. Вам нужно только описать процесс продаж и дать доступы.

Что нужно предоставить для начала?

Описание процесса продаж, список источников заявок, доступы к системам и контакт ответственного.

Где будет всё работать - на вашем сервере или нашем?

По ситуации. Обычно на вашей инфраструктуре или выделенном сервере - так надёжнее.

Как выглядит поддержка после запуска?

Мониторинг, исправления, новые сценарии и каналы. Это отдельный формат работы - обсудим на встрече.

Noltis · 2026 · работаю в РФ

Внедрение AI в бизнес: ИИ-агенты, RAG и голос под ключ

AI это инженерия, не магия. Беру конкретную задачу, оцениваю окупаемость, делаю прототип на ваших данных, переношу в прод. Без коробок, без подписок на чужие платформы, код остаётся у вас.

Обсудить задачу Как работает

до пилота на
ваших данных

типовых сценариев
с готовым стеком

точности модели
на типовых задачах

медианная
окупаемость

· визуально

Что вы получаете на выходе

Не презентация, не идея, не пилот. Работающая система, которая делает работу за людей с фиксированной точностью.

user@noltis:~$ ai-agent.send "поможет с возвратом, заказ #4729" > Канал: WhatsApp · Контекст: 14 сообщений · RAG: 3 doc Здравствуйте! Вижу ваш заказ #4729 от 15 мая на 12 800 ₽. Возврат возможен в течение 14 дней. Что предпочитаете - вернуть деньги или обмен на другую модель? > tools: crm.lookup(order=4729), rag.policy("возврат"), nps.update system@noltis:~$ log {"latency": "1.8s", "tokens": 482, "confidence": 0.94} Заявка на возврат создана. Курьер заберёт завтра между 12:00 и 16:00. Деньги вернутся на карту в течение 3 рабочих дней. > handoff: false · ticket: closed · ✓ автоматически

· где окупается

6 направлений где AI реально работает

Не "общее ускорение работы". Конкретные функции, где экономия считается часами и рублями в первый-второй месяц.

Клиентский сервис

AI в чате и мессенджерах

Бот с RAG по базе знаний закрывает 60-80% обращений сам, сложные эскалирует с уже собранным контекстом. Время первого ответа: с часов до секунд.

GigaChatpgvectorWABAChatWoot

Продажи

Квалификация лидов и сводки звонков

AI размечает входящие заявки по ICP, ставит score, передаёт менеджеру горячих. Авто-сводка после звонка попадает в карточку. Конверсия растёт на 20-35%.

SpeechKit STTGigaChatAmoCRMn8n

Документы

Парсинг счетов, ТТН и договоров

OCR вытаскивает реквизиты, суммы, риски из PDF и фото. AI-сверка с политикой компании, авто-выгрузка в учётку и ЭДО. 30-90% времени бухгалтера в карман.

Yandex VisionGigaChatДиадокСБИС

Голос

Колл-центр на AI

Входящие на типовые вопросы, исходящий обзвон (NPS, доставка, реактивация), маршрутизация на оператора по первым 10 секундам разговора.

SpeechKit TTSSpeechKit STTGigaChatAsterisk

Внутренние знания

AI-помощник по регламентам

RAG по корпоративным документам, истории сделок, технической документации. Сотрудник спрашивает на естественном языке — получает ответ со ссылками на источник.

GigaChatpgvectorQdrantSaiga

Контент

Карточки, КП, посты, рассылки

Описания товаров для маркетплейсов, инфографика через Kandinsky, шаблоны email-рассылок, тексты постов в соцсетях. От 100 до 1500 SKU в день вместо 5-10 руками.

GigaChatKandinskyWB Content APIOzon Seller

· как внедряется

6 фаз от стратегии до сопровождения

Каждый этап — отдельный артефакт, который можно посмотреть и проверить. Никаких "ещё пилим, через месяц покажу".

Фаза 1 · 1-2 недели

Аудит и выбор кейса

5-15 потенциальных AI-сценариев с оценкой окупаемости. Выбираем 1-3 первоочередных. Бесплатно до подписания контракта.

Фаза 2 · 1-2 недели

Проектирование архитектуры

Выбор LLM, дизайн памяти, список инструментов, гарантии и эскалация, пайплайн данных. ТЗ + диаграмма + примерные промпты.

Фаза 3 · 1-2 недели

Прототип на ваших данных

Минимальный рабочий агент на ваших последних 100-500 кейсах. Сравнение с реальными решениями. Точность ≥85% — двигаемся.

Фаза 4 · 3-8 недель

Полная сборка

Production-инфраструктура: интеграции, память (RAG-индекс), мониторинг, защита от prompt injection. Работа в shadow mode.

Фаза 5 · 1-2 недели

Переход в прод

Постепенное переключение, по 10-20% трафика в день. Усиленный мониторинг точности. Откат за минуты если что-то не так.

Фаза 6 · ежемесячно

Сопровождение и эволюция

Метрики точности и эскалаций, обновление промптов под бизнес-изменения, миграция на новые модели, доработки.

· выбор LLM

На каких моделях работаю

Не привязан к одному вендору. Выбираю под задачу: данные / стоимость / точность / приватность.

Sber · 32k токенов

GigaChat Pro

Топ по русскому. Длинные документы, юридика, структурные задачи. 600 ₽ за миллион input-токенов.

152-ФЗ32k context600 ₽/М

Yandex · 8k токенов

YandexGPT Pro

Дешевле GigaChat на 20%, быстрее. Для генерации контента, коротких ответов, ботов с большим RPS.

152-ФЗ8k context480 ₽/М

Anthropic · 200k токенов

Claude 4.7

Топ-качество в мире, лучшие reasoning и code. Сложные агенты, длинная аналитика, разбор документов.

не для перс. данных РФ200k context

OpenAI · 128k токенов

GPT-5 / 4.1

Function calling, зрелая экосистема SDK. Для интеграций с готовыми инструментами и тулзовым паттерном.

не для перс. данных РФ128k context

Open source · локально

Llama 3.3 / Qwen 2.5 / Saiga

На вашем GPU-сервере. Полная приватность. Медицина, банкинг, госконтракты — данные не покидают периметр.

152-ФЗлокальноGPU 40-80 GB

Embeddings · для RAG

GigaChat / Yandex / E5

Векторизация документов, истории сделок, каталогов. Хранение в pgvector / Qdrant / Milvus.

152-ФЗpgvectorQdrant

GigaChat YandexGPT Claude 4.7 GPT-5 n8n Диадок Битрикс24 AmoCRM PostgreSQL pgvector RAG Telegram API WABA Yandex SpeechKit RPA ChatWoot Selectel Yandex Cloud 152-ФЗ GigaChat YandexGPT Claude 4.7 GPT-5 n8n Диадок

· кейсы

Что уже сделано

Без имён клиентов (NDA), но цифры и стек реальные.

Интернет-магазин · 800 SKU

AI в WhatsApp + Avito + сайт с RAG по каталогу

+95%

закрытость обращений

2.5 ч/день

у менеджера в карман

40 → 78%

удержание до ответа

2 мес

окупаемость

GigaChat + pgvector + n8n + WABA + AmoCRM. Бот закрывает типовые "когда придёт", "есть ли", "сколько доставка", эскалирует сложные с уже собранным контекстом.

B2B-агентство · 5 менеджеров

Квалификация лидов + сводки звонков + Telegram-помощник

+22%

конверсия в сделку

−30%

времени на админку

×5

скорость заполнения CRM

3 мес

окупаемость

GigaChat + YandexGPT + SpeechKit + amoCRM. AI размечает входящие заявки, расшифровывает звонки, генерит сводку, подсказывает контраргументы под возражения.

Клиника · 80 врачей

Внутренний помощник на Qwen, локально

152-ФЗ

compliant

данных наружу

8 →1 мин

поиск регламента

GPU

сервер клиники

Qwen 2.5 72B на GPU клиники + RAG по 3000 регламентов и МКБ-кодов. Врач спрашивает на естественном языке, AI отвечает со ссылкой на источник. Никаких облаков.

· FAQ

Частые вопросы

То, что чаще всего спрашивают перед стартом.

Q01

Что если ChatGPT отключат для РФ?

Архитектура агента строится так, что LLM это плагин. Если завтра OpenAI/Anthropic отключают — переключаемся на GigaChat / YandexGPT / Llama за день. На большинстве проектов основная модель сразу российская, чтобы не зависеть от геополитики.

Q02

Сколько токенов LLM сжигает агент в месяц?

FAQ-бот на 1000 диалогов/мес = 3-5 тыс. ₽ токенов GigaChat. AI-классификатор на 5000 заявок = ~2 тыс. ₽. Голосовой колл-центр на 5000 звонков/день = 80-150 тыс. ₽/мес (STT+TTS+LLM). До старта закладываем расход в смету.

Q03

Что с галлюцинациями? AI может всё придумать.

Защищаемся тремя способами: 1) жёсткие промпты "не выдумывай, при отсутствии данных отвечай не знаю"; 2) RAG — AI отвечает только из проверенных источников; 3) grade-of-confidence — на критичных решениях shadow mode и ручное подтверждение. Точность на типовых задачах после тюнинга — 95-99%.

Q04

Можно ли использовать наши данные для обучения чужих моделей?

Нет. У GigaChat и YandexGPT есть режим "без передачи данных на обучение" (включается в API). У OpenAI/Anthropic — тоже (через DPA-соглашение). Для критичных данных используем локальные LLM на вашем сервере. NDA подписывается до старта.

Q05

А если AI выдаст неверный ответ клиенту и тот подаст в суд?

На юридически значимых ответах AI всегда работает с подтверждением человеком (типовые шаблоны → проверка менеджером → отправка). На FAQ и информационных — есть disclaimer "автоматический ответ, для уточнения свяжитесь с менеджером". Прецеденты есть только за рубежом и только при отсутствии disclaimer.

Q06

Сколько ждать первых результатов?

Прототип на ваших данных — 1-2 недели. Запуск базового AI-сценария — 3-5 недель. Полное внедрение комплекса — 2-6 месяцев. Стабильная окупаемость по метрикам — 2-4 месяца после запуска (нужно время на тюнинг и наполнение RAG-памяти).

Q07

Что если у нас очень специфический бизнес?

Универсальные технологии (LLM, OCR, STT, RAG) подходят под любую отрасль. Специфика появляется на этапе аудита и прототипа. Если прототип не показывает достаточной точности — честно говорю, что AI в этом конкретном кейсе не окупится. Идём классической автоматизацией или регламентами.

Q08

Можно начать с MVP и расширять?

Это самый правильный путь. Один AI-кейс с обсуждаемым бюджетом, обкатывается 2-3 месяца, по результатам решаем что дальше. 80% наших проектов так и стартуют. Иначе риск вложиться в большой комплекс и обнаружить что нужно было не это.

Q09

Кому принадлежит код после запуска?

Вам. Код в вашем репозитории (GitHub/GitLab/локально), доступы у вас, ключи API у вас. Я не привязываю клиента к себе через "коробочное решение". Если завтра захотите работать с другим инженером — он берёт исходники и продолжает.

Q10

Что входит в поддержку?

Мониторинг 24/7 с алертами в Telegram, реагирование на сбои (1-2 часа на критичные, до рабочего дня на стандартные), ежемесячный отчёт по метрикам, обновление промптов когда меняются бизнес-процессы, миграция на новые модели если они лучше.

Q11

Нужна ли GPU-карта или подойдёт обычный сервер?

Для агентов на облачных LLM (GigaChat/YGPT/Claude) GPU не нужна — обычный VPS за 1.5-3 тыс. ₽/мес. Для локальных LLM (Llama 70B/Qwen) нужна GPU 40-80 ГБ VRAM — это 25-80 тыс. ₽/мес аренды или 400-900 тыс. ₽ покупки. На этапе аудита решаем что вам подходит.

Q12

Можно ли увидеть демо?

Часто да. На этапе аудита показываю прототип на ваших реальных данных — например AI размечает ваши последние 50 заявок и сравнивает с тем, как разметили менеджеры. Это бесплатно и занимает 1-2 дня.

Готовы обсудить вашу задачу?

Опишите задачу в 3-5 предложениях. До подписания договора — бесплатный аудит с прототипом на ваших данных и расчётом окупаемости.

Оставить заявку

или напрямую в Telegram: @noemotionc

Технологии, которые внедряю

RAG, локальные модели, fine-tune, MCP - конкретные технологии под задачи вашего бизнеса. Все продукты - в каталоге.

Обсудить задачу →