С какими системами учёта вы работаете?

С большинством популярных. Подключаюсь через API и выстраиваю единую модель данных. Если нестандартное решение - разберёмся на встрече.

Можно начать без системы учёта?

Да. Могу выстроить процесс так, чтобы система появилась позже. Но для роста она почти всегда нужна.

Сколько времени занимает запуск?

Первые результаты через 7-14 дней при наличии доступов. Дальше развиваем итерациями по 1-2 недели.

Сколько это стоит?

Зависит от объёма. Обсудим на встрече и я назову конкретную цифру. Без скрытых платежей.

Я не технарь, разберусь ли?

Да. Я сам настраиваю всё техническое. Вам нужно только описать процесс продаж и дать доступы.

Что нужно предоставить для начала?

Описание процесса продаж, список источников заявок, доступы к системам и контакт ответственного.

Где будет всё работать - на вашем сервере или нашем?

По ситуации. Обычно на вашей инфраструктуре или выделенном сервере - так надёжнее.

Как выглядит поддержка после запуска?

Мониторинг, исправления, новые сценарии и каналы. Это отдельный формат работы - обсудим на встрече.

интеграция ИИ в ваши системы · Claude · GPT · Gemini

API-интеграция ИИ в бизнес-системы под ключ

Подключаю Claude, GPT, Gemini и локальные модели к CRM, 1С, базам данных и мессенджерам. Интеграция по API, с контролем расходов и безопасностью данных.

Обсудить интеграцию Какие модели

до прод-
интеграции по API

минимальный
срок запуска

провайдеров:
Claude, GPT, Gemini, local

каналов:
CRM, 1С, БД, мессенджеры

· выбор модели

Какие ИИ-модели подключаю по API

Выбор модели - это всегда компромисс: качество ответов, расход токенов, доступность в РФ, требования к изоляции данных.

Anthropic

Claude (4.7 Sonnet / Opus)

Лучший для работы с документами, код-анализа, длинных контекстов (до 200k токенов). Кейс: анализ юридических договоров с извлечением ключевых условий.

документы рассуждения через proxy для РФ

OpenAI

GPT-5 / 4.1

Универсал: чаты, function calling, генерация контента, тюнинг на своих данных. Кейс: бот техподдержки с fine-tuning на базе знаний клиента.

function calling SDK-экосистема Azure OpenAI

Google

Gemini (1.5 / 2.0)

Сильный в мультимодальности: картинки, PDF, таблицы, видео. Контекст до 2M токенов. Кейс: парсинг сканов договоров и распознавание.

мультимодал 2M контекст AI Studio / Vertex

Open-source

Локальные: Qwen, Llama, Mistral

Когда данные нельзя отдавать публичным сервисам. На вашем сервере, GPU или CPU-оптимизированные варианты. Кейс: клиника с ПДн пациентов.

FZ-152 полная изоляция свой GPU/CPU

· целевые системы

С какими системами делаю интеграцию по API

Шесть направлений. Если API есть - подключаюсь через официальный. Если нет - согласовываем парсинг с учётом рисков.

CRM

Битрикс24, amoCRM, HubSpot, custom

Webhooks, REST API, кастомные поля, роботы и триггеры. Двусторонние интеграции: ИИ читает и пишет обратно в CRM.

ERP

1С (7.7/8.x), OData

HTTP-сервисы 1С, ВК-ресурсы, обмен через брокер сообщений. SAP - ограниченно, под конкретные модули.

Базы данных

PostgreSQL, MySQL, MongoDB, ClickHouse

Прямое подключение, безопасные read-only пользователи для ИИ, SQL-генерация через function calling с валидацией.

Мессенджеры

Telegram, WhatsApp, MAX, ВК

Telegram Bot API, WhatsApp Business (официальный + неофициальные провайдеры), MAX Bot API, VK API. Один ИИ-бэкенд - четыре канала с двусторонней перепиской и контекстом.

Почта

IMAP/SMTP, Gmail, Outlook

Чтение входящих, классификация, автоответы, извлечение вложений. Работа с корпоративными почтовыми системами.

Кастомные

REST, GraphQL, SOAP, gRPC

Любой API с документацией. Если документации нет - реверс-инжиниринг. Если API нет - парсинг с оговорками.

· как подключить claude api

Шесть шагов до прод-интеграции

Пошаговый гайд. Остальные модели работают по похожей схеме.

Получение API-ключа Anthropic

Через console.anthropic.com. Из РФ - нужна карта с иностранным биллингом или реселлер. Альтернатива: корпоративный прокси на VDS в Европе.

Установка SDK

pip install anthropic
# или для Node.js:
npm install @anthropic-ai/sdk

Первый запрос

from anthropic import Anthropic
client = Anthropic(api_key="sk-ant-...")

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Классифицируй заявку..."}]
)
print(response.content[0].text)

Интеграция с CRM

Архитектура: CRM → webhook на ваш backend → обогащение контекстом из БД → запрос в Claude API → парсинг ответа → запись обратно в CRM. Все шаги логируются.

Контроль расхода токенов

Счётчик токенов на каждый запрос, суточные лимиты, алёрты в Telegram при превышении порога. Для B2B-проектов - отдельные бюджеты на клиента.

Мониторинг качества

Логи всех пар запрос-ответ, разметка «хорошо/плохо» от операторов, регулярный A/B тест промптов. Без этого качество медленно деградирует.

· остальные провайдеры

OpenAI API и Gemini API

Коротко про особенности. Полные гайды - в блоге на noltis.ru/blog/.

OpenAI

GPT: особенности подключения

Ключ в platform.openai.com. Различия 4-turbo vs 4o vs 5 - по цене и скорости. Function calling - мощный инструмент для автоматизации действий в ваших системах. Для РФ - через Azure OpenAI (с российской картой) или реселлер.

Google

Gemini: AI Studio vs Vertex

Быстрый старт - через AI Studio (ключ за минуту). Продакшен - через Google Cloud Vertex AI с SLA. Сильная сторона: работа с видео, PDF и большими таблицами в одном запросе.

· безопасность

Как не слить данные в публичный API

Публичные API не FZ-152 / GDPR compliant из коробки. Разбираю три рабочих сценария.

Вариант 1

Маскирование PII

Перед отправкой в API заменяем ФИО, телефоны, адреса, email на токены. В ответе восстанавливаем. Данные уходят обезличенными.

Вариант 2

Российские провайдеры

YandexGPT, GigaChat (Сбер) - данные не покидают РФ. Пригодно для FZ-152, но качество моделей ниже топовых западных.

Вариант 3

Локальный деплой

Qwen, Llama на вашем GPU-сервере. Данные вообще не покидают периметр компании. Полный контроль, максимальная безопасность.

Договорная часть: подписываем NDA с заказчиком, DPA с провайдером модели (где предусмотрено), настраиваем аудит-логи всех вызовов API, отдельно - политику хранения промптов и ответов.

· FAQ

Вопросы перед подключением

Что спрашивают чаще всего, когда приходят с интеграцией.

Как заказать интеграцию API ИИ под ключ?

Через форму на /brief/ или напрямую в Telegram @noemotionc. За сутки отвечу: какая модель подойдёт, архитектура интеграции, срок. Работаю лично, без sales-менеджеров.

Работает ли Claude API в России?

С российских IP напрямую - нет, Anthropic блокирует. Варианта два: (1) корпоративный прокси на европейском/американском VDS, (2) через официальных партнёров-реселлеров с рублёвой оплатой. Оба рабочие, разница - в цене и SLA.

Как не отдать клиентские данные в OpenAI?

Три способа. (1) Маскирование PII до отправки: ФИО, телефоны, адреса заменяем токенами, восстанавливаем в ответе. (2) Azure OpenAI Service с европейским регионом и подписанным DPA - OpenAI не получает данные для обучения. (3) Локальная модель (Qwen, Llama) - данные вообще не покидают периметр.

Чем отличается function calling от RAG?

RAG (Retrieval Augmented Generation) - это подача релевантных кусков документов в контекст модели, чтобы она отвечала по фактам из вашей базы знаний. Function calling - когда модель вызывает внешние функции: получить заказ по номеру, создать тикет, посчитать тариф. Часто используются вместе: RAG даёт знания, function calling - действия.

Можно ли поставить ИИ-модель на свой сервер?

Да. Qwen, Llama, Mistral в квантизованных версиях запускаются даже на CPU или GPU средней мощности (RTX 4090 потянет модель 70B в 4-bit). Для серьёзной нагрузки - A100/H100 или аналог. Подберу конфигурацию под задачу и бюджет.

Нужен ли Python, или можно на 1С?

1С умеет HTTP-запросы через ВК-ресурсы - технически можно вызывать API напрямую. Но в продакшене я обычно ставлю прослойку на Python или Node.js: логирование, rate limiting, retry, обработка ошибок. 1С дёргает прослойку и спит спокойно.

Сколько токенов сжигает один запрос?

Короткий ответ на FAQ: 500-1500 токенов. Разбор договора на 10 страниц: 20 000-40 000 токенов. Ваши документы + запрос + ответ = сумма. Считаем заранее, даю оценку бюджета до старта.

Что будет, если API упадёт?

Для критичных сценариев закладываю fallback: два провайдера (Claude + GPT, переключение при ошибке), кеш типовых ответов, graceful degradation («не могу ответить, передал человеку» вместо белого экрана). Для некритичных - retry с экспоненциальной задержкой плюс алёрт в Telegram.

С какой системой подружить ИИ?

Предложу архитектуру и срок. За сутки, бесплатно.

Оставить заявку в бриф

или напрямую в Telegram: @noemotionc