Noltis · 2026 · работаю в РФ

OCR документов с ИИ для бухгалтерии и склада

Распознаю счета поставщиков, ТТН, накладные, договоры — из PDF, сканов и фото в Telegram. Поднимаю pipeline на Yandex Vision и GigaChat, прокидываю структурированные данные в учётку и ЭДО. Точность 93-98% на типовых первичках.

0
точность
на счетах и ТТН
0
на один документ
от фото до данных
0
себестоимость
распознавания
0
снижение нагрузки
на бухгалтерию
· визуально

Что вы получаете на выходе

Не презентация, не идея, не пилот. Работающая система, которая делает работу за людей с фиксированной точностью.

tg-bot@warehouse:~$ фото ТТН 4823.jpg (1.8 MB) ← водитель Серёга → vision: yandex.ocr.text · llm: gigachat.pro · pipeline: ttn.v3 { "doc_type": "ТТН", "number": "ТТН-2026/04823", "date": "2026-05-28", "sender": "ООО Дельта-Логистик / ИНН 7708123456", "receiver": "ИП Иванов А.П. / ИНН 781901234567", "weight_kg": 412.5, "places": 8, "items": [{"name": "Картон гофрированный Т-22", "qty": 8, "unit": "паллет"}], "driver_signed": true, "stamp_present": true, "confidence": 0.94 } → match: order #18920 (партия 412 кг, 8 паллет) ✓ → pushed: учётка → приёмка склада · status: «принято с расхождением 0.5 кг»
· когда нужно

Симптомы что первичка вас топит

Бухгалтер забит на 80% механическим вводом, акты висят месяцами, по итогам квартала «вдруг» вылезают пропавшие документы.

01

Бухгалтер вбивает счета руками 4-6 часов в день

70-150 счетов в неделю, каждый — 5-8 минут на ввод. Зарплата 90 тыс. ₽/мес уходит на работу, которую делает робот за копейки.

02

Накладные от водителей теряются в чате

Серёга кинул фото ТТН в общий чат склада, фото утонуло между мемами. Через неделю на сверке выясняется — приёмки нет, поставщик считает что отгрузил.

03

Договоры читают руками перед каждым закрытием

Юрист или менеджер тратит 20-40 минут на договор — найти сумму, штрафы, сроки оплаты, автопролонгацию. На 50 договорах в месяц это 15-30 часов чистого времени.

04

Перед закрытием месяца — паника

Бух понимает что 15-20 документов не введены. Ночь перед сдачей отчётности проходит за вводом счетов. Ошибки идут в декларацию.

05

Расхождения с поставщиками вылавливаются постфактум

Поставщик прислал счёт на 142 800 ₽ вместо договорённых 138 200 ₽. Никто не заметил, оплатили, через 3 месяца сверка показывает 4 600 ₽ переплаты.

06

Не работает ЭДО — поставщик присылает PDF на email

Половина мелких контрагентов не подключена к Диадоку или СБИС. Их документы приходят в почту PDF-ками, которые надо вручную скачать и разнести.

· как делается

6 этапов запуска OCR-конвейера

Распознавание это не «прогнал PDF через нейросеть». Pipeline должен учитывать ваши типы документов, форматы и куда отдавать результат.

01 · 2-3 дня

Аудит документопотока

Собираю образцы: счета, акты, ТТН, договоры, УПД. Считаем объём — сколько штук в неделю, какого качества (скан, фото, PDF). Это база для расчёта окупаемости.

02 · 3-5 дней

Подключение Vision API

Yandex Vision (основной для РФ) + резерв на Tesseract / EasyOCR для краевых случаев. Калибрую под ваши типы документов, тестирую на 50-100 реальных образцах.

03 · 5-7 дней

Слой LLM-нормализации

GigaChat / YandexGPT превращает «грязный» OCR-текст в структурированный JSON: реквизиты в нужных полях, суммы в копейках, даты в ISO. Финальная проверка консистентности.

04 · 3-5 дней

Каналы приёма документов

Telegram-бот для фото от водителей и менеджеров, email-парсер для писем поставщиков, веб-форма для загрузки PDF, интеграция с входящей очередью Диадока / СБИС.

05 · 5-7 дней

Интеграция с учёткой и ЭДО

Передача распознанного в учётную систему (через REST/Webhook/COM), создание документов поступления, привязка к заказам и контрагентам. Сверка с базой контрагентов по ИНН.

06 · 3-5 дней

Маршрутизация на согласантов

Распознанный счёт автоматом летит руководителю отдела на согласование, после — финдиру на оплату. Подпись фиксируется, аудит-лог сохраняется. Через Telegram, почту или личный кабинет.

· что закрывается

Что pipeline тянет на боевых документах

Конкретные типы первички где OCR+ИИ стабильно работает. Краевые случаи (рукописные ТТН советского образца) — отдельно.

Счета поставщиков

Распознавание счетов на оплату

Из PDF/скана/фото вытаскиваю: поставщика, ИНН/КПП, номер и дату, позиции с количеством и ценой, НДС, итоговую сумму. Сверка с договором по поставщику — автоматом.

PDFYandex VisionGigaChat
ТТН и накладные

Приёмка через фото в Telegram

Водитель шлёт фото ТТН в чат-бот склада, через 10 секунд приёмщик видит в учётке заполненный документ. Расхождения веса/количества — флаг на ручную сверку.

TelegramWMSwebhook
Договоры

Извлечение реквизитов и условий

Парсинг договоров поставки/услуг: стороны, предмет, сумма, сроки оплаты, штрафные санкции, дата автопролонгации, реквизиты счёта. Складывается в карточку контрагента в CRM.

LLMNERCRM
УПД и акты

Проверка перед закрытием месяца

Прогон всех УПД и актов за месяц: сверка сумм с актами сверки, поиск пропавших документов по списку отгрузок, флаг расхождений. Бух видит список «закрыть до 30-го».

УПДreconciliationучётка
Согласование

Маршрутизация по матрице

Распознанный счёт от 50 тыс. ₽ — руководителю отдела, от 300 тыс. — финдиру, от 1 млн — собственнику. Согласовали в Telegram кнопкой — пошло в оплату. Аудит-лог сохраняется.

Telegramworkflowaudit
Email-поток

Парсинг писем от поставщиков

Отдельный почтовый ящик docs@вашакомпания.ру. Любой PDF/JPG из вложения автоматом распознаётся, отправителю отвечает бот: «принято, контрагент Х, счёт №ХХ, сумма Y».

emailIMAPauto-reply
GigaChat YandexGPT Claude 4.7 GPT-5 n8n Диадок Битрикс24 AmoCRM PostgreSQL pgvector RAG Telegram API WABA Yandex SpeechKit RPA ChatWoot Selectel Yandex Cloud 152-ФЗ GigaChat YandexGPT Claude 4.7 GPT-5 n8n Диадок
· кейсы

Что уже сделано

Без имён клиентов (NDA), но цифры и стек реальные.

Дистрибуция · 14 поставщиков

Email-парсер счетов + согласование

720 → 18 ч
ввод счетов / мес
96%
точность сумм
−1.4
ставки бухгалтера
3 мес
окупаемость

Поставщики шлют PDF-счета на docs@. Бот распознаёт, ищет договор, маршрутизирует на согласование в Telegram, после подписи кладёт в учётку. Бухгалтер работает только со спорными.

Логистика · 80 рейсов/нед

ТТН через Telegram от водителей

8 сек
фото → данные в WMS
−5 чел
на ручной приёмке
99.2%
найденных ТТН
2 мес
окупаемость

Водитель выгружает на складе, фоткает подписанную ТТН и кидает в чат-бот. Через 8 секунд в WMS-системе появляется документ приёмки, расхождения — флагом приёмщику.

Производство · 600 договоров

Парсинг договоров поставки в карточки

40 → 2 ч
на один договор
94%
извлечения реквизитов
+12 шт
найдено просроченных автопролонгаций
4 мес
окупаемость

Загнал в OCR 600 договоров с поставщиками за 3 года. Вытащил даты, штрафы, автопролонгацию — нашёл 12 договоров где компания платила завышенный тариф из-за просроченной правки.

· цены и пакеты

Сколько это стоит

Фиксированная цена за фиксированный объём. Без часов разработчика и сюрпризов в счёте.

Старт

Один тип документов в одном канале

180-260 тыс. ₽ / единоразово
Срок 3-4 недели
  • Один тип документов (счета или ТТН или УПД)
  • Один канал приёма (email или Telegram)
  • Выгрузка в Excel / Google Sheets / CSV
  • Калибровка на 50 ваших образцах
  • Telegram-уведомления о расхождениях
  • 60 дней гарантии
Запросить смету
Полный

Полный документооборот под ключ

800 тыс — 1.5 млн ₽ / единоразово
Срок 10-14 недель
  • Всё из «Средний»
  • 6+ типов документов включая договоры
  • Интеграция с Диадок / СБИС / Контур
  • Парсинг договоров с извлечением условий и штрафов
  • Многоуровневая маршрутизация по матрице полномочий
  • Личный кабинет с аудит-логом и поиском
  • Аккаунт-менеджер первые 3 мес
Запросить смету
· FAQ

Частые вопросы

То, что чаще всего спрашивают перед стартом.

Q01

Какая реальная точность распознавания

На типовых документах (счета на оплату, УПД, ТТН в типовых формах ПФ) — 95-98%. На фото плохого качества (мятая бумага, тень, нечёткий фокус) — 85-92%. Рукописные пометки и подписи распознаются хуже — здесь pipeline помечает поле как «требует ручной проверки» и человек дотыкает за 10 секунд.

Q02

Что делать с краевыми случаями — мятые фото, тень

Двухступенчатая обработка: сначала Vision API даёт сырой текст, потом LLM (GigaChat) пытается извлечь поля по контексту даже из «грязного» OCR. Если confidence по полю ниже 0.85 — документ отправляется на ручную верификацию через бота, человек подтверждает или правит за 20 секунд.

Q03

Подключается ли к учёткам разных вендоров

Да. Прямые интеграции через REST API (большинство современных учёток имеют), через COM-объекты для legacy-десктопов, через файловый обмен (CSV / XML / Excel). Также через коннекторы СБИС и Диадок если они уже стоят. Конкретный способ зависит от вашей конфигурации.

Q04

А ЭДО — Диадок, СБИС, Контур — это вообще нужно

Да, но OCR закрывает то что в ЭДО НЕ попадает: мелкие контрагенты без ЭДО, сканы старых документов, рукописные ТТН с фур, договоры из «до-ЭДО» эпохи, фото от полевых сотрудников. У большинства SMB 30-50% документооборота идёт мимо ЭДО, и именно эта часть жрёт время.

Q05

Сколько стоит распознавание одного документа

Себестоимость: Yandex Vision 0.15-0.40 ₽ за страницу + LLM 0.30-0.80 ₽ за извлечение полей + инфраструктура 0.20 ₽. Итого 0.8-1.5 ₽ за документ. Сравните: бухгалтер вводит счёт за 5-8 минут, при зарплате 90 тыс. ₽/мес это 60-80 ₽ за документ.

Q06

Безопасно ли пускать счета через сторонний API

Yandex Cloud — российский провайдер, данные хранятся в РФ, есть сертификация ФСТЭК и аттестация по 152-ФЗ. Для строгих кейсов поднимаем pipeline в вашем контуре на on-premise модели (тоже умею, но дороже).

Q07

Сколько времени до боевого запуска

Простой кейс (счета по email → бухгалтерия): 3-4 недели. Полный pipeline с ЭДО, маршрутизацией и десятком типов документов: 8-12 недель. Первые 2 недели — аудит документопотока и калибровка модели на ваших образцах.

Q08

Что если поставщик прислал документ в неудобоваримом виде

Pipeline обрабатывает: PDF (текстовый и сканированный), JPG/PNG/HEIC, многостраничные TIFF, фото с косоугольной перспективой. Не обрабатывает: видео, аудио, документы в формате «писали ручкой по табачному пеплу». Такие — на ручную обработку с помеченным флагом.

Q09

А как с УПД где много позиций — 50-100 строк

Это нормальный случай — pipeline разбивает таблицу позиций построчно, извлекает количество, цену, сумму, ставку НДС. На УПД с 60-80 позициями обработка занимает 20-40 секунд, точность по табличной части 92-96%. Тут важна структура таблицы в исходнике.

Q10

Можно ли подключить только один кейс — например, счета

Можно. Начинаем с одного типа документов где больше всего боли, через 2 месяца смотрим результат и расширяемся на следующий тип. Это экономит и бюджет, и время команды на адаптацию.

Q11

Сверка с базой контрагентов — как работает

Извлечённый ИНН проверяется по базе контрагентов в учётке. Если найден — счёт привязывается автоматом. Если нет — флаг «новый контрагент», pipeline подтягивает данные из ФНС (наименование, КПП, ОГРН, юридический адрес) и создаёт карточку на проверку менеджеру.

Q12

Что после запуска — нужна ли поддержка

Первые 2-3 месяца — еженедельный разбор ошибок и докалибровка модели. Дальше — раз в квартал. Когда меняется формат документов у крупного поставщика или появляется новый тип первички — точечная адаптация. Поддержка 25-50 тыс. ₽/мес в зависимости от объёма.

Готовы обсудить вашу задачу?

Пришлите 5-10 типовых документов — за 2 дня покажу как это будет распознаваться на ваших образцах. Бесплатный пилот до договора.

Оставить заявку

Смежные решения Noltis

Задачи редко живут поодиночке - вот что чаще всего внедряют вместе с этим продуктом. Полный список - в каталоге продуктов.

Обсудить задачу →