OCR документов с ИИ для бухгалтерии и склада
Распознаю счета поставщиков, ТТН, накладные, договоры — из PDF, сканов и фото в Telegram. Поднимаю pipeline на Yandex Vision и GigaChat, прокидываю структурированные данные в учётку и ЭДО. Точность 93-98% на типовых первичках.
на счетах и ТТН
от фото до данных
распознавания
на бухгалтерию
Что вы получаете на выходе
Не презентация, не идея, не пилот. Работающая система, которая делает работу за людей с фиксированной точностью.
Симптомы что первичка вас топит
Бухгалтер забит на 80% механическим вводом, акты висят месяцами, по итогам квартала «вдруг» вылезают пропавшие документы.
Бухгалтер вбивает счета руками 4-6 часов в день
70-150 счетов в неделю, каждый — 5-8 минут на ввод. Зарплата 90 тыс. ₽/мес уходит на работу, которую делает робот за копейки.
Накладные от водителей теряются в чате
Серёга кинул фото ТТН в общий чат склада, фото утонуло между мемами. Через неделю на сверке выясняется — приёмки нет, поставщик считает что отгрузил.
Договоры читают руками перед каждым закрытием
Юрист или менеджер тратит 20-40 минут на договор — найти сумму, штрафы, сроки оплаты, автопролонгацию. На 50 договорах в месяц это 15-30 часов чистого времени.
Перед закрытием месяца — паника
Бух понимает что 15-20 документов не введены. Ночь перед сдачей отчётности проходит за вводом счетов. Ошибки идут в декларацию.
Расхождения с поставщиками вылавливаются постфактум
Поставщик прислал счёт на 142 800 ₽ вместо договорённых 138 200 ₽. Никто не заметил, оплатили, через 3 месяца сверка показывает 4 600 ₽ переплаты.
Не работает ЭДО — поставщик присылает PDF на email
Половина мелких контрагентов не подключена к Диадоку или СБИС. Их документы приходят в почту PDF-ками, которые надо вручную скачать и разнести.
6 этапов запуска OCR-конвейера
Распознавание это не «прогнал PDF через нейросеть». Pipeline должен учитывать ваши типы документов, форматы и куда отдавать результат.
Аудит документопотока
Собираю образцы: счета, акты, ТТН, договоры, УПД. Считаем объём — сколько штук в неделю, какого качества (скан, фото, PDF). Это база для расчёта окупаемости.
Подключение Vision API
Yandex Vision (основной для РФ) + резерв на Tesseract / EasyOCR для краевых случаев. Калибрую под ваши типы документов, тестирую на 50-100 реальных образцах.
Слой LLM-нормализации
GigaChat / YandexGPT превращает «грязный» OCR-текст в структурированный JSON: реквизиты в нужных полях, суммы в копейках, даты в ISO. Финальная проверка консистентности.
Каналы приёма документов
Telegram-бот для фото от водителей и менеджеров, email-парсер для писем поставщиков, веб-форма для загрузки PDF, интеграция с входящей очередью Диадока / СБИС.
Интеграция с учёткой и ЭДО
Передача распознанного в учётную систему (через REST/Webhook/COM), создание документов поступления, привязка к заказам и контрагентам. Сверка с базой контрагентов по ИНН.
Маршрутизация на согласантов
Распознанный счёт автоматом летит руководителю отдела на согласование, после — финдиру на оплату. Подпись фиксируется, аудит-лог сохраняется. Через Telegram, почту или личный кабинет.
Что pipeline тянет на боевых документах
Конкретные типы первички где OCR+ИИ стабильно работает. Краевые случаи (рукописные ТТН советского образца) — отдельно.
Распознавание счетов на оплату
Из PDF/скана/фото вытаскиваю: поставщика, ИНН/КПП, номер и дату, позиции с количеством и ценой, НДС, итоговую сумму. Сверка с договором по поставщику — автоматом.
Приёмка через фото в Telegram
Водитель шлёт фото ТТН в чат-бот склада, через 10 секунд приёмщик видит в учётке заполненный документ. Расхождения веса/количества — флаг на ручную сверку.
Извлечение реквизитов и условий
Парсинг договоров поставки/услуг: стороны, предмет, сумма, сроки оплаты, штрафные санкции, дата автопролонгации, реквизиты счёта. Складывается в карточку контрагента в CRM.
Проверка перед закрытием месяца
Прогон всех УПД и актов за месяц: сверка сумм с актами сверки, поиск пропавших документов по списку отгрузок, флаг расхождений. Бух видит список «закрыть до 30-го».
Маршрутизация по матрице
Распознанный счёт от 50 тыс. ₽ — руководителю отдела, от 300 тыс. — финдиру, от 1 млн — собственнику. Согласовали в Telegram кнопкой — пошло в оплату. Аудит-лог сохраняется.
Парсинг писем от поставщиков
Отдельный почтовый ящик docs@вашакомпания.ру. Любой PDF/JPG из вложения автоматом распознаётся, отправителю отвечает бот: «принято, контрагент Х, счёт №ХХ, сумма Y».
Что уже сделано
Без имён клиентов (NDA), но цифры и стек реальные.
Email-парсер счетов + согласование
Поставщики шлют PDF-счета на docs@. Бот распознаёт, ищет договор, маршрутизирует на согласование в Telegram, после подписи кладёт в учётку. Бухгалтер работает только со спорными.
ТТН через Telegram от водителей
Водитель выгружает на складе, фоткает подписанную ТТН и кидает в чат-бот. Через 8 секунд в WMS-системе появляется документ приёмки, расхождения — флагом приёмщику.
Парсинг договоров поставки в карточки
Загнал в OCR 600 договоров с поставщиками за 3 года. Вытащил даты, штрафы, автопролонгацию — нашёл 12 договоров где компания платила завышенный тариф из-за просроченной правки.
Сколько это стоит
Фиксированная цена за фиксированный объём. Без часов разработчика и сюрпризов в счёте.
Один тип документов в одном канале
- Один тип документов (счета или ТТН или УПД)
- Один канал приёма (email или Telegram)
- Выгрузка в Excel / Google Sheets / CSV
- Калибровка на 50 ваших образцах
- Telegram-уведомления о расхождениях
- 60 дней гарантии
Конвейер с интеграцией в учётку
- Всё из «Старт»
- 3-4 типа документов
- 2-3 канала приёма (email + Telegram + веб)
- Интеграция с учётной системой через API
- Сверка с базой контрагентов и договорами по ИНН
- Маршрутизация на согласование в Telegram
- 90 дней гарантии + 1 мес. поддержки
Полный документооборот под ключ
- Всё из «Средний»
- 6+ типов документов включая договоры
- Интеграция с Диадок / СБИС / Контур
- Парсинг договоров с извлечением условий и штрафов
- Многоуровневая маршрутизация по матрице полномочий
- Личный кабинет с аудит-логом и поиском
- Аккаунт-менеджер первые 3 мес
Частые вопросы
То, что чаще всего спрашивают перед стартом.
Какая реальная точность распознавания
На типовых документах (счета на оплату, УПД, ТТН в типовых формах ПФ) — 95-98%. На фото плохого качества (мятая бумага, тень, нечёткий фокус) — 85-92%. Рукописные пометки и подписи распознаются хуже — здесь pipeline помечает поле как «требует ручной проверки» и человек дотыкает за 10 секунд.
Что делать с краевыми случаями — мятые фото, тень
Двухступенчатая обработка: сначала Vision API даёт сырой текст, потом LLM (GigaChat) пытается извлечь поля по контексту даже из «грязного» OCR. Если confidence по полю ниже 0.85 — документ отправляется на ручную верификацию через бота, человек подтверждает или правит за 20 секунд.
Подключается ли к учёткам разных вендоров
Да. Прямые интеграции через REST API (большинство современных учёток имеют), через COM-объекты для legacy-десктопов, через файловый обмен (CSV / XML / Excel). Также через коннекторы СБИС и Диадок если они уже стоят. Конкретный способ зависит от вашей конфигурации.
А ЭДО — Диадок, СБИС, Контур — это вообще нужно
Да, но OCR закрывает то что в ЭДО НЕ попадает: мелкие контрагенты без ЭДО, сканы старых документов, рукописные ТТН с фур, договоры из «до-ЭДО» эпохи, фото от полевых сотрудников. У большинства SMB 30-50% документооборота идёт мимо ЭДО, и именно эта часть жрёт время.
Сколько стоит распознавание одного документа
Себестоимость: Yandex Vision 0.15-0.40 ₽ за страницу + LLM 0.30-0.80 ₽ за извлечение полей + инфраструктура 0.20 ₽. Итого 0.8-1.5 ₽ за документ. Сравните: бухгалтер вводит счёт за 5-8 минут, при зарплате 90 тыс. ₽/мес это 60-80 ₽ за документ.
Безопасно ли пускать счета через сторонний API
Yandex Cloud — российский провайдер, данные хранятся в РФ, есть сертификация ФСТЭК и аттестация по 152-ФЗ. Для строгих кейсов поднимаем pipeline в вашем контуре на on-premise модели (тоже умею, но дороже).
Сколько времени до боевого запуска
Простой кейс (счета по email → бухгалтерия): 3-4 недели. Полный pipeline с ЭДО, маршрутизацией и десятком типов документов: 8-12 недель. Первые 2 недели — аудит документопотока и калибровка модели на ваших образцах.
Что если поставщик прислал документ в неудобоваримом виде
Pipeline обрабатывает: PDF (текстовый и сканированный), JPG/PNG/HEIC, многостраничные TIFF, фото с косоугольной перспективой. Не обрабатывает: видео, аудио, документы в формате «писали ручкой по табачному пеплу». Такие — на ручную обработку с помеченным флагом.
А как с УПД где много позиций — 50-100 строк
Это нормальный случай — pipeline разбивает таблицу позиций построчно, извлекает количество, цену, сумму, ставку НДС. На УПД с 60-80 позициями обработка занимает 20-40 секунд, точность по табличной части 92-96%. Тут важна структура таблицы в исходнике.
Можно ли подключить только один кейс — например, счета
Можно. Начинаем с одного типа документов где больше всего боли, через 2 месяца смотрим результат и расширяемся на следующий тип. Это экономит и бюджет, и время команды на адаптацию.
Сверка с базой контрагентов — как работает
Извлечённый ИНН проверяется по базе контрагентов в учётке. Если найден — счёт привязывается автоматом. Если нет — флаг «новый контрагент», pipeline подтягивает данные из ФНС (наименование, КПП, ОГРН, юридический адрес) и создаёт карточку на проверку менеджеру.
Что после запуска — нужна ли поддержка
Первые 2-3 месяца — еженедельный разбор ошибок и докалибровка модели. Дальше — раз в квартал. Когда меняется формат документов у крупного поставщика или появляется новый тип первички — точечная адаптация. Поддержка 25-50 тыс. ₽/мес в зависимости от объёма.
Готовы обсудить вашу задачу?
Пришлите 5-10 типовых документов — за 2 дня покажу как это будет распознаваться на ваших образцах. Бесплатный пилот до договора.
Оставить заявкуСмежные решения Noltis
Задачи редко живут поодиночке - вот что чаще всего внедряют вместе с этим продуктом. Полный список - в каталоге продуктов.
- AI-расшифровка встречТранскрипты, саммари и задачи из каждого созвона
- AI-ассистент руководителяПочта, календарь, сводки и контроль поручений
- AI-аналитика отчётовОтчёты сотрудников в выводы и сигналы для решений
- RAG-системы под ключИИ-поиск по вашим документам и базам знаний
- Локальные LLM на вашем сервереМодели в контуре компании, данные не уходят наружу
- Внедрение AI под ключКомплексное направление: аудит, внедрение, поддержка