В работе

Интеллектуальная обработка документов

Автоматизация обработки бухгалтерских документов.

Задача клиента

В бухгалтерский офис ежедневно поступает большое количество документов в разных форматах: электронные счета, сканы, фотографии, выписки, подтверждения оплат, кредитные ноты и сопроводительные документы.

Часть этих документов должна быть распознана, проверена и учтена в соответствующих разделах бухгалтерской системы. До внедрения автоматизации значительная часть работы выполнялась вручную: сортировка документов, определение их типа, извлечение ключевых данных, сопоставление с клиентами и разнесение по нужным субсчетам.

Необходимо было создать систему, которая помогает бухгалтеру обрабатывать входящий поток документов быстрее и с меньшим количеством ручных операций, сохраняя при этом контроль над спорными или нестандартными случаями.

Отрасль / тип бизнеса

Офис сертифицированного бухгалтера, обслуживающий несколько десятков клиентов из разных сфер бизнеса.

Реализованное решение

Была разработана система предварительной обработки бухгалтерских документов. Она принимает PDF-файлы, сканы и изображения, определяет тип документа, извлекает основные данные и отделяет рабочие бухгалтерские документы от вспомогательных.

Для документов, подлежащих учёту, система анализирует содержимое, сопоставляет данные с клиентами офиса и помогает разнести информацию по субсчетам в соответствии с действующим планом учёта.

Обработка документов выполняется локально в офисе, чтобы чувствительные данные клиентов не передавались во внешние сервисы на этапе первичного разбора. Передача данных в сертифицированную онлайн-систему бухгалтерского учёта происходит только после проверки и устранения спорных вопросов.

Для бухгалтера был подготовлен специальный рабочий интерфейс, в котором можно просматривать результаты обработки, исправлять данные, проверять неуверенно распознанные документы и обсуждать отдельные случаи внутри рабочего процесса.

Использованные технологии

Система работает с PDF-документами, сканами и фотографиями. Если в файле уже есть текстовый слой, он используется напрямую. Для сканов и изображений применяется распознавание текста.

Дополнительно используется модуль чтения QR-кодов и штрихкодов, что позволяет точнее определять данные документа и снижает количество ошибок при обработке.

По мере накопления статистики для часто встречающихся поставщиков и форматов документов добавляются отдельные правила обработки. Это ускоряет работу системы и снижает вычислительную нагрузку при регулярной обработке типовых документов.

Результат для бизнеса

Ручная сортировка и первичная обработка документов были заменены автоматизированным процессом. Система самостоятельно обрабатывает основной поток входящих документов, извлекает необходимые данные и подготавливает их для проверки бухгалтером.

Специалисту остаётся сосредоточиться на документах, по которым система не смогла принять однозначное решение, а также на профессиональной проверке и финальном подтверждении данных.

Для бухгалтерского офиса это сокращает объём рутинной работы на несколько десятков человеко-часов в неделю, снижает вероятность ошибок при ручном вводе и позволяет обслуживать больше клиентов без пропорционального увеличения штата.