В работе
Интеллектуальная обработка документов
Автоматизация обработки бухгалтерских документов.
Задача клиента
В бухгалтерский офис ежедневно поступает большое количество документов в разных форматах: электронные счета, сканы, фотографии, выписки, подтверждения оплат, кредитные ноты и сопроводительные документы.
Часть этих документов должна быть распознана, проверена и учтена в соответствующих разделах бухгалтерской системы. До внедрения автоматизации значительная часть работы выполнялась вручную: сортировка документов, определение их типа, извлечение ключевых данных, сопоставление с клиентами и разнесение по нужным субсчетам.
Необходимо было создать систему, которая помогает бухгалтеру обрабатывать входящий поток документов быстрее и с меньшим количеством ручных операций, сохраняя при этом контроль над спорными или нестандартными случаями.
Отрасль / тип бизнеса
Офис сертифицированного бухгалтера, обслуживающий несколько десятков клиентов из разных сфер бизнеса.
Реализованное решение
Была разработана система предварительной обработки бухгалтерских документов. Она принимает PDF-файлы, сканы и изображения, определяет тип документа, извлекает основные данные и отделяет рабочие бухгалтерские документы от вспомогательных.
Для документов, подлежащих учёту, система анализирует содержимое, сопоставляет данные с клиентами офиса и помогает разнести информацию по субсчетам в соответствии с действующим планом учёта.
Обработка документов выполняется локально в офисе, чтобы чувствительные данные клиентов не передавались во внешние сервисы на этапе первичного разбора. Передача данных в сертифицированную онлайн-систему бухгалтерского учёта происходит только после проверки и устранения спорных вопросов.
Для бухгалтера был подготовлен специальный рабочий интерфейс, в котором можно просматривать результаты обработки, исправлять данные, проверять неуверенно распознанные документы и обсуждать отдельные случаи внутри рабочего процесса.
Использованные технологии
Система работает с PDF-документами, сканами и фотографиями. Если в файле уже есть текстовый слой, он используется напрямую. Для сканов и изображений применяется распознавание текста.
Дополнительно используется модуль чтения QR-кодов и штрихкодов, что позволяет точнее определять данные документа и снижает количество ошибок при обработке.
По мере накопления статистики для часто встречающихся поставщиков и форматов документов добавляются отдельные правила обработки. Это ускоряет работу системы и снижает вычислительную нагрузку при регулярной обработке типовых документов.
Результат для бизнеса
Ручная сортировка и первичная обработка документов были заменены автоматизированным процессом. Система самостоятельно обрабатывает основной поток входящих документов, извлекает необходимые данные и подготавливает их для проверки бухгалтером.
Специалисту остаётся сосредоточиться на документах, по которым система не смогла принять однозначное решение, а также на профессиональной проверке и финальном подтверждении данных.
Для бухгалтерского офиса это сокращает объём рутинной работы на несколько десятков человеко-часов в неделю, снижает вероятность ошибок при ручном вводе и позволяет обслуживать больше клиентов без пропорционального увеличения штата.