Please enable JavaScript.
Coggle requires JavaScript to display documents.
Управление качеством данных при обработке документов - Coggle Diagram
Управление качеством данных при обработке документов
Ограничения Tesseract
Сложности распознавания документов
Плохое качество
Низкое разрешение
Шумы, полосы
Неправильная ориентация
Недостаточная контрастность
Вариативность форм
Изъяны на документах
Наложение текста на другой текст
Загибы страниц
Печати, подписи, рукописный текст на значимых атрибутах
Проблематика работы с документами
Время на ввод данных вручную
При большом потоке требуется много сотрудников
Ошибки при вводе данных вручную
Цели и задачи автоматизации
Цели
Максимально ускорить обработку документов
Обеспечить качество данных
Задачи
Обеспечить качественный поиск атрибутов на документах
Обеспечить проверки качества данных
Примеры проектов
Инструменты управления
качеством данных
Организационные
Настройка сканеров
Шаблонирование документооборота с контрагентами
Коммуникации с контрагентами для улучшения качества предоставляемых документов
Технические
Предобработка изображений
Автоориентация
Минимизация шумов
Удаление подложек документов
Поиск и удаление
нетекстовых объектов
Печати
Подписи
Линии
Надписи от руки
Поиск атрибутов с допустимой погрешностью
Нормализация извлеченных атрибутов
Проверки извлеченных
из документов атрибутов
На обязательность заполнения
На соответствие формату
Проверки по правилам
Сверка с аналогичными атрибутами других документов комплекта
Сверка с другими атрибутами документа
Сверка со справочниками
Проверки на дубль в учетной системе
Методологические
Фокус на наиболее популярных формах документов
Извлечение только тех атрибутов, которых нет в системах Заказчика
Поиск атрибутов через якоря, наименее подверженных шумам, полосам и пр.
Автоматизированное тестирование качества
Примеры применения технических инструментов управления качеством данных