Перед обработкой автоматически повышается визальное качество изображения документа — подавляются помехи: фон, помарки, особенности фактуры бумаги, изломы, потертости и т.п.
После того как помехи сняты изображение раскладывается на составные части, так называемые слои: текст, иллюстрации, графики, декоративные элементы. После этого к каждому слою автоматически подбирается наиболее эффективный алгоритм сжатия, дающий компактный размер с минимизацией потери информации (для дальнейшей машинной либо ручной обработки). Текстовая информация из документа распознается встроенной OCR-системой CuneiForm (OpenOCR) в отдельный текстовый слой. В текстовый слой также можно добавить метаданные, реквизиты и теги. Полученные слои объединяются в файл в формате PDF/A.



402375357