14.05.2011 | Процесс сканирования: что за чем?
Если использовать программное обеспечение, которое прилагается к сканеру, то изображение цифровое для каждой страницы будет отсканировано и переведено в формат TIFF или Bitmap. OCR процесс начинается, когда один документ или их группа были отсканированы.
При сканировании, обычно, нужна резолюция в 300 dpi. Окончательная цель сканирования - либо провести документы, которые были отсканированы через ОРС (расшифровывается как процесс оптического распознавания символов) для получения документов в формате HTML или Word, либо получить изображения сканируемых документов в PDF формате.
Но с любой стороны очень важно качество исходного изображения. Если качество изображение имеет качество ниже среднего, то выглядеть оно будет достаточно размыто или же занимать существенно больше памяти на диске компьютера. Также, качество изображения существенно влияет на процесс распознавания символов оптическим методом. Если качество изображения ниже среднего, то продуктивность его снижается на 40%. Как правило, ОРС составляет около 90% от стоимости общего процесса преобразования в цифровой формат твердых копий, поэтому оказать существенное влияние на конечные затраты может качество сканирования.
Качество файлов в TIFF формате улучшить можно с помощью настройки самого процесса сканирования для бумаги разного качества, при этом изменяя в программе настройки.
Вначале нужно разделить исходный материал на несколько групп с похожим качеством бумаги и похожим качеством печати. На нескольких экземплярах бумаги первой группы нужно проведите испытание ОРС, чтобы определиться с оптимальными настройками. После этого, весь материал целой группы можно будет смело сканировать. Результаты Вас уже не удивят и сюрпризов не поднесут.