Основные проблемы, возникающие при сканировании книг
Категория: Компьютеры и Интернет
| Автор: V_I_G_O
| Опубликовано: 09.03.2010
Планшетный сканер
- Освещение сканера не достигает затемненной области у корешка книги, даже если используется редуцирующая линза большой резкости; информация, попавшая в данную область, не восстанавливается с помощью ПО.
- Необходимо, чтобы сканируемое издание оставалось в одном и том же положении, иначе оператору придется заниматься обрезкой страниц вручную, поскольку настройки пакетного режима не подойдут ко всем страницам; распознавание текста в дальнейшем будет производиться с потерей качества.
Решение:
- Тщательно следить за тем, чтобы сканируемое издание находилось параллельно границам сканера.
Использовать ПО для устранения искажений
Планетарный сканер
- Большое количество искажений: минимизируется, но не устраняется полностью, за счет прижимного стекла, используемого в некоторых моделях планетарных сканеров.
Решение:
- Использовать ПО для устранения искажений. Неудобство заключается в очень низкой скорости обработки изображений, за счет чего значительно снижается общая скорость сканирования книг этим типом сканеров.
Книжный сканер на основе цифровых фотоаппаратов
- Эффект «Margin crawl», обусловленный толщиной бумаги издания, заставляет изображения по мере сканирования немного продвигаться по горизонтали.
Решение:
- При пост-обработке изображений менять настройки кадрирования каждые 100-200 страниц.
Если же говорить о точности распознавания символов, то сравнение изображений наивысшего качества от сканера на основе ЦФК планшетного и планетарного сканеров с помощью Abbyy Finereader V.8 Professional Edition показал, что наиболее оптимальным вариантом является книжный сканер с V-образной колыбелью - его точность составляет 99,66%, тогда как планшетный и планетарный сканер выдают 90,42% и 91,59% соответственно.
В качестве вывода можно отметить, что каждое из сравниваемых устройств имеет свои достоинства и недостатки; выбор оптимального решения зависит от возможности расшивки документа, его состояния (относительно новое или ветхое издание), требований к получаемому файлу электронной книги и многих других условий.
По материалам сайта www.atiz.ru