Но одно дело ошибки, а другое, когда просто-напросто половина слов в книге вовсе не понятны. Мне, буквально недавно, попалась книга, а точнее учебник по частной паталогической анатомии. Какой-то «умелиц» даже не додумался отсканировать её файнридером с разворотом страниц. Хотел сделать подарок братьям медикам и распознать её для удобства пользования. Файнридер с лёгкостью может разделить страницы, обрезать лишнее (что было отсканировано за полями страниц) и преобразовать картинки в текст. Но он все это может, в том случае, если на картинки видны буквы. Если же на картинки буквы практический не видны, то естественно, уже не только программа, но и люди могут оказаться бессильны. Особенно неприятно, когда оказывается в середине книги что распознать её полноценно невозможно. По сути это убитое время как того, кто отцифровывал, так и того, кто пытался распознать. Да и думаю скачавшие не получат удовольствия от небрежно перевернутых на бок страниц, в которых половина текста просто нет. Т.е. это не книга, а какая-то убогая демоверсия фотографий вымазанных краской листов бумаги.
Для наглядности приведу принскрины этого «шедевра».
Вот как выглядят страницы этой скачанной книги:
Рис. 30 пример страницы неправильно отсканированной и сохраненной книги.
Мало того, что для её прочтения, надо переворачивать или экран, или голову на бок, так еще и приходится догадываться, какие первые слова написаны, практический в каждой строчке, данного труда. Это видно на 145 верхней странице. Но в начале книги страницы еще сносные, поэтому я только при распознании понял, что не чего не выйдет. Впредь буду умнее. И другим советую, перед тем, как распознавать книгу, скачанную с интернета, бегло пролистать страницы и убедиться все ли они есть, какого качества страницы в середине книги, видны ли там буквы. Иначе файнридер не осилить эти уродства и выдаст вместо слов бессмысленный набор букв.
Рис. 31 Пример плохо отсканированного текста который нельзя нормально распознать.
С другой стороны, не хочется отпугивать людей, которые начинают сканировать книги. На самом деле это совершенно не сложно. Можете попробовать для начала отсканировать не всю книгу, а пару десятков страниц вначале, в середине и в конце. Если их удастся нормально распознать, то сканируйте всю. Повторюсь, для файнридера не проблема перевернуть страницы, разделить их на развороте, обрезать, автоматический исправить перекос страниц и многое другое. Единственная проблема в том, что некоторые сканирующие, неплотно прижимают книгу к сканеру. Из-за чего буквы, возле разворота, в центре книги, практический не видны. Собственно, это и показано на фото выше.
Если бы её сканировали, используя сразу программу файнридер, то можно было бы просто поставить все галочки. Единственное что осталось бы это перелистывать страницы, когда они отсканируются.
Рис. 32 Настройки в программе файнридер.
После того, как у вас появилась цифровая версия книги, перейдем к следующему пункту раздела «Алгоритм действий.», а именно переводу книги в нужный формат.
Наверно, повторюсь, трудно писать о том, что происходит в данном направлении сейчас, т.к. информационные технологии настолько быстро развиваются, что успеть за ними и уследить, практический невозможно. Поэтому то, что сейчас только внедрили, уже завтра может быть безнадежно устаревшим. Тем не менее, некоторые технологии вчерашнего дня, по ряду причин, до сих пор все еще актуальны. Например, все не как не соберу денег на новый смартфон, да и старый меня вполне устраивает, поэтому я, как и 5 лет назад, продолжаю слушать книги на своем стареньком N-82. Хотя, уже давно пора перейти на железо под управлением андроида, или чего-то подобного. Но по ряду причин все еще не перехожу. Дорого, да и подходящих мне смартфонов, по-видимому, пока не придумали.
Конвертация книг частично рассмотрена в подразделе: «Сохранить книгу в нужном формате», ниже. К тому же тема довольно большая, т.к. форматов много. Если говорить за фанридер. То, в нем есть кнопка «Файл», «Сохранить документ как…» и выбираем нужный формат.
Рис. 33 Настройки в программе файнридер.
Рекомендую сохранять в двух форматах .docx и .pdf (текст под изображением). Не буду долго расписывать почему, зачем, как... Нюансы распознавания. Хотя наверно стоило бы. Но это долго. Если кому надо, Googlите, есть на YouTube не плохие видео «Как распознавать книги файнридером». Или, надеюсь, в будущем появится бесплатная аналогичная программа.