Если имеется уже распознанный текст, возможно, потребуется его переконвертировать в нужный формат. В зависимости от формата, можно воспользоваться стандартными средствами. Т.е. программами, работающими именно с этим форматом, либо задействовать какие-то специализированные «всеядные»: конвертеры форматов. Например, многие не ухищрённые пользователи думают, что все, что сохранено в .pdf является картинкой. Но на самом деле в данном формате может быть, как картинки, так и текст. Зачастую этот текст оттуда быстрее «вытянуть», чем распознавать фанридером. Делается это акробатом, но, к сожалению, только платной версией: Acrobat Pro. Среди именно конвертеров с pdf файлами работают AVS Document Converter, или разные PDF2Word. Аналогично можно преобразовывать с помощью специальных конверторов файлы формата .chm, .fb2, .epub и другие.

П. с.

Кому интересно узнать больше о самих принципах распознания текстов, в качестве дополнения, могу порекомендовать навскидку пару интересных статей: «Распознать нельзя оставить картинкой, или кое-что о сложных случаях оптического распознавания текста». В ней доступным языком повествуется о простых для человека, но в то же время чрезвычайно сложных проблемах для программы распознания текстов. И подробная статейка о разницы векторных и растровых шрифтов «Векторный и растровый текст». Хотя вторая статья не относится непосредственно к теме распознания, но все же, возможно станет подкреплением и дополнением к подразделу «Код буквы и картинки – книга глазами ЭВМ.»

Пару слов о онлайн сервисах.

Решил влепить сюда небольшой подраздел, по теме распознания книг и конвертирования. Я не сторонник онлайн сервисов, но вдруг кому пригодиться. Или кто-то перед скачиванием программы что бы не тратить время захочет попробовать распознать пару страниц и переконвертировать. Так сказать, испытать свои силы.

Навскидку нашел пару неплохих статей, с обзорами нескольких онлайн сервисов распознания текста. В этой: «Онлайн распознавание текста — ТОП-3 сервиса», в конце есть видео. А в этой: «Онлайн-сервисы для распознавания текста», описано все довольно детально, хотя ссылки на картинки, по-видимому, уже битые. На первом месте, как офлайн, так и онлайн сервис компании файный ридер: FineReader Online. К сожалению, онлайн версии, как этой, так и других программ, аналогично многим сервисам онлайн, ограниченные и урезанные, по сравнению с теми, которые можно запустить с ПК. Поэтому если вам надо пару страничек распознать, попробовать, побаловаться, то все же лучше воспользоваться офлайн и желательно портативной версией. А это крайний случай, для самых ленивых и неумелых. Сервисы сегодня работают, а завтра могут оказаться не рабочими, либо добавят новые ограничения, которые вас неприятно удивят и сведут все ваши труды на нет. Хотя ради справедливости отмечу что мне удалось найти парочку онлайн сервисов, которые превзошли своих офлайн собратьев. Например, сервис по компиляции книг с FB2 в ворд, https://convertio.co/ru/fb2-docx/ с сохранением форматирования, закладок и т.д.. Но это уже другая тема. Раньше именно для конвертации, мне приходилось пользоваться ICE Book Reader (портативной версией). Крутая, навороченная программа, но по сути заточена для прочтения глазами с экрана, а функция конвертера лишь как дополнительная. Поэтому, как я не мучился перебирая все настройки, так и не удалось добиться, что бы она хорошо «вытягивала» текст с FB2, сохраняя всё форматирование, заголовки, картинки. А вот сервис, приведенный мною, выше оказался лучше программы. Конечно в современных дивайсах книги прорабатывают в основном именно в FB2, но, на сколько мне известно, этот формат не предназначен для редактирования и не так гибок, как гигант – ворд. Поэтому рекомендую сводить все книги именно к docx формату. Хотя, можно на всякий случай держать их и в pdf.

Общие моменты.

На том, как сбрасывать книги на мобильный, пока останавливаться не буду. Есть масса способов. Все зависит от дивайса и установленных программ. Я лично для этого использую блютус, чтобы ни расшатывать порты и лишний раз не дергать карту памяти. Хотя, если файлов много, и они большие, то целесообразнее воспользоваться картридером, и вытянуть карту. Вариантов масса. Надеюсь, трудностей не у кого не возникнет. Кроме счастливых обладателей новых дивайсов с андроидом, в которых появилось нововведение невозможности полноценно расшарить папки через блютус стандартными средствами. Вот вам, очередное доказательство «прогресса» технологий. Там приходится использовать по старинке кабель, или ставить доп. софт расшаривая вайфай.

Перейду непосредственно к программам синтеза речи. Благо они появляются на разных устройствах и работают под различными операционными системами.

Но прежде чем перейти отдельно к операционным системам стоит отметить, что практический во всех программах синтеза речи есть один существенный нюанс. А именно то, что, скорей всего, придётся установить отдельно программу, и отдельно синтезаторы речи.

Перейти на страницу:

Все книги серии СамИздат

Похожие книги