LEEET.net

НОВОЕ НА САЙТЕ

Обзор устро­йства для чте­ния книг iRiver Story: Белая ладья

Обзор устро­йства для чте­ния книг PocketBook 360°

Обзор устро­йства для чте­ния книг Sony Re­ader PRS-600

Добавлен еще обзор устро­йства для чте­ния книг Amazon Kindle 2

Описание тех­но­ло­гии Bluetooth

История компании Canon

Обзор устро­йства для чте­ния книг Amazon Kindle 2

История компании Ama­zon

ABC Amber LIT – кон­вер­тер файлов LIT фор­мата

ShortBook – про­грам­ма для чте­ния книг iPhone

DjVu Do­cu­ment Exp­ress Edi­tor Pro – про­грам­ма для соз­да­ния и про­смо­тра DjVu-до­ку­мен­тов

Немного инфо­рма­ции о се­нсо­рных экра­нах

Fb2Fix & FF Shell – кор­рек­тор fb2-книг с Либ­русе­ка

Русификация устро­йства для чте­ния книг Sony Re­ader PRS-700

STDU Converter – про­грам­ма для кон­вер­тации файлов в фор­мате DjVu или TIFF в PDF

CHM Decoder – про­грам­ма для кон­вер­тации файлов в фор­мате CHM

Macintosh Book Re­a­der – про­грам­ма для чте­ния книг (Win­dows, Linux, Ma­cin­tosh)

µBook Reader – про­грам­ма для чте­ния книг (Windows)

История корпорации Sony

iPhone TextReader – про­грам­ма для чте­ния книг iPhone

Программа Fiction­Book Editor 2.0 – для созда­ния и редак­тирова­ния Fb2 фай­лов

Обзоры и описание устро­йства для чте­ния книг Sony Reader PRS-700

Обзоры и описание устро­йства для чте­ния книг PocketBook 301

Купить PocketBook 301 Plus

Inscenic Smart DjVu – про­грам­ма для чте­ния файлов DjVu (КПК)

Foxit Reader – про­грам­ма чте­ния файлов PDF (Windows)

Программа Yo – пред­назна­че­на для ёфи­ка­ции рус­ских текст­ов (Win­dows)

Программа для чте­ния книг PocketDjVu (Win­dows Mo­bi­le)

Brava Reader – про­грам­ма для чте­ния файлов PDF (Win­dows)

ведение бухучета Ростов

Информация / Статьи / Создание электронных книг средствами Linux

Вадим Кузнецов (DikBSD)

Создание электронных книг средствами Linux

Часть 1. Краткий обзор форматов электронных книг

Думаю, не ошибусь, если предположу, что каждый пользователь компьютера хоть раз в жизни да сталкивался с электронными документами. Область, в которой больше всего используется ЭВМ — как раз создание и обработка документов, будь то простые письма, отчеты, личные записи, корпоративная документация или просто книги. Как раз о них, любимых, и будет эта статься.

В последнее время все больше и больше людей читают книги в электронном варианте на компьютерах, КПК, коммуникаторах или смартфонах. Конечно, бумажные книги «никто не отменял», и они по-прежнему востребованы. Но электронные книги обладают рядом преимуществ, по сравнению с их бумажными «оригиналами». Их легко при желании распечатать, легко найти нужное слово, фразу... Если читаешь на переносных устройствах, то можно «держать» в кармане целую библиотеку с поиском (для сравнения: сколько бумажных книг вы могли бы взять с собой в поездку?) Если книги систематизированы в библиотеку, то очень легко и удобно искать нужные данные сразу во многих книгах, проводить исследования и т. д. Текст можно располагать в одну или несколько колонок, на ваш вкус. Полюбившиеся цитаты легко скопировать и распечатать. Ну, и так далее.

Существенный минус электронных книг — это утомляемость и снижение зрения. Другой, легко устраняемый минус — во «всемирной паутине» не так уж много книг высокого качества. Создание книг высокого качества — это как то, ради чего и замышлялась наша серия статей.

Итак, мы определились: да здравствуют электронные книги! Но появляется другой вопрос: в каком формате создавать книги? Их довольно много, мы рассмотрим только основные, в которых наиболее всего создаются электронные книги: txt, pdf, djvu, html, fb2, pub. Это — самые распространенные межплатформенные форматы, которые можно использовать на таких системах, как Linux, Mac Os X, FreeBSD, Windows. Очень удобен формат chm, но, к сожалению, его «родная» среда — Windows. На Linux же можно читать книги в этом формате пока через wine.

Перед обзором самых распространенных форматов давайте определимся, что мы ожидаем от использования электронных книг. Конечно, вкусы у всех разные, но ожидания многих пользователей e-book можно свести к следующим:

  1. Наличие оглавления и удобство работы с ним.

  2. Картинки и иллюстрации.

  3. Визуальное «выделение» цитат, стихов и других «элементов» книги.

  4. Возможность иметь смысловые выделения отдельных слов или фраз полужирным, курсивом...

  5. Сноски и ссылки в виде гиперссылок. Легко можно перейти, посмотреть текст сноски, потом вернуться назад и продолжить чтение.

  6. Удобный поиск.

  7. Дополнительная информация об авторе книги, жанре, издательстве, издании книги...

  8. Удобство чтения и на экране монитора, и на «карманных» устройствах (КПК, смартфоны, коммуникаторы). Очень неудобно иметь два вида одной и той же книги — и для чтения на экране монитора, и для мобильных устройствах.

Все написанное ниже — это отражение моего опыта работы с разными форматами., отражение моего понимания достоинств и недостатков разных форматов в качестве формата электронной книги.

TXT

Txt-формат лучше вообще не использовать для создания книг. Его описание приведено здесь только для того, чтобы подчеркнуть «достоинства» других форматов на фоне его недостатков, как формата для электронных книг. Он идеален для заметок.

Txt - cамый распространенный формат, без особых «изысков» типа форматирование текста, выделение полужирным, курсивом и т. д. Размер книги в txt минимальный, быстро загружается практически любым текстовым редактором или «читалкой».

Оглавление книги можно создаеть, как простой текст вначале книги. Вот только пользы от него немного. Можно только ознакомиться с содержанием книги, но перейти к нужной главе не удастся, разве что в поисковом запросе ввести название нужной главы. Согласитесь, не очень удобно. Придется смириться также и с тем, что ни картинок, ни выделений фраз курсивом, ни сносок в виде гиперссылок в книге не будет. Формат это не поддерживает. Конечно, можно проставить номера сносок в тексте, а сам текст сносок — где-то в конце книги, но каждый раз либо «запоминать» место чтения закладкой, либо копировать часть текста, чтобы потом через поиск вернуться назад, после просмотра внизу книги сноски... Приятного мало. Отсутствия поддержки форматом txt курсива или полужирного выделения можно восполнить чередованием символом слова и знаком подчеркивания, но воспринимается это не очень хорошо.

Если в книге есть цитаты, стихи, и их хочется как-то выделить, то это можно сделать «отбивкой» несколькими пробелами в начале каждой строки. На компьютере такое «форматирование» будет выглядеть более или менее нормально. А вот на мини-устройствах — ужасно. Строки «сбиваются», лишние пробелы «отодвигают» текст стиха вправо, текст «переносится» на другую строку без отбивки нужными пробелами. Просто путаешься — где красная строка, а где «сформатированный» стих.

Дополнительная информация об авторе, издательстве и т. д. легко может быть размещена или вначале книги, или же в конце. Ею пользуются нечасто, так что, когда она потребуется, можно просто перейти в нужное место. Правда, для того, чтобы вернуться назад к месту чтения, потребуется опять использовать либо систему закладок, либо поиск заранее скопированного в буфер отрывка книги. Тоже не очень удобно.

Как вы, наверное, уже поняли, мы пришли к выводу, что для создания электронной книги формат txt не очень то и подходит (конечно, есть любители помучиться...).

PDF (Portable Document Format)

Достоинство этого формата — его межплатформенность, четкое сохранение всех элементов книги «на своих местах». Он почти (не будем категоричными) идеален для печати. Текст документа и картинки могут располагаться в одном файле. Есть возможность создать оглавление книги, сносок и ссылок на другие места книги.

Но на этом, пожалуй, плюсы pdf-формата, как формата для электронных книг и заканчиваются.

Из-за того, что файл хранит внешний вид документа, как его создал автор электронной книги, то изменить цвет, шрифт, выравнивание абзацев и (или) стихов, цитат «под себя» уже не получится. Придется довольствоваться тем, что есть. С другой стороны, читать pdf-книги на КПК или смартфоне — просто мучение! Максимум, что можно сделать — это отмасштабировать текст книги. Сделаешь шрифт крупнее — страница не помещается на экране. А читать, всякий раз передвигая текст влево или вправо, и ждать, пока подгрузится книга — удовольствия мало.

Размер pdf-книги намного больше, чем книг других форматов, не считая djvu.

Очень часто довольно проблематично бывает переконвертировать книгу из pdf в другой формат, если в системе не установленны нужные шрифты.

В pdf хорошо создавать научные или технические книги, где важна структура и жестко заданное расположение элементов книги. Создавать книги в pdf-формате лучше в том случае, если жизненно важен внешний вид книги, чтобы цвет, шрифт и форматирование текста были именно таким, каким вы их сделали. Или когда вам безразлично, как выглядит книга. Или когда вы не планируете читать эти книги на мобильных устройствах, а только на экране монитора. Для художественных книг лучше использовать chm, htm, а еще лучше — fb2-формат (об этом — ниже).

DjVu

Сравнительно «молодой» формат. Книги в этом формате, в отличие от других, содержат в своей основе закодированную картинку. Размер djvu-файла потрясающе мал. В зависимости от профиля (нормальный, черно-белый, электронный, фотография, рукопись, рисунок, карта) и от разрешения (dpi) меняется и размер и качество книги. Но даже при сохранении с большим dpi файл сравнительно меньше, чем pdf.

DjVu, как и pdf сохраняет изначальное расположение текста книги. Это и понятно — кодируются картинки страниц. Это налагает на книгу и ее чтение на КПК те же ограничения, что и для pdf. Поэтому многое, написанное выше для формата pdf, справедливо и для djvu.

Поиск можно осуществлять, если внедрить в djvu-файл еще и текстовый слой страниц книг. DjVu-редакторы позволяют создавать гиперссылки. То есть можно создать оглавление книги, сноски.

DjVu удобен для сканирования книги и сохранения ее в файл-архив для дальнейшей обработки. Я часто создаю djvu-книги «на скорую руку», чтобы потом «перевести» их в html, chm или fb2 форматы.

Читать djvu-книги можно в основном на экране монитора. На КПК — сущее мучение, как и pdf, из-за масштабирования и долгого рендеринга страниц.

DjVu формат в основном используется для хранения технической или научной литературы. Для создания художественных книг его лучше не использовать — для этого есть гораздо лучшие форматы.

HTML

Это более «продвинуты» формат для создания книг. Он поддерживает различные стили, которыми можно «выделить» главы книги, есть курсив, полужирное выделение, подчеркивание и зачеркивание текста, верхний и нижний индекс, выравнивание абзаца по левому, правому краю или по центру. Есть возможность создать нумерованную структуру текста. Формат прекрасно «работает» с картинками, таблицами, сносками и гиперссылками (что явно из названия формата). Стихи и цитаты можно «выделить» определенными стилями. Оглавление и главы книги можно создать либо в отдельных файлах, либо в одном. Тоже самое относится и к дополнительной информации об авторе книги, издательстве, издании книги.

Книги этого формата легко читаются и в специализированных читалках, и в браузерах FireFox, Opera. Это — существенный плюс формата. Текст легко «распределяется» по экрану устройства чтения, сохраняя при этом выравнивание абзацев, стихов, цитат.

«Внешний вид» стихов, цитат, фона и других элементов книги легко можно настроить через использование css-файла, где описываются элементы книги.

Формат HTML прекрасно подходит и для художественной, и для технической литературы, содержащей таблицы. Проблем с копированием текста не представляет никакой сложности.

Существенный минус формата html, как формата для электронный книг — это то, что и картинки, и текст хранятся в разных файлах. В случае, когда каждая глава расположена в отдельном файле, их число еще больше увеличивается. Это может привести к тому, что случайно какой-нибудь файл книги или картинка будет стерта или не скопирована. «Целостность» книги будет нарушена. Этот «недостаток» был исправлен в таких форматах, как mht и chm, но ни на «карманных» устройствах, ни на Unix-подобных системах стандартными средствами они «не читаются». Конечно, могут появиться читалки и редакторы для этих форматов (а может и уже есть, я не знаю — мир Linux велик)...

Если вы желаете создавать книги на основе html, то позвольте дать несколько советов. Все главы, оглавление и дополнительную информацию о книге размещайте в одном файле. Все переходы между ними осуществляются в виде гиперссылок. Если в книге есть картинки, то и они, и файл книги располагайте в одной папке. Это элементарный совет, но сколько книг теряли свою «целостность», когда он игнорировался!

CHM

Этот формат — один из самых лучших. В принципе — это тот же html, только все файлы сжаты в виде одного архива. Поэтому, chm «унаследовал» все достоинства html, и избавился от его «недостатков», как формата для электронной документации.

Минус формата — отсутствие межплатформенности (все-таки «детище» Билла Бэйтса, хотя на редкость удачное). С другой стороны, ограничением для использования этого формата является отсутствие специализированных читалок и библиотекарей chm-формата. А жаль! На Windows chm-книги читаются средствами самой Windows (есть удобный поиск, оглавление...), чего не скажешь о Linux. Но, несмотря на это, все-таки chm-книги можно создавать и читать и на Linux! Кроме того, компания Microsoft объявила формат "deprecated", т.е. официально остановлено любое дальнейшее развитие и поддержка его в будущем.

На КПК для чтения по WinCE используется программа «microOLAP CHM eBook Reader для Pocket PC», одна из лучших в своем роде.

Chm-формат лучше всего подходит для создания электронных книг технического плана. Для художественных книг лучше всего подходит fb2-формат.

FB2

Сравнительно молодой формат электронных книг, но уже ставший довольно популярным. Он создан Дмитрием Грибовым в основном для художественных книг. Формат создан на основе xml и вобрал в себя лучшее от html (стили полужирный, курсив, зачеркивание, гиперссылки, верхний и нижний индекс, отображение простых таблиц, картинок, изменение «внешнего вида» текста через css-файл и т. д.). Книга вместе с картинками сохраняется в один файл, что сохраняет целостность книги. Абзацы текста могут быть «выделены», как стихи, цитаты, аннотации, эпиграфы. Все 8 пунктов того, что ожидается от электронной книги (см. выше) полностью реализованы в fb2-формате. Книги можно создавать и с Юникодными символами.

Минус формата — в нем нет возможности создавать нумерованные списки или древовидные структуры текста, сложных таблиц (что важно для технических книг), выравнивания текста. Это обусловлено тем, что формат создавался в основном для художественных книг и для чтения на КПК и мобильных устройствах, хотя fb2-книги прекрасно читаются и на экране монитора. Так что для технической литературы fb2 лучше не использовать.

Поддержка формата активно развивается, имеется большое сообщество пользователей и разработчиков программного обеспечения (редакторы, конвертеры, читалки, библиотекари...). Пожалуй, fb2 — самый лучший формат для художественных книг.

Вывод

Как видим, для каждого вида книг лучше использовать свой формат. Долгое время я пытался все книги, и художественные и технические, создавать в html-формате, потом — в fb2. Опыт приходит с годами. Сейчас я создаю художественные книги и технические, состоящие просто из текста — в fb2, чисто технические — в chm. Когда нет времени на качественное изготовление книги в fb2 или chm, или важен «внешний вид» страниц — «перегоняю» книгу сканированием в djvu, как архив. Pdf редко использую, хотя есть много pdf-книг, сделанных другими, которые потихоньку перевожу в другой, более удобный для меня формат.

Как видим, нет универсального формата книг, а жаль! Возможно, когда-нибудь кто-нибудь разработает такой, взяв все самое лучшее от других форматов книг и документов.

На сегодняшний день, на мой взгляд, самые удобные форматы для книг — это fb2 (для художественных книг) и chm (для всех остальных).

В следующих статьях мы будем подробно описывать процесс создания книг в этих основных форматах. Не обойдем стороной и то, как же все-таки в Linux создавать и читать книги и в формате chm.

      © 2008 -2016 LEEET.net