Электронные книги
СОДЕРЖАНИЕ: Электронные библиотеки, проблемы авторского права и их решение. Форматы выкладываемых произведений: графические растровые, графические векторные с оформлением, простой текст (plain text). Обзор по самым известным программам для чтения электронных книг.Содержание
Введение
1. История электронных библиотек
2. Электронные библиотеки, проблемы авторского права и их решение
3. Форматы выкладываемых произведений
3.1 Графические растровые форматы
3.2 Графические векторные форматы с оформлением
3.3 Простой текст (plain text)
4. Программы для чтения электронных книг
4.1 Обзор по самым известным программам для чтения электронных книг
Литература
Введение
Электронная книга (англ. - e-text или e-book) - версия бумажного издания в цифровом (электронном виде). Электронной книгой называется и цифровой вариант издания, так и ряд устройств, которые используются для их прочтения.
Популярность электронных книг набирает обороты с каждым днем. Говорят, что их появление - важнейшее событие в истории издательского дела со времени изобретения печатного станка. Вся планета повально увлечена оцифровкой всех типов книг, которые, по мнению самих оцифровщиков, представляют ценность для любого, даже самого малого количества читателей. В первую очередь, для пользователей привлекателен малый объем электронных книг (на одном ПК или КПК можно хранить десятки и сотни тысяч) и малая же стоимость (большинство литературных изданий в цифровом виде доступно для скачивания, оплачивается лишь передача объема информации через Интернет.). Удобным считается также возможность полнотекстового поиска – при условии, что текст набран или распознан.
Широкое распространение получила практика сканирования домашней библиотеки. Для того, чтобы громоздкие шкафы с пыльными книгами не занимали много лишнего места, часть книжного массива оцифровывается и затем утилизируется - кроме, конечно, самых ценных и раритетных экземпляров. Оцифровку домашней библиотеки обычно производят либо планшетным сканером, либо цифровым фотоаппаратом, распознавание текста производят редко.
Оцифровка библиотечных фондов – одно из самых перспективных направлений в области внедрения высоких технологий и автоматизации. За границей практика создания электронных библиотек намного обширнее, однако в России за последние годы тенденция к переводу библиотечных массивов в электронный стремительно набирает обороты. Появляются электронные фонды библиотек для детей, ВУЗовские и школьные электронные библиотеки, а также электронные библиотеки госучреждений. Необходимость создания подобных ресурсов признано на правительственном уровне - например, на создание электронного библиотечного фонда им. Б.Н. Ельцина выделено 5 млрд. рублей с тем, чтобы доступ к ней имелся из любой библиотеки страны, и была возможность получить максимум информации по любой теме, связанной с законом и государством.
Для сканирования фондов библиотек закупаются профессиональные книжные сканеры, предпочтение отдается сканерам с V-образной колыбелью, так как подобная конструкция позволяет делать снимки страниц книги не раскрывая ее полностью, а значит, исключается возможность каких-либо повреждений – критично особенно для старинных, ценных экземпляров.
1. История электронных библиотек
Первым проектом по созданию электронной библиотеки стал Проект «Гутенберг» (1971 год). В Рунете первой электронной библиотекой стала библиотека Максима Мошкова.
С ростом числа пользователей компьютеров и интернета всё большее количество людей начинает пользоваться электронными книгами. В то же время число пользователей оффлайновых библиотек снижается. Так за период 1997—2002 годы в Университете Айдахо количество посетителей снизилось более чем на 20 %, а число пользователей электронных версий за период 1999—2002 увеличилось на 350 %. В связи с этим многие библиотеки начали создавать электронные версии хранящихся в их фондах книг.
В 1990 году библиотекой конгресса США был начат проект «Память Америки». В рамках проекта предоставляется свободный и бесплатный доступ к электронным материалам по истории США.
В 2002 году Google начинает собственный проект по оцифровке книг. В декабре 2004 года было объявлено о начале работы библиотечного проекта «Google Print», который в 2005 году был переименован в «Поиск книг Google».
20 ноября 2008 года начала функционировать общеевропейская цифровая библиотека Europeana.
21 апреля 2009 года состоялось официальное открытие Всемирной цифровой библиотеки.
27 мая 2009 года в Санкт-Петербурге была открыта президентская библиотека имени Бориса Ельцина, в задачи которой входит предоставления электронных материалов по истории России.
2. Электронные библиотеки, проблемы авторского права и их решение
Многие электронные библиотеки публикуют литературные произведения без предварительного согласия авторов, и хотя в некоторых из них по первому требованию автора его тексты снимаются с сайта, де-юре они нарушают законы об авторском праве.
Тем не менее, в результате работы Государственной Думы и Совета Федерациии, президентом РФ Медведевым Д.А. был подписан Федеральный закон Российской Федерации от 27 октября 2008 г. N 183-Ф3 О внесении изменений в статью 18 Федерального закона «О библиотечном деле» суть которого «Российской газете» пояснил генеральный директор Российской государственной библиотеки Виктор Федоров:
Что касается оцифровки библиотечных фондов, то отношение к этому закону двоякое. С одной стороны, он действительно утверждает право библиотек использовать достижения современных информационных технологий и переводить имеющиеся у них фонды в цифровую форму. С другой стороны, последний абзац закона возвращает нас к четвертой части Гражданского кодекса, где сказано, что оцифровка должна осуществляться только по договоренности с автором. А это для нас головная боль. Библиотека не в состоянии сама заключать договора с авторами. Во всей мировой библиотечной практике этим занимаются специальные организации.
Таким образом, прекрасно, что библиотекам, наконец, подтвердили их право на оцифровку их фондов. Но с точки зрения профессионального библиотекаря, мне очень жаль, что мы не пошли дальше в этом направлении. В мировой практике даже есть устоявшийся термин «библиотечные исключения». В США, Европе библиотеки, реализуя конституционное право граждан на получение информации, имеют право переводить в цифровую форму свои фонды, не спрашивая разрешения у авторов. Разумеется, это делается (и это тоже устоявшийся термин) «на принципе добропорядочного и честного использования». Это значит, что речь идет о предоставлении оцифрованной информации только в научных, культурных и образовательных целях, а не для коммерческой выгоды. Если речь идет о коммерческой выгоде, то, уже без всяких исключений, надо договариваться с автором.
3. Форматы выкладываемых произведений
Форматы размещаемых в электронных библиотеках произведений можно разделить на две категории — форматы, предназначенные для чтения текста он-лайн и форматы, предназначенные для скачивания на компьютер читателя.
Самый популярный формат первой категории — HTML, однако библиотека Мошкова, например, выкладывает тексты в формате TXT. Связано это с традицией: во время появления этой библиотеки (1994 год) скорости работы в интернет были весьма низки, и оправданным было использование самого лёгкого формата. Также по философии библиотеки каждое произведение должно было целиком умещаться на стандартном носителе информации (каковым тогда являлась дискета).
Форматы для скачивания — заархивированный TXT; RTF и DOC; Mobipocket.PRC (формат для чтения книг на кпк и телефонах). Также очень популярен формат FictionBook, созданный специально для хранения литературных произведений. Первая электронная библиотека — Проект «Гутенберг» — требует в файлах для скачивания использовать текстовый формат в архивах ZIP для того, чтобы тексты можно было читать практически на любых устройствах, и чтобы они не были потеряны в случае исчезновения программ для обработки используемых форматов.
Книги, изобилующие математическими формулами и сложными схемами, после сканирования переводить в текстовый формат намного сложнее, поэтому часто их хранят в графическом формате, обычно DjVu и PDF. Тогда как PDF при таком применении представляет собой просто объединенный в один файл набор изображений TIFF, DjVu использует специальный алгоритм, позволяющий получать в несколько раз меньшие файлы даже при сжатии без потерь.
Наоборот, если существует электронный оригинал книги — с редактируемым текстом и векторными изображениями, то PDF будет иметь лучшее качество и меньший объём.
Перед теми, кто занимается оцифровкой изданий или набором книг непосредственно на ПК, рано или поздно встает вопрос – в каком формате - поскольку их множество - издавать электронную книгу или, соответственно, в какой формат ее импортировать из текстового.
Существует несколько групп форматов электронных книг – графические и растровые форматы. Растровые форматы представляют объект в виде множества точек, векторные – в виде простейших геометрических фигур (точки, линии, многоугольники). Таблица внизу классифицирует их именно по этому признаку.
Однако, как и любая другая, эта классификация условна. Например, PostScript (.ps,.eps), PDF могут быть чисто векторными. Так же DOC, PDF могут содержать только растровые отсканированные картинки или же наоборот - содержать только текст.
Существует также разделение форматов электронных книг на предназначенные для чтения текста он-лайн и для сохранения на компьютере пользователя. К первой группе относятся файлы такого формата, как HTML и TXT, ко второй – RTF, DjVu, PDF и проч.
Здесь вы можете узнать краткую справочную информацию о различных форматах электронных книг.
3.1 Графические растровые форматы
TIFF - Формат для хранения изображений с большой глубиной цвета. Чаще всего используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. Глубина изображение делает TIFF незаменимым форматом для тех, кто занимается оцифровкой бумажных изданий, так как процесс распознавания текста упрощается во много раз.
JPEG - Данный формат использует сильное сжатие, уровень которого можно регулировать, с потерей информации.
Применяется для хранения высококачественных изображений, позволяет использовать до 16 миллионов цветов, именно поэтому электронные книги в этом формате также имеют место - для печати он непригоден, а для демонстрации на дисплее подходит идеально.
DjVu - Использует специальный алгоритм, позволяющий получать файлы меньшего размера при сжатии без потерь за счет технологии, разработанной специально для хранения оцифрованных документов рукописей, книг, журналов. Популярнейший формат книг в файлообменных сетях.
3.2 Графические векторные форматы с оформлением
RTF - Формат, поддерживаемый большинством текстовых редакторов, созданный для документов в среде ОС Windows. обеспечивает возможность сохранения структуры текстовых документов, позволяет выделять их фрагменты (курсивом или жирным шрифтом, создавать колонки и т.п.). Книги в формате RTF доступны для скачивания во многих книгообменных сайтах.
HTML - Стандартный язык разметки документов во Всемирной паутине. Разметка позволяет вставку спецсимволов, изменение размера, типа, начертания шрифта, создание гиперссылок и таблиц, выравнивание текста. Электронные книги в формате HTML чаще всего выставляются в полнотекстовом виде на сайте, в этом случае в скачивании на компьютер нет необходимости.
OPF FlipBook - Открытый формат электронных книг - стандартная версия программы FlipAlbum создает альбомы-книги FlipBooks с расширением OPF (Open Electronic Book Package Format). Эти файлы могут быть просмотрены с помощью самой программы или бесплатной утилиты для работы с OPF-файлами.
HTMLHelp - Книга - файл формата.chm. Содержит в себе набор HTML-страниц, может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Используется для создания справки в ОС Windows и, по аналогии, для создания книг, с помощью специального программного обеспечения.
SGML - Стандартный общий язык разметки для документов. Широко используется в издательском деле - рукописи зачастую передаются в электронном SGML-структурированном виде, что значительно облегчает работу наборщиков и дизайнеров.
XML - XML — текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (конвертации, хранению, управлению) в любой среде, поэтому на его основе создан формат FictionBook.
FictionBook - Открытый формат, основан на XML. Основное преимущество FictionBook(.fb2) - возможность без труда создавать (в том числе и автоматически) книги в этом формате из файлов всех популярных текстовых форматов (*.txt, *.doc, *.rtf. *.html и пр.). Кроме того, FictionBook поддерживается большинством распространенных программ и устройств для чтения книг.
TEX - TEX — система вёрстки, разработанная в целях создания компьютерной типографии. В неё входят средства для секционирования документов, для работы с перекрёстными ссылками и для набора сложных математических формул. Документы набираются на собственном языке разметки в виде файлов, содержащих информацию о форматировании текста или выводе изображений. Электронные книги обычно имеют расширение.tex, конвертируются специальной программой в файлы «.dvi», которые могут быть отображены на экране или напечатаны. DVI-книги можно специальными программами преобразовать в PostScript, PDF, или другой электронный формат.
PDF - Формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript. Обычно используется для книг с иллюстрациями (в т.ч. схемы и математические формулы). PDF - формат, позволяющий внедрять необходимые, векторные и растровые изображения, формы и мультимедиа-вставки. http://www.atiz.ru/page.jsp?pk=node_1204555098375
Microsoft - Фирменный формат Microsoft (.lit), достаточно распространенный, в том числе из-за поддержки производителя. Существует некоторое затруднение с прочтением, поскольку формат читается в основном с помощью Microsoft Reader, официального ПО. Microsoft LIT включает ряд функций, из-за которых его считают очень похожим на Adobe PDF: закладки, аннотации и масштабирование.
PostScript и EPS - PostScript (.ps)- язык составления документов, главная функция - описание страниц, чтобы при выводе на печать они выглядели так же, как на экране. Формат EPS (Encapsulated PostScript) был создан для сохранения графики (содержащей изображения всех типов, контуры, текстовые поля и др. – в том числе и электронных книг), предназначенной для печати на «PostScript-принтерах». EPS, в котором, как правило, сохраняют конечный результат работы, это упрощенная версия формата PostScript.
ExeBook - Книга в формате ExeBook —по сути, Win32-приложение, скомпилированное с помощью специального программного обеспечения. Основной особенностью книги в формате EXE является ее максимальная приближенность к бумажному аналогу. http://www.atiz.ru/page.jsp?pk=node_1204555098375
RBS - RBS (Radix-Tools REBUS) - это защищенный формат, основанный на HTML и включающий в себя текстовый, графический, мультимедиа-контент и интерактивные составляющие. Использование в формате HTML-языка позволяет легко конвертировать файлы практически любого формата в RBS-вид с помощью специального ПО. В электронном виде в формате RBS может быть представлено множество типов бумажных изданий, как то – учебные и контрольные тесты, анкеты – результаты опросов, картографические документы, справочники, энциклопедические материалы и художественная литература.
PRC - Сжатый формат PRC – так называемый Palm-формат, использует механизм шифрования контента электронной книги, что обеспечивает защиту интеллектуальной собственности при ее продаже. Файлы с расширением PRC используются для электронных книг в формате Mobipocket Reader для чтения книг на кпк и телефонах.
3.3 Простой текст (plain text)
TXT - Файлы формата TXT имеют наименьший вес, поэтому зачастую использовались в самом начале эры электронных интернет-библиотек, у посетителей которых была предельно низкая скорость скачивания, равно как и объемы жестких дисков, а также различных носителей. Для того, чтобы скачать крупное издание, создавались ZIP-архивы, объединяющие все главы книги. Основной плюс TXT – его совместимость со всеми устройствами и практически любым программным продуктом, Хотя данный формат и не поддерживает графику и сложное форматирование.
4. Программы для чтения электронных книг
Если смотреть на чтение электронной с экрана любого устройства как на разовую операцию, то специальные программы для чтения книг совсем необязательны. Без них вполне можно прочитать любую требуемую литературу, скачанную с Интернета, прямо в окне браузера, благо Internet Explorer поставляется вместе с OS Windows, Safari – вместе с Macintosh, а Firefox и Opera доступны для скачивания в два клика.
Однако для того, чтобы читать книги с монитора, КПК и ноутбука, программы для чтения электронных книг, «вьюеры» или, как их еще называть, «читалки», будут нелишними. Все дело в настройках внешнего вида книги для удобства пользователя и его зрения. Браузер способен убрать некорректность отображения кодировки и изменить размер шрифта, однако не способен, к примеру, настроить плавную автопрокрутку для снижения нагрузки на глаза.
Есть еще текстовые редакторы типа MS Word со специальным режимом просмотра файлов электронных книг или стандартный блокнот для книг в формате Plain Text. Однако в первом случае необходимо произвести форматирования и все необходимые настройки вручную, а во втором даже этого сделать нельзя.
На заре он-лайн библиотек браузера или текстового редактора для этой операции действительно было вполне достаточно. Сейчас пользователю недостаточно просто найти нужный текст – это проблем не вызывает, благо обменников книг на данном этапе больше, чем достаточно. Читателю нужно комфортное чтение, с оптимальной для него скоростью и режимом просмотра.
Для этого и были созданы так называемые «вьюеры», большинство из которых, кстати говоря, распространяется бесплатно. Читалки призваны максимально облегчить чтения электронных книг как сэкономив время на оптимальную настройку отображения и ориентирование в файле книги (функция Закладки), так и облегчив нагрузку на зрение с помощью плавной автопрокрутки (скроллинга), подсветки и имитации настоящей бумажной книги (критично для тех, кто не любит читать с экрана, но по каким -то причинам должен это делать). Возможно, стоит ради пробы установить на ПК или КПК несколько подобных программ и облегчить себе чтение любимых и книг или нужных справочников.
4.1 Обзор по самым известным программам для чтения электронных книг
Мощная бесплатная программа на русском и английском языках для чтения электронных книг с экрана. Конвертирует произвольные тексты в безопасный для глаз, полностью настраиваемый гипертекстовый формат. Программы типа Book Reader , не имитируют книгу, а практически полностью автоматизируют чтение.
Возможности:
• Поддерживаются все кодировки мира, 119 наименований.
• В программу встроен браузер он-лайн библиотек.
• Использование голосового воспроизведения;
• Вставка изображений в файл книги (например, для справочников или комиксов);
• Множество форматов книг: TXT, DOC, HTML, RTF, FB2, CHM и проч.;
• Возможность самостоятельно разбить текст на главы;
• Имитация перелистывания страниц вибрацией или звуком шелеста страниц;
Опции отображения:
• Переносы по слогам или по словам;
• Постоянная подсветка экрана при автопрокрутке;
• Поворот текста на 90 градусов в любую сторону;
• Сохраняются стили исходного текста (жирный, подчеркивание, выделение цветом);
• Программа имеет четыре размера шрифта;
• Используется пропорциональный шрифт;
• Предварительная обработка текста убирает лишние пробелы, переносы строк, при этом разбивая текст на главы и оставляя отступы параграфов;
• Отображение текущего времени, позиции, размера главы, скорости прокрутки, оставшегося время чтения;
Навигация:
• Автоматическая гладкая прокрутка текстов – заданный темп скроллинга заметно облегчает чтение;
• Регистронезависимый поиск;
• Переход в произвольную позицию в тексте, с указанием номера строки или позицию в тексте в процентах с помощью полосы прокрутки;
• Запоминает позицию чтения для всех книг из локальной библиотеки и
• Автоматическое создание содержания книги.
• Менеджер закладок (в каждой главе сочетанием двух клавиш можно поставить до 9 закладок);
Bookseer
Программа - каталог электронных книг, представляющая из себя сборник ссылок на файлы с описаниями, которые тут же можно запустить или прочитать.
Возможности:
• Программа создаёт базу данных в одном файле (*.bon) и работает с этой базой очень быстро;
• Встроенными средствами может быть прочитан любой текстовый файл (например, TXT, RTF, HTML, DOC и т.п.), с автодекодированием из DOS в WIN, KOI в WIN…
• Записи в базе могут ссылаться на любой внутриархивный файл - читать можно прямо из архивов (ZIP, RAR и проч.), которые программа открывает без внешних распаковщиков.
Навигация:
• Мощные фильтры по разным критериям;
• Мгновенный поиск и сортировка по всем полям;
• Импорт-экспорт;
• Формирование собственной библиотеки с возможностью выбора в нужной книги и чтения с того места, где остановились в последний раз.
CoolReader
Программа для комфортного чтения книг с экрана, чтения вслух, форматирования и конвертирования текстов, главное достоинство которой - снижение нагрузки на зрение благодаря оптимальным настройкам изображения.
Возможности:
• Поддерживается большинство стандартных формат книг (HTML, RTF, DOC (MS Word), TXT, FB2 (FictionBook));
• Поддерживает распаковку книг из архивов ZIP, RAR, ARJ, HA, LZH;
• Автоматически распознает русские кодировки DOS, WIN, KOI-8, а также LATIN, UTF-8 и UNICODE;
• Сохранение аудиокниги в формате MP3 для прослушивания на MP3-плеере;
• Поддерживаемые операционные системы: Win9x /ME /NT4.0 /Win2K /XP.
Опции отображения:
• Переформатирование текста под любой размер шрифта;
• Cглаживание экранных шрифтов;
• Полностью настраиваемая палитра;
• Текстурированный фон.
Навигация:
• Распознает границы абзаца, заголовки, цитаты с использованием элементов AI;
• Плавный скроллинг.
ICE Book Reader Professional
Мощная программа для чтения книг большинства известных форматов.
Возможности:
• Поддерживаются форматы TXT, RTF, HTML, CHM, DOC, PALM books (.PDB и.PRC) и книги Microsoft Reader (.LIT),
• Распаковка книг из архивов ZIP, RAR, ARJ, LZH, HA и проч.
• Русская кодировка распознается автоматически, поддерживаются UNICODE и все другие известные кодировки;
Опции отображения:
• Два режима отображения текста - сплошным полотном и с делением на страницы;
• Автоматическое форматирование текста;
• Качественное сглаживание шрифтов, регулировка яркости, контраста и насыщенности.
Навигация:
• Три режима листания;
• Автоматическое распознание скорости чтения пользователя (для этого достаточно прочитать около двух страниц текста в режиме ручного перелистывания);
• Плавный скроллинг;
• Для каждой книги запоминается последняя позиция,
• Бесконечное количество закладок;
• Удобная библиотека, в которой присутствуют настраиваемый предпросмотр с регулируемым количеством строк с начала книги и древовидное деление произведений по авторам.
Минусы
• Настройки стиля отображения действуют только для открытой книги (следующий открытый файл книги придется так же настраивать).
Литература
1. Антопольский А.Б., Маркарова Т.С., Данилина Е.А. Правовые и технологические проблемы создания и функционирования электронных библиотек. — М.: ИНИЦ «Патент», 2008. — С. 207.
2. Управление правами в области цифровой информации: практическое руководство. пер. с англ. А.И. Земскова. — М.: Издательство Омега-Л, 2008. — 204 с.