Конвертирование fb2 в формат Word
Многие книги в Сети сейчас раздаются в формате fb2. Не будем внутри этой темы разглагольствовать, а не проще ли какой-нибудь читалкой напрямую прочитать fb2. Задача поставлена однозначно в заголовке темы: конвертировать fb2 в doc, и точка. Причём сделать это нужно качественно. А что значит качественно – сейчас разберёмся.
Большинство читалок fb2 предоставляют возможность экспортировать fb2 в txt. Это нам и нужно: запускаем Word, открываем "Блокнотом" полученный txt файл, выделяем всё, копируем в буфер обмена, и в Word-е жмём "Правка" – "Специальная вставка" – "Неформатированный текст". При такой последовательности действий будет сохранено текущее, то есть заданное тобой, форматирование страниц. В качестве тестового примера предлагаю вот этот скачанный из Сети файл: http://yadi.sk/d/CE4EEPtK7X4eK Этот файл имеет несколько тонкостей, о которые спотыкаются многие читалки. Главная тонкость в следующем. В самом начале файла находится небольшой кусок текста, который называется комментарии (аннотация, эпиграф). После него следует дата, а потом уже основной текст книги. Я исследовал практически все читалки, до которых смог дотянуться. Сразу договоримся: в данной теме рассматриваем только работу на ПК, всякие там гнусные андроиды в упор не видим. Вот что мы имеем. FB2 to Any converter комментарии видит, но без даты. При конвертировании в конце каждого абзаца добавляет пробел. (Полагаю, что функция отображения непечатных символов в Word-е у тебя включена.) При конвертировании в txt между абзацами вставляет пустую строку (при конвертировании в rtf не вставляет). Отбрасываем. AlReader комментарии видит, но без даты. При экспорте в txt и в начале, и в конце каждого абзаца добавляет пробел, иногда со значком . Отбрасываем. FBReader функции экспорта не имеет. Комментарии видит, но без даты. Функций "Выделить всё" и "Копировать" не имеет. Выделяем весь текст вручную следующим образом. Начинаем вести курсором при нажатой левой кнопке мыши от самого начала текста, потом, не отпуская кнопку мыши, жмём на клавиатуре "End" и доводим до самого конца текста. Копируем выделенный текст в буфер обмена одновременный нажатием кнопок "Ctrl" – "C". Вставляем в Word. Видим, что в конце каждого абзаца добавляет пробел. Отбрасываем. STDU Viewer комментариев и даты не видит. При экспорте в txt в конце каждого абзаца добавляет пробел. Отбрасываем. Ещё несколько программ типа Haali Reader, BookReader и т.п. имеют аналогичные недостатки: все они в конце каждого абзаца добавляют пробел, многие из них не видят комментариев, имеют другие заморочки. Не будем тратить время на их рассмотрение. Переходим к двум действительно хорошим программам. CoolReader берём с сайта http://coolreader.org/ Комментарии и дату видит! Имеет функцию экспорта в wol, но зачем это нужно? Функции экспорта в txt не имеет. Функций "Выделить всё" и "Копировать" не имеет. Копируем в Word вручную, как описано выше. Видим, что сзади каждого абзаца вставляет пробел. НЕ отбрасываем! Ice Book Reader Professional берём с официального сайта http://www.ice-graphics.com/ICEReader/DownloadR.html Комментарии видит, причём выводит их в отдельном подокне. Дату не видит. Имеет функцию экспорта в разные форматы. Мы будем пользоваться функцией экспорта в txt, а уже оттуда скопируем в Word. Открываем файл, жмём "Библиотека", выделяем левым кликом мыши наш файл, жмём "Экспорт" – "Экспортировать книги". При каждом запуске программы опции на вылетевшей вкладке будут сбрасываться к значениям по умолчанию. От значений по умолчанию меняем следующие параметры. "Максимальная длина строки" – точка у "Не ограничена". Теперь строки не будут искусственно разбиваться. "Отступ абзаца" выставляем в 0. Теперь паразитные пробелы не будут добавляться ни в начале, ни в конце абзацев. Ни одна из исследованных мною программ так хорошо не работает! Жмём кнопку "Экспорт", и получаем txt файл. Сворачиваем Ice Book Reader Professional, но пока не выгружаем. Перекидываем текст из txt в Word. Видим, что пока комментариев нет. Но это даже к лучшему. Разворачиваем Ice Book Reader Professional. В подокне "Комментарии" видим комментарии. Внутри этого подокна работают функции "Выделить всё" и "Копировать". Копируем комментарии в Word. Поскольку при таком подходе мы явно видим, что данный кусок текста является комментариями, то можем выделить его другим шрифтом. Выгружаем Ice Book Reader Professional – вот выгружается он почему-то долго, что-то там сохраняет. Запускаем CoolReader и с его помощью копируем только дату – она обычно находится либо в самом начале книги, либо после комментариев, либо в самом конце книги. Сохраняем Word-ом doc файл. Подведём итог. Тема fb2 выявила следующую негативную тенденцию в современном книгочтейном программировании. Программисты делают акцент на дизайн страниц, на какие-то там экзотические написания заглавных и прописных букв, и на прочую оформительскую пену, забывая при этом, что их "гениальные" читалки могут попросту пропустить кусок текста или добавить паразитные пробелы. Увы, превалирование дизайна над истинным качеством прослеживается сейчас не только в читалках. На счастье, каста жрецов всегда сумеет выудить ориентированное на качество ПО. Если захочешь выйти со мной на связь напрямую – то: [email protected] |
Вложений: 1
Полное собрание сочинений Марины Цветаевой в формате fb2 лежит здесь: http://rutracker.org/forum/viewtopic.php?t=2345269
Описанной в основной статье методикой я перевёл его в формат doc. Попутно убедился, что после нажатия кнопки "Экспорт" ещё некоторые опции лучше изменить в значения, отличные от значений по умолчанию. Как именно заполнять вкладку – увидишь на прикреплённой к этому посту фотографии. Именно с такими настройками я и обработал все fb2 файлы из данной раздачи М. Цветаевой. Полное собрание сочинений Марины Цветаевой в формате doc выкладываю здесь: http://yadi.sk/d/uweCl760J4JTF Согласись, читать в формате doc гораздо лучше, чем в отстойном fb2 или в фотографическом pdf. Все почитатели и почитательницы творчества Цветаевой – не забываем восхвалять древнеегипетских жрецов! |
Жрец, а мог бы ты обновить ссылки на Яндексе? Волшебное слово - Пожалуйста...
|
Спасибо, Дмитрий, что напомнил: тут у меня нет кнопки "Правка", не могу исправить.
Если кому нужно -- пишем в Л.С. |
Как же вы бедненькие на ХР мучаетесь, даже текстовые файлы вам приходится конвертировать. А вот так на десятке без всяких лишних телодвижений, даже можно опцию включить "листать страницы как в настоящей книге"
[Для просмотра данной ссылки нужно зарегистрироваться] |
Цитата:
А если серьёзно -- есть с десяток читалок с самым разным интерфейсом, не привязанных к ОС. Эх, Prtava, ты не вычислил, чем меня реально можно зацепить. Есть такая программа -- Стеллариум. Симулятор планетария. На 32' мониторе штука космическая, с показом различных космических явлений. Так вот последние версии Стеллариума на XP уже не фурычат. Так что переход на 10 (11?) -- вопрос лишь инерции. |
Цитата:
[Для просмотра данной ссылки нужно зарегистрироваться] Цитата:
|
Так есть же специальные сервисы для конвертирования, и не надо ничего скачивать.
|
Часовой пояс GMT +1, время: 20:55. |
Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot