Показать сообщение отдельно
Старый 03.08.2013, 16:02   #1
Жрец Нефтиды
Модератор
 
Аватар для Жрец Нефтиды
 
Регистрация: 15.07.2012
Адрес: Санкт-Петербург
Сообщений: 1,395
Сказал(а) спасибо: 344
Поблагодарили 539 раз(а) в 368 сообщениях
Вес репутации: 623
Жрец Нефтиды has a reputation beyond reputeЖрец Нефтиды has a reputation beyond reputeЖрец Нефтиды has a reputation beyond reputeЖрец Нефтиды has a reputation beyond reputeЖрец Нефтиды has a reputation beyond reputeЖрец Нефтиды has a reputation beyond repute
По умолчанию Конвертирование fb2 в формат Word

Многие книги в Сети сейчас раздаются в формате fb2. Не будем внутри этой темы разглагольствовать, а не проще ли какой-нибудь читалкой напрямую прочитать fb2. Задача поставлена однозначно в заголовке темы: конвертировать fb2 в doc, и точка. Причём сделать это нужно качественно. А что значит качественно – сейчас разберёмся.
Большинство читалок fb2 предоставляют возможность экспортировать fb2 в txt. Это нам и нужно: запускаем Word, открываем "Блокнотом" полученный txt файл, выделяем всё, копируем в буфер обмена, и в Word-е жмём "Правка" – "Специальная вставка" – "Неформатированный текст". При такой последовательности действий будет сохранено текущее, то есть заданное тобой, форматирование страниц.
В качестве тестового примера предлагаю вот этот скачанный из Сети файл:
http://yadi.sk/d/CE4EEPtK7X4eK
Этот файл имеет несколько тонкостей, о которые спотыкаются многие читалки. Главная тонкость в следующем. В самом начале файла находится небольшой кусок текста, который называется комментарии (аннотация, эпиграф). После него следует дата, а потом уже основной текст книги.
Я исследовал практически все читалки, до которых смог дотянуться. Сразу договоримся: в данной теме рассматриваем только работу на ПК, всякие там гнусные андроиды в упор не видим. Вот что мы имеем.
FB2 to Any converter комментарии видит, но без даты. При конвертировании в конце каждого абзаца добавляет пробел. (Полагаю, что функция отображения непечатных символов в Word-е у тебя включена.) При конвертировании в txt между абзацами вставляет пустую строку (при конвертировании в rtf не вставляет). Отбрасываем.
AlReader комментарии видит, но без даты. При экспорте в txt и в начале, и в конце каждого абзаца добавляет пробел, иногда со значком . Отбрасываем.
FBReader функции экспорта не имеет. Комментарии видит, но без даты. Функций "Выделить всё" и "Копировать" не имеет. Выделяем весь текст вручную следующим образом. Начинаем вести курсором при нажатой левой кнопке мыши от самого начала текста, потом, не отпуская кнопку мыши, жмём на клавиатуре "End" и доводим до самого конца текста. Копируем выделенный текст в буфер обмена одновременный нажатием кнопок "Ctrl" – "C". Вставляем в Word. Видим, что в конце каждого абзаца добавляет пробел. Отбрасываем.
STDU Viewer комментариев и даты не видит. При экспорте в txt в конце каждого абзаца добавляет пробел. Отбрасываем.
Ещё несколько программ типа Haali Reader, BookReader и т.п. имеют аналогичные недостатки: все они в конце каждого абзаца добавляют пробел, многие из них не видят комментариев, имеют другие заморочки. Не будем тратить время на их рассмотрение.
Переходим к двум действительно хорошим программам.
CoolReader берём с сайта http://coolreader.org/ Комментарии и дату видит! Имеет функцию экспорта в wol, но зачем это нужно? Функции экспорта в txt не имеет. Функций "Выделить всё" и "Копировать" не имеет. Копируем в Word вручную, как описано выше. Видим, что сзади каждого абзаца вставляет пробел. НЕ отбрасываем!
Ice Book Reader Professional берём с официального сайта http://www.ice-graphics.com/ICEReader/DownloadR.html Комментарии видит, причём выводит их в отдельном подокне. Дату не видит. Имеет функцию экспорта в разные форматы. Мы будем пользоваться функцией экспорта в txt, а уже оттуда скопируем в Word. Открываем файл, жмём "Библиотека", выделяем левым кликом мыши наш файл, жмём "Экспорт" – "Экспортировать книги". При каждом запуске программы опции на вылетевшей вкладке будут сбрасываться к значениям по умолчанию. От значений по умолчанию меняем следующие параметры. "Максимальная длина строки" – точка у "Не ограничена". Теперь строки не будут искусственно разбиваться. "Отступ абзаца" выставляем в 0. Теперь паразитные пробелы не будут добавляться ни в начале, ни в конце абзацев. Ни одна из исследованных мною программ так хорошо не работает! Жмём кнопку "Экспорт", и получаем txt файл. Сворачиваем Ice Book Reader Professional, но пока не выгружаем. Перекидываем текст из txt в Word. Видим, что пока комментариев нет. Но это даже к лучшему. Разворачиваем Ice Book Reader Professional. В подокне "Комментарии" видим комментарии. Внутри этого подокна работают функции "Выделить всё" и "Копировать". Копируем комментарии в Word. Поскольку при таком подходе мы явно видим, что данный кусок текста является комментариями, то можем выделить его другим шрифтом. Выгружаем Ice Book Reader Professional – вот выгружается он почему-то долго, что-то там сохраняет. Запускаем CoolReader и с его помощью копируем только дату – она обычно находится либо в самом начале книги, либо после комментариев, либо в самом конце книги. Сохраняем Word-ом doc файл.
Подведём итог. Тема fb2 выявила следующую негативную тенденцию в современном книгочтейном программировании. Программисты делают акцент на дизайн страниц, на какие-то там экзотические написания заглавных и прописных букв, и на прочую оформительскую пену, забывая при этом, что их "гениальные" читалки могут попросту пропустить кусок текста или добавить паразитные пробелы. Увы, превалирование дизайна над истинным качеством прослеживается сейчас не только в читалках. На счастье, каста жрецов всегда сумеет выудить ориентированное на качество ПО.
Если захочешь выйти со мной на связь напрямую – то: [email protected]
Жрец Нефтиды вне форума   Ответить с цитированием Вверх
Пользователь сказал cпасибо:
Lina19 (26.12.2018)