Назначение

Кроссплатформенный конвертер OOoFBTools разработан на кодовой базе ExportToFB21 и предназначен для конвертации документов из форматов, поддерживаемых OpenOffice.org Writer в популярный формат FictionBook (fb2) версий 2.1 и 2.2
Т.о. входные форматы документов для ExportToFB21 следующие: .doc, .dot, .rtf, .txt, .html, .htm, .oth, .odt, .ott, .stw, .sdw, .xml, .vor, .psw, .wps, .wpd, .fodt, .sxw, Microsoft Word 2003XML .xml, и другие, с которыми работает OpenOffice.org Writer.
Конвертер работает на тех платформах, где работает OpenOffice.org Writer, т.е. MS Windows 98/2000/XP/Vista, MacOS X, GNU/Linux, FreeBSD и т.д.
Конвертер не использует DOM технологию – задействован свой парсинг документов и печать в текстовый файл информации, собранной после анализа.
Если документ отформатирован стилями (см. п.3.) правильно (см. п.5.), то после его конвертации практически не требуется дальнейшая правка (за редким исключением, о чем см. п.7.) в редакторах fb2 формата! После проведения десятков тестов с документами различной структурой, полученные fb2 книги у меня всегда проходили валидацию.
Что реализовано
Конвертер писался для конвертации документов именно в формат fb2.1. Поэтому в нем реализованы почти все основные возможности этого формата.
Экспорт Description
- <title-info> - весь
- <document-info> - весь
- <publish-info> - весь
- <custom-info> - весь
- Аннотация к документу
- История документа
Экспорт основных элементов структуры документа
- Экспорт структуры текста (слов и абзацев)
- Экспорт сносок и гиперссылок (на web странички)
- Экспорт стилей абзацев, аннотаций, эпиграфов, цитат, стихов, заголовков, подзаголовков (т.е. теги <strong>, <emphasis>, <strikethrough>, <sub>, <sup>, <code>)
- Экспорт стилей авторов цитат, авторов поем, авторов эпиграфов. Для поэм реализованы заголовки - <title>
- Экспорта стилей текста сносок (т.е. все курсивы, полужирные начертания, верхние и нижние индексы и т.д. отображаются и в тексте сносок)
- Для Поэм (Стихов) реализован заголовок <title>
- Реализована возможность использования Аннотации на любом уровне (части книги, глав...)
- Экспорт картинок и картинок-буквиц
- Число уровней вложений <section> - 10. При желании его можно увеличить хоть до бесконечности, внеся некоторые изменения в код конвертера (подсказка: ищите строки проверки на “Заголовок 1”, “ Заголовок 2” и т.д. и дополняйте эти строки до нужного вам числа уровней. Всего процедур таких 3-4). Тогда нужно будет создать и соответствующие стили для новых уровней
- Экспорт простых и сложных Таблиц с экспортом заголовков, выравниванием текста заголовков и ячеек, а так же форматирования стилями (полужирный, курсив, верхний/нижний индексы и т.д.), гиперссылок и переходов из строк таблицы в другие места файла. Работает экспорт сносок для строк ячеек таблиц. Экспорт нумерованных списков-абзацев, маркированных списков, а также списков с маркерами-картинки в ячейке. Сделан экспорт Картинок из ячеек Таблиц
- Самая главная фишка конвертера при работе с <section> - корректный экспорт самой разной структуры документа, без лишних, или наоборот, недостающих <section> или </section>! Подробности см. ниже. Так что не нужно будет мучиться, отлавливая, где чего не хватает, чтобы документ fb2 прошел валидацию. Конечно, все это - при условии правильного задания стилями уровней заголовкам!
Дополнительные возможности
- Реализовано 10 уровней вложения заголовков (<section><title>Заголовок</title></section>). Но, алгоритм построен таким образом, что путем внесения в 3 процедуры нескольких строк кода, число вложений - уровней можно довести хоть до бесконечности! Мне больше 10 никогда не требовалось.
- Реализована обработка «проблемных» символов (&, <, >), и замена их в fb2 файле на & < и > соответственно. Иначе книга не проходит валидацию! Эта опция хороша для экспорта технической литературы. Для другого вида книг, если вы уверены, что этих символов там нет, опцию лучше отключить – скорость экспорта увеличится в несколько раз!
- Возможность вставки перед сноской пробела (опция в Настройках).
- Возможность выбора стиля сносок: x, [x], [ x ], {x}, { x }, (x), ( x ) (опция в Настройках).
- Возможность собирать авторов стихов, цитат или эпиграфа в одну строку, или оставить авторов одного под другим (опции в Настройках).
- Возможность собирать Subtitle в одну строку, или оставить подзаголовки один под другим (опция в Настройках).
- Возможность удаления пустых строк (опция в Настройках).
- Экспорт Текстовых Врезок как просто текст, как цитат, как таблиц или как структуру (опция в Настройках). Экспорт всех стилей (и символьных и абзацевых) и нумерованных списков во Врезках. Экспорт Таблиц и Картинок из Текстовых Врезок. Распознается привязка Картинок только как «К Абзацу», «К символу» и «Как символ». Другие – игнорируются и Картинка не будет экспортирован! Вложенные Врезки во Врезки игнорируются!
- Экспорт Нумерованных и Маркированных Списков (в том числе и с Маркеров-Картинок) из Текста документа и Текстовых Врезок.
- Экспорт текстовых полей, вставленных из меню “Вставка” → ”Поля”.
- Экспорт ссылок внутри документа (переход из любого места документа в любое место документа, переход из любого места документа на текст любой сноски, переход из текста одной сноски на текст другой сноски, переход с текста сноски на любое место документа) (опция в Настройках)
- Сохранение профиля пользователя и его автоматическая загрузка для полей Автора fb2-документа, OCR и истории fb2-документа.
- Сохранение и загрузка профиля для Автора Книги и его жанра.
- Сохранение и загрузка профиля для Издательства.
- Автоматическое заполнение полей формы конвертера «Аннотация на Книгу», всех полей группы «Бумажная книга (Publish-Info)» из текста документа с помощью т.н. «Служебных стилей»
- Есть Корректор Текста – замена кавычек «елочкой», удаление лишних пробелов и многое другое…
- Виртуальные клавиатуры.
- Валидатор fb2-файлов.
- Локализация всего пакета на Русский и Английский языки.
- Экспорт Нумерованных и Маркированных Списков (в том числе и с Маркеров-Картинок) из Текста Сносок (Примечаний).
Что пока не реализовано
- Для таблиц не реализован экспорт перехода из документа на определенный абзац таблиц, а так же экспорт стихов, цитат, аннотаций, эпиграфов, подзаголовков и заголовков (Уровней) из таблиц. Не знаю – надо ли это?
- Для Текстовых Врезок не сделан экспорт перехода из документа на определенный абзац Врезки.
- Экспорт обложек из Врезок (расположены выше Названия Книги – стиль Book Title).
Лицензионное соглашение
Конвертер создается и распространяется под лицензией GPL. Т.е. его можно свободно использовать, распространять, на базе его кода создавать свои проекты, тоже под лицензией GPLv3.