You can subscribe to this list here.
2007 |
Jan
|
Feb
|
Mar
|
Apr
|
May
|
Jun
(5) |
Jul
|
Aug
|
Sep
(1) |
Oct
|
Nov
|
Dec
|
---|---|---|---|---|---|---|---|---|---|---|---|---|
2018 |
Jan
|
Feb
|
Mar
(1) |
Apr
|
May
|
Jun
|
Jul
|
Aug
|
Sep
|
Oct
|
Nov
|
Dec
|
From: Nikolay S. <sh...@gm...> - 2018-03-10 22:02:30
|
Hi everyone! I'd like to notify everybody that I've moved fb2-perl-tools project to github: https://github.com/dhyannataraj/fb2-perl-tools/ |
From: Nikolay S. <sh...@ma...> - 2007-09-04 12:23:33
|
Стандартный преловый rtf2html не умеет русские буквы. В состав коммунивера входила его модификация, которая с русскими буквами успешно, но была привязана к коммуниверной работе с кодировками и пр. Несколько лет я конвертировал файлы закидывая из на сервер с коммунивером и обратно... Теперь таки удосужился оторвать эту зависимость, и полученную кашицу добавил в проект... Успешного использования... ;-) |
From: Serhiy S. <sto...@ma...> - 2007-06-12 21:59:02
|
Добавились новые опции: -d файл -- читать из файла список слов, состоящих из букв, принадлежащих, как латинскому, так и кириллическому алфавитам. В каталог dict я выложил списки таких слов для некоторых языков. Эту опцию можно указывать повторно для загрузки нескольких словарей. Файлы reserved_cyr и reserved_lat не читаются больше автоматически, их можно подключить этой опцией. -o файл -- писать лог в файл. Туда попадают как восстановленные слова, так и вызывающие большое сомнение (к сведению корректора). -T -- обрабатывать входные файлы не как FB2, а как простой текст в UTF-8. Кроме того усовершенствован алгоритм обработки, добавлена обработка ещё нескольких типов ошибок. Рекомендую использовать русский, украинский, английский, немецкий, французский и испанский словари. Это языки, наиболее часто используемые в существующих книгах в FB2. Если взять мало -- возможна неправильная корректировка, если взять слишком много -- увеличивается число слов, имеющихся как в латинском, так и в кириллическом написании. |
From: Victor W. <vi...@wa...> - 2007-06-04 15:26:17
|
On 2007.06.04 at 18:42:41 +0400, Nikolay Shaplov wrote: > > the second issuse: It would be good to lift changes from rtf2html into > cpan rtf2html module, and it have been changed since the time when the > fork were made... Oh, its maintainer was found? When we've patched rtf2html, we tried to contact that maintainer, but in vain. > To solve these two issues I will need more information about rtf format > and some amount of spare time... :-/ RTF format is documented and documentation can be found somewhere on the microsoft site. I have somewhat oldish documentation, converted to HTML on http://wagner.pp.ru/docs/rtf15.html > It is also possible to write rtf2fb2 and doc2fb2 because as far as I > know there is a perl frontend to your catdoc ;-) This seems not to make sense. catdoc intentionally leaves out all formatting and doesn't deal with any metainformation (although I don't know any Word user which fills metainformation in Word format). This is why Communiware rtf import code based on perl rtf2html, and not on catdoc. (there were no probles with GPL license of catdoc, because GPL doesn't restrict calling GPL program via open "|" and I was always able to relicense it for company I work for). Moreover, doc format is going to die. New versions of Word use OpenXML .docx format. May be better to think of odt2fb? Good ODT2fb tool would solve problem of converting word documents - open them with OpenOffice, fix formatting (word documents ALWAYS need this), save in the native format and convert. > ------------------------------------------------------------------------- > This SF.net email is sponsored by DB2 Express > Download DB2 Express C - the FREE version of DB2 express and take > control of your XML. No limits. Just data. Click to get it now. > http://sourceforge.net/powerbar/db2/ > _______________________________________________ > Fb2-perl-tools-english mailing list > Fb2...@li... > https://lists.sourceforge.net/lists/listinfo/fb2-perl-tools-english |
From: Nikolay S. <N...@sh...> - 2007-06-04 14:42:44
|
On Mon, 4 Jun 2007 18:23:35 +0400 Victor Wagner <vi...@wa...> wrote: > On 2007.06.04 at 18:11:23 +0400, Nikolay Shaplov wrote: > > > Mr Dmitry Gribov (GribUser) kindly agreed to open his scripts from > > http://www.gribuser.ru/xml/fictionbook/2.0/software/ under BSDLike > > License... > > > > For more info see forum page > > http://www.fictionbook.org/forum/viewtopic.php?t=3586 (Sorry Russian > > only) or attached file forum_topic.html (offline copy of that forum > > page) > > ИТОГО: Это здорово, но это не все что нужно. Я например знаю > > откуда можно выдрать rtf2html который пропатчен для работы с > > русскими rtf'ами. Из него в перспективе можно сделать прямой > > конвертор в fb2 . > > Concerning rtf2html - you know, there is heavily patched version of > rtf2html in the Communiware sources. It even support image extraction > > It can be lifted up from there > and used in this project. As far as I remember, Communiware is > distributed under Artistic license. Yeah... There I've been speaking about Communiware's rtf2html. When I create fb2 book I usually use it to convert rtf to html... So it would be good to lift it up here... But there are some other issue with rtf2html. First of all it does not understand headers from openoffice... All headers transforms into plain text...This needs to be fixed once... the second issuse: It would be good to lift changes from rtf2html into cpan rtf2html module, and it have been changed since the time when the fork were made... To solve these two issues I will need more information about rtf format and some amount of spare time... :-/ It is also possible to write rtf2fb2 and doc2fb2 because as far as I know there is a perl frontend to your catdoc ;-) |
From: Victor W. <vi...@wa...> - 2007-06-04 14:23:41
|
On 2007.06.04 at 18:11:23 +0400, Nikolay Shaplov wrote: > Mr Dmitry Gribov (GribUser) kindly agreed to open his scripts from > http://www.gribuser.ru/xml/fictionbook/2.0/software/ under BSDLike > License... > > For more info see forum page > http://www.fictionbook.org/forum/viewtopic.php?t=3586 (Sorry Russian > only) or attached file forum_topic.html (offline copy of that forum > page) > ИТОГО: Это здорово, но это не все что нужно. Я например знаю откуда > можно выдрать rtf2html который пропатчен для работы с русскими > rtf'ами. Из него в перспективе можно сделать прямой конвертор в fb2 . Concerning rtf2html - you know, there is heavily patched version of rtf2html in the Communiware sources. It even support image extraction It can be lifted up from there and used in this project. As far as I remember, Communiware is distributed under Artistic license. |
From: Nikolay S. <sh...@ma...> - 2007-06-04 14:11:34
|
Mr Dmitry Gribov (GribUser) kindly agreed to open his scripts from http://www.gribuser.ru/xml/fictionbook/2.0/software/ under BSDLike License... For more info see forum page http://www.fictionbook.org/forum/viewtopic.php?t=3586 (Sorry Russian only) or attached file forum_topic.html (offline copy of that forum page) |