From: Serhiy S. <sto...@ma...> - 2007-06-12 21:59:02
|
Добавились новые опции: -d файл -- читать из файла список слов, состоящих из букв, принадлежащих, как латинскому, так и кириллическому алфавитам. В каталог dict я выложил списки таких слов для некоторых языков. Эту опцию можно указывать повторно для загрузки нескольких словарей. Файлы reserved_cyr и reserved_lat не читаются больше автоматически, их можно подключить этой опцией. -o файл -- писать лог в файл. Туда попадают как восстановленные слова, так и вызывающие большое сомнение (к сведению корректора). -T -- обрабатывать входные файлы не как FB2, а как простой текст в UTF-8. Кроме того усовершенствован алгоритм обработки, добавлена обработка ещё нескольких типов ошибок. Рекомендую использовать русский, украинский, английский, немецкий, французский и испанский словари. Это языки, наиболее часто используемые в существующих книгах в FB2. Если взять мало -- возможна неправильная корректировка, если взять слишком много -- увеличивается число слов, имеющихся как в латинском, так и в кириллическом написании. |