fb2-perl-tools-svn Mailing List for Fb2 Perl Tools

SourceForge Headquarters 1320 Columbia Street Suite 310 San Diego, CA 92101 +1 (858) 422-6466

Revision: 71
          http://fb2-perl-tools.svn.sourceforge.net/fb2-perl-tools/?rev=71&view=rev
Author:   storchaka
Date:     2011-12-16 22:02:28 +0000 (Fri, 16 Dec 2011)
Log Message:
-----------
Porting to Python 3. Minimal supporting version is Python 2.6.

Modified Paths:
--------------
    trunk/fb2-python-tools/fb2clean.py
    trunk/fb2-python-tools/fb2fixtr.py
    trunk/fb2-python-tools/fb2format.py
    trunk/fb2-python-tools/fb2maketree.py
    trunk/fb2-python-tools/progress_display.py

Modified: trunk/fb2-python-tools/fb2clean.py
===================================================================

--- trunk/fb2-python-tools/fb2clean.py	2011-12-10 21:19:05 UTC (rev 70)
+++ trunk/fb2-python-tools/fb2clean.py	2011-12-16 22:02:28 UTC (rev 71)
@@ -1,5 +1,5 @@
 #!/usr/bin/python
-# -*- coding: UTF-8 -*-
+# -*- coding: utf-8 -*-
 
 '''\
 Usage:
@@ -14,91 +14,92 @@
 
 File name '-' means standard input.
 '''
+from __future__ import division, print_function, unicode_literals
 __author__ = 'Serhiy Storchaka <sto...@us...>'
 __version__ = '0.2'
 __all__ = []
 
 import re
-import sys, getopt, os, os.path, xml.dom.minidom, codecs
+import sys, getopt, os, os.path, xml.dom.minidom, codecs, io
 
-fix_h2_re = re.compile( ur'<h2 xmlns="">Taken: \w*, 1</h2>', re.UNICODE )
-# fix_style_re = re.compile( ur'(<style name="\w*">)|(</style>)' )
-empty_style_re = re.compile( u'|'.join(
-	ur'<%s/>|</%s><%s>|<%s></%s>' % (tag, tag, tag, tag, tag)
+fix_h2_re = re.compile( r'<h2 xmlns="">Taken: \w*, 1</h2>', re.UNICODE )
+# fix_style_re = re.compile( r'(<style name="\w*">)|(</style>)' )
+empty_style_re = re.compile( '|'.join(
+	r'<%s/>|</%s><%s>|<%s></%s>' % (tag, tag, tag, tag, tag)
 	for tag in ('emphasis', 'strong', 'sub', 'sup')
-	) + ur'<style [^>]*/>|<style [^>]*></style>', re.DOTALL )
-start_emphasis = ur'<emphasis>|<strong>|<style [^>]*>|<a [^>]*>'
-end_emphasis = ur'</emphasis>|</strong>|</style>|</a>'
-fix_emphasis1_re = re.compile( ur'(\s+)(%s)' % end_emphasis, re.UNICODE )
-fix_emphasis2_re = re.compile( ur'(%s)(?=\w)' % end_emphasis, re.UNICODE )
-fix_emphasis3_re = re.compile( ur'([ \u00A0]*[\u2013\u2014-]+)(%s)' % end_emphasis, re.UNICODE )
-mdash_re = re.compile( ur'(?:[ \u00A0]|(?<=[,.?!:"\u2026]))[\u2013\u2014-]+(?:[ \u00A0]|(?=\w)|(?=<[^/]))', re.UNICODE )
-end_mdash_re = re.compile( ur'[ \u00A0][\u2013\u2014-]+[ \u00A0](?:(?=</p>)|(?=</v>)|(?=</subtitle>))' )
-dialog_re = re.compile( ur'(<(?:p|v|subtitle)\b[^>]*>(?:\s*(?:%s))*)\s*[\u2013\u2014-]+\s*' % start_emphasis, re.UNICODE )
-# fix_emphase_re = re.compile( ur'[ \u00A0][\u2013\u2014-][ \u00A0](</emphase>)' )
-empty_line_re = re.compile( ur'<empty-line/>\s*(?=<)(?!<p\b)|(?<=>)(?<!</p>)\s*<empty-line/>', re.UNICODE )
-stars_re = re.compile( u'|'.join(
-	ur'<%s(?: id="[^">]+")?>(?:%s)* ?(?:[*](?: [*]){2,}|[*]{3,}|x x x) ?(?:%s)*</%s>' % (start, start_emphasis, end_emphasis, end)
-	for start, end in ((u'p', u'p'), (u'subtitle', u'subtitle'), (ur'/section>\s*<section>\s*<title><p', ur'p>\s*</title'))
+	) + r'<style [^>]*/>|<style [^>]*></style>', re.DOTALL )
+start_emphasis = r'<emphasis>|<strong>|<style [^>]*>|<a [^>]*>'
+end_emphasis = r'</emphasis>|</strong>|</style>|</a>'
+fix_emphasis1_re = re.compile( r'(\s+)(%s)' % end_emphasis, re.UNICODE )
+fix_emphasis2_re = re.compile( r'(%s)(?=\w)' % end_emphasis, re.UNICODE )
+fix_emphasis3_re = re.compile( r'([ \u00A0]*[\u2013\u2014-]+)(%s)' % end_emphasis, re.UNICODE )
+mdash_re = re.compile( r'(?:[ \u00A0]|(?<=[,.?!:"\u2026]))[\u2013\u2014-]+(?:[ \u00A0]|(?=\w)|(?=<[^/]))', re.UNICODE )
+end_mdash_re = re.compile( r'[ \u00A0][\u2013\u2014-]+[ \u00A0](?:(?=</p>)|(?=</v>)|(?=</subtitle>))' )
+dialog_re = re.compile( r'(<(?:p|v|subtitle)\b[^>]*>(?:\s*(?:%s))*)\s*[\u2013\u2014-]+\s*' % start_emphasis, re.UNICODE )
+# fix_emphase_re = re.compile( r'[ \u00A0][\u2013\u2014-][ \u00A0](</emphase>)' )
+empty_line_re = re.compile( r'<empty-line/>\s*(?=<)(?!<p\b)|(?<=>)(?<!</p>)\s*<empty-line/>', re.UNICODE )
+stars_re = re.compile( '|'.join(
+	r'<%s(?: id="[^">]+")?>(?:%s)* ?(?:[*](?: [*]){2,}|[*]{3,}|x x x) ?(?:%s)*</%s>' % (start, start_emphasis, end_emphasis, end)
+	for start, end in (('p', 'p'), ('subtitle', 'subtitle'), (r'/section>\s*<section>\s*<title><p', r'p>\s*</title'))
 	), re.UNICODE|re.DOTALL )
 
 
-# defis_str1 = [ur'(?<=\b%s)[\u2013\u2014-][ \u00A0]' % pre for pre in
-# 	(u'по', u'в', u'во', u'из', u'кое')]
-# defis_str2 = [ur'([\u2013\u2014-][ \u00A0]|[ \u00A0][\u2013\u2014-])(?=%s\b)' % post for post in
-# 	(u'то', u'нибудь', u'таки', u'либо', u'никак', u'никак(?:ой|им|ом|ая|ую|ое)', u'никак(?:ого|ому)', u'стрит', u'летн(?:ий|им|ем|яя|юю|ей|ее|ии|их)', u'летн(?:его|ему|ими)')]
-# # 	u'й', u'х', u'го', u'е', u'м', u'я', u'мм', u'ка', u'ю', 
-# fix_defis_re = re.compile( u'|'.join( defis_str1 + defis_str2 ), re.UNICODE|re.IGNORECASE )
+# defis_str1 = [r'(?<=\b%s)[\u2013\u2014-][ \u00A0]' % pre for pre in
+# 	('по', 'в', 'во', 'из', 'кое')]
+# defis_str2 = [r'([\u2013\u2014-][ \u00A0]|[ \u00A0][\u2013\u2014-])(?=%s\b)' % post for post in
+# 	('то', 'нибудь', 'таки', 'либо', 'никак', 'никак(?:ой|им|ом|ая|ую|ое)', 'никак(?:ого|ому)', 'стрит', 'летн(?:ий|им|ем|яя|юю|ей|ее|ии|их)', 'летн(?:его|ему|ими)')]
+# # 	'й', 'х', 'го', 'е', 'м', 'я', 'мм', 'ка', 'ю',
+# fix_defis_re = re.compile( '|'.join( defis_str1 + defis_str2 ), re.UNICODE|re.IGNORECASE )
 
-ndash_re = re.compile( ur'(?<=[0-9])[\u2013\u2014-][ \u00A0]?(?=[0-9])' )
-fix_date_re = re.compile( ur'(?<=value=")(?P<y>\d+)\u2013(?P<m>\d+)\u2013(?P<d>\d+)(?=")' )
-fix_date2_re = re.compile( ur'(?P<y>\d+)\u2013(?P<m>\d+)\u2013(?P<d>\d+)(?=</date>)' )
+ndash_re = re.compile( r'(?<=[0-9])[\u2013\u2014-][ \u00A0]?(?=[0-9])' )
+fix_date_re = re.compile( r'(?<=value=")(?P<y>\d+)\u2013(?P<m>\d+)\u2013(?P<d>\d+)(?=")' )
+fix_date2_re = re.compile( r'(?P<y>\d+)\u2013(?P<m>\d+)\u2013(?P<d>\d+)(?=</date>)' )
 
 def fix_ndash( data ):
-	data = ndash_re.sub( u'\u2013', data )
-	data = fix_date_re.sub( ur'\g<y>-\g<m>-\g<d>', data, 2 )
-	data = fix_date2_re.sub( ur'\g<y>-\g<m>-\g<d>', data, 2 )
+	data = ndash_re.sub( '\u2013', data )
+	data = fix_date_re.sub( r'\g<y>-\g<m>-\g<d>', data, 2 )
+	data = fix_date2_re.sub( r'\g<y>-\g<m>-\g<d>', data, 2 )
 	for tag in ('date', 'date', 'id', 'isbn', 'src-ocr'):
 		start = data.find( '<%s>' % tag )
 		if start >= 0:
 			end = data.find( '</%s>' % tag, start )
-			if end >= 0 and data.find( u'\u2013', start, end ) >= 0:
-				data = data[:start] + data[start:end].replace( u'\u2013', u'-' ) + data[end:]
+			if end >= 0 and data.find( '\u2013', start, end ) >= 0:
+				data = data[:start] + data[start:end].replace( '\u2013', '-' ) + data[end:]
 
 	return data
 
 def convert( data ):
 	# Remove <h2> elements
-	data = fix_h2_re.sub( u'', data )
-# 	data = fix_style_re.sub( u'', data )
+	data = fix_h2_re.sub( '', data )
+# 	data = fix_style_re.sub( '', data )
 	# Remove empty inline elements
-	data = empty_style_re.sub( u'', data )
+	data = empty_style_re.sub( '', data )
 	# Move spaces out emphasis
-	data = fix_emphasis1_re.sub( ur'\2\1', data )
-	data = fix_emphasis2_re.sub( ur'\1 ', data )
-	data = fix_emphasis3_re.sub( ur'\2\1', data )
+	data = fix_emphasis1_re.sub( r'\2\1', data )
+	data = fix_emphasis2_re.sub( r'\1 ', data )
+	data = fix_emphasis3_re.sub( r'\2\1', data )
 	# Again remove empty inline elements
-	data = empty_style_re.sub( u'', data )
+	data = empty_style_re.sub( '', data )
 	# Correct dash in text
-	data = mdash_re.sub( u'\u00A0\u2014 ', data )
-# 	data = data.replace( ur'\u00A0\u2014 \u2013 ', u'\u00A0\u2014 ' )
-# 	data = fix_emphase_re.sub( ur'\1\u00A0\u2014', data )
+	data = mdash_re.sub( '\u00A0\u2014 ', data )
+# 	data = data.replace( r'\u00A0\u2014 \u2013 ', '\u00A0\u2014 ' )
+# 	data = fix_emphase_re.sub( r'\1\u00A0\u2014', data )
 	# Correct dash at end of paragraph
-	data = end_mdash_re.sub( u'\u00A0\u2014', data )
+	data = end_mdash_re.sub( '\u00A0\u2014', data )
 	# Correct defis
-# 	data = fix_defis_re.sub( u'-', data )
+# 	data = fix_defis_re.sub( '-', data )
 	# Correct short dash
 	data = fix_ndash( data )
 	# Correct dash at start of paragraph
-	data = dialog_re.sub( u'\\1\u2014\u00A0', data )
+	data = dialog_re.sub( '\\1\u2014\u00A0', data )
 	# Correct ellipsis
-	data = data.replace( u'...', u'\u2026' )
+	data = data.replace( '...', '\u2026' )
 	# Empty line must be only between paragraphs
-	data = empty_line_re.sub( u'', data )
+	data = empty_line_re.sub( '', data )
 	# Unificate stars separator
-	data = stars_re.sub( u'<subtitle>* * *</subtitle>', data )
+	data = stars_re.sub( '<subtitle>* * *</subtitle>', data )
 	# Empty line must be only between paragraphs
-	data = empty_line_re.sub( u'', data )
+	data = empty_line_re.sub( '', data )
 	return data
 
 def writexml( doc, writer, encoding ):
@@ -111,12 +112,12 @@
 	try:
 		opts, args = getopt.getopt( sys.argv[1:], '@:hkqtvV',
 			['backup', 'help', 'progress', 'version'] )
-	except getopt.GetoptError, err:
-		print >>sys.stderr, 'Error:', err
+	except getopt.GetoptError as err:
+		print( 'Error:', err, file = sys.stderr )
 		sys.exit( 2 )
 
 	keepBackup = False
-	backupSuffix = '.bak'
+	backupSuffix = str( '.bak' )
 	verbose = False
 
 	for option, value in opts:
@@ -124,13 +125,13 @@
 			sys.stdout.write( __doc__ )
 			sys.exit( 0 )
 		elif option in ('-V', '--version'):
-			print __version__
+			print( __version__ )
 			sys.exit( 0 )
 		elif option == '-@':
 			if value == '-':
-				args.extend( line.rstrip( '\n' ) for line in sys.stdin )
+				args.extend( line.rstrip( str( '\n' ) ) for line in sys.stdin )
 			else:
-				args.extend( line.rstrip( '\n' ) for line in open( value ) )
+				args.extend( line.rstrip( str( '\n' ) ) for line in open( value ) )
 		elif option in ('-k', '--backup'):
 			keepBackup = True
 		elif option in ('-v', '--progress'):
@@ -143,25 +144,29 @@
 	global filename
 	for filename in args:
 		try:
-			if filename == '-':
-				doc = xml.dom.minidom.parse( sys.stdin )
+			if filename == str( '-' ):
+				if sys.version_info[0] >= 3:
+					f = sys.stdin.buffer.raw
+				else:
+					f = sys.stdin
+				doc = xml.dom.minidom.parse( f )
 			else:
-				doc = xml.dom.minidom.parse( open( filename, 'r' ) )
-			encoding = doc.encoding or 'UTF-8'
-			data0 = doc.toxml( 'UTF-8' ).decode( 'UTF-8' )
+				doc = xml.dom.minidom.parse( open( filename, 'rb' ) )
+			encoding = doc.encoding or str( 'utf-8' )
+			data0 = doc.toxml( 'utf-8' ).decode( 'utf-8' )
 			data = convert( data0 )
 			if data != data0:
-				doc = xml.dom.minidom.parseString( data.encode( 'UTF-8' ) )
-				if filename == '-':
+				doc = xml.dom.minidom.parse( io.BytesIO( data.encode( 'utf-8' ) ) )
+				if filename == str( '-' ):
 					writexml( doc, sys.stdout, encoding )
 				else:
-					tmpfilename = filename + '.tmp'
-					writexml( doc, open( tmpfilename, 'w' ), encoding )
+					tmpfilename = filename + str( '.tmp' )
+					writexml( doc, open( tmpfilename, 'wb' ), encoding )
 					if keepBackup:
 						os.rename( filename, filename + backupSuffix )
 					os.rename( tmpfilename, filename )
 		except (KeyboardInterrupt, SystemExit):
 			raise
-		except Exception, err:
-			print >>sys.stderr, 'Error processing "%s":' % filename
-			print >>sys.stderr, err
+		except Exception as err:
+			print( str( 'Error processing "%s":' ) % filename, file = sys.stderr )
+			print( err, file = sys.stderr )

Modified: trunk/fb2-python-tools/fb2fixtr.py
===================================================================
--- trunk/fb2-python-tools/fb2fixtr.py	2011-12-10 21:19:05 UTC (rev 70)
+++ trunk/fb2-python-tools/fb2fixtr.py	2011-12-16 22:02:28 UTC (rev 71)
@@ -1,5 +1,5 @@
 #!/usr/bin/python
-# -*- coding: UTF-8 -*-
+# -*- coding: utf-8 -*-
 
 '''\
 Fix some frequent OCR and conversion errors in FictionBook2 files.
@@ -20,36 +20,38 @@
 
 File name '-' means standard input.
 '''
+
+from __future__ import division, print_function, unicode_literals
 __author__ = 'Serhiy Storchaka <sto...@us...>'
 __version__ = '0.2'
 __all__ = []
 
 import string, re
-import sys, getopt, os, os.path, xml.dom.minidom, codecs
+import sys, getopt, os, os.path, xml.dom.minidom, codecs, io
 
 quick = False
 
-rus_lowercase = u'абвгдеёжзийклмнопрстуфхцчшщъыьэюя'
+rus_lowercase = 'абвгдеёжзийклмнопрстуфхцчшщъыьэюя'
 rus_uppercase = rus_lowercase.upper()
 rus_letters = rus_lowercase + rus_uppercase
 
-cyr_lowercase = rus_lowercase + u'іїєґ'
+cyr_lowercase = rus_lowercase + 'іїєґ'
 cyr_uppercase = cyr_lowercase.upper()
 cyr_letters = cyr_lowercase + cyr_uppercase
 
-rus_tr = u'аАВсСеЕНКМпоОрРгТихХу'
-rus_lat_tr = u'aABcCeEHKMnoOpPrTuxXy'
-cyr_tr = u'аАВсСеЕНіІКМпоОрРгТихХу'
-cyr_lat_tr = u'aABcCeEHiIKMnoOpPrTuxXy'
+rus_tr = 'аАВсСеЕНКМпоОрРгТихХу'
+rus_lat_tr = 'aABcCeEHKMnoOpPrTuxXy'
+cyr_tr = 'аАВсСеЕНіІКМпоОрРгТихХу'
+cyr_lat_tr = 'aABcCeEHiIKMnoOpPrTuxXy'
 
 lat2cyr = dict( zip( cyr_letters + cyr_lat_tr, cyr_letters + cyr_tr ) )
 cyr2lat = dict( zip( string.ascii_letters + cyr_tr, string.ascii_letters + cyr_lat_tr ) )
-num2cyr = {u'0': u'О', u'3': u'З', u'6': u'б'}
+num2cyr = {'0': 'О', '3': 'З', '6': 'б'}
 
-word_re = re.compile( ur'([\w]+)', re.UNICODE )
+word_re = re.compile( r'([\w]+)', re.UNICODE )
 
 def maketest( chars ):
-	return re.compile( ur'\A[' + chars + ur']+\Z', re.UNICODE ).match
+	return re.compile( r'\A[' + chars + r']+\Z', re.UNICODE ).match
 
 # islat = maketest( string.ascii_letters )
 islat = maketest( string.ascii_letters + '_' )
@@ -61,14 +63,14 @@
 ispseudolat = maketest( string.ascii_letters + rus_tr )
 ispseudorus = maketest( rus_letters + rus_lat_tr  )
 ispseudocyr = maketest( cyr_letters + cyr_lat_tr  )
-isrusJ = maketest( rus_letters + u'\u0408' )
-isnumber = re.compile( ur'\A\d+\Z', re.UNICODE ).match
-isroman = re.compile( ur'\A(?:M{0,3})(?:D?C{0,3}|C[DM])(?:L?X{0,3}|X[LC])(?:V?I{0,3}|I[VX])\Z' ).match
-beginnumber_re = re.compile( ur'\A([0-9]+)(\w+)\Z', re.UNICODE )
-endnumber_re = re.compile( ur'\A(\w+?)([0-9]+)\Z', re.UNICODE )
-iscross = re.compile( ur'\A[0-9]+(?:х[0-9]+)+\Z' ).match
+isrusJ = maketest( rus_letters + '\u0408' )
+isnumber = re.compile( r'\A\d+\Z', re.UNICODE ).match
+isroman = re.compile( r'\A(?:M{0,3})(?:D?C{0,3}|C[DM])(?:L?X{0,3}|X[LC])(?:V?I{0,3}|I[VX])\Z' ).match
+beginnumber_re = re.compile( r'\A([0-9]+)(\w+)\Z', re.UNICODE )
+endnumber_re = re.compile( r'\A(\w+?)([0-9]+)\Z', re.UNICODE )
+iscross = re.compile( r'\A[0-9]+(?:х[0-9]+)+\Z' ).match
 
-hasdigits = re.compile( ur'\A.*[0-9].*\Z', re.UNICODE ).match
+hasdigits = re.compile( r'\A.*[0-9].*\Z', re.UNICODE ).match
 
 def tocyr( word ):
 	return ''.join( lat2cyr[c] for c in word )
@@ -76,10 +78,10 @@
 def tolat( word ):
 	return ''.join( cyr2lat[c] for c in word )
 
-def readlist( f ):
-	for line in f:
-		line = line.rstrip( '\n' ).decode( 'utf-8' )
-		if len( line ) > 0 and line[0] != '#':
+def readlist( fname ):
+	for line in io.open( fname, 'rt', encoding = 'utf-8' ):
+		line = line.rstrip( '\n' )
+		if line and line[0] != '#':
 			yield line
 
 reserved_tr = set()
@@ -91,11 +93,11 @@
 
 translates = {}
 try:
-	translates.update( line.split( ' ', 1 ) for line in readlist( open( 'replaces' ) ) )
+	translates.update( line.split( ' ', 1 ) for line in readlist( 'replaces' ) )
 except:
 	pass
 try:
-	translates.update( (w, w) for w in readlist( open( 'reserved' ) ) )
+	translates.update( (w, w) for w in readlist( 'reserved' ) )
 except:
 	pass
 
@@ -103,7 +105,9 @@
 global filename
 def logtr( word, type, *args ):
 	if logfile:
-		print >>logfile, '%s:' % filename, word.encode( 'utf-8' ), type, ' '.join( args ).encode( 'utf-8' )
+		# hack for Python 2.x
+		fn = filename.decode( 'utf-8' ) if isinstance( filename, bytes ) else filename
+		print( '%s:' % fn, word, type, *args, file = logfile )
 
 def tryconv( s, e1, e2 ):
 	try:
@@ -131,7 +135,7 @@
 		if cyr_word in  reserved_tr and lat_word not in reserved_tr:
 			return cyr_word
 		# Только кириллическа 'Н' заменена на латинскую 'H' -- шуточки FIDO
-		if iscyr( word.replace( u'H', u'Н' ) ):
+		if iscyr( word.replace( 'H', 'Н' ) ):
 			return cyr_word
 
 		# Неопределённость
@@ -156,16 +160,16 @@
 		m = endnumber_re.match( word )
 		if m and not hasdigits( m.group( 1 ) ):
 			# Метки часто содержат в себе номер
-			if m.group( 1 ) in (ur'note', ur'note_', ur'Note', ur'footnote', ur'child_', ur'FbAutId_', ur'comment_', ur'text_', ur'N', ur'N_', ur'No'):
+			if m.group( 1 ) in (r'note', r'note_', r'Note', r'footnote', r'child_', r'FbAutId_', r'comment_', r'text_', r'N', r'N_', r'No'):
 				return word
-	
+
 			# Между словом и номером пропущен пробел
-			if m.group( 1 ) in (ur'Глава', ur'ГЛАВА', ur'глава'):
-				return m.expand( ur'\1 \2' )
+			if m.group( 1 ) in (r'Глава', r'ГЛАВА', r'глава'):
+				return m.expand( r'\1 \2' )
 
 			# Начальная единица года распозналась как 'I"
-			if re.match( ur'\AI[89][0-9][0-9]\Z', word ):
-				return u'1' + word[1:]
+			if re.match( r'\AI[89][0-9][0-9]\Z', word ):
+				return '1' + word[1:]
 			# Просто собираем статистику
 			logtr( word, '!' )
 			return word
@@ -174,34 +178,34 @@
 		m = beginnumber_re.match( word )
 		if m and not hasdigits( m.group( 2 ) ):
 			# Физические единицы отделяем неразрывным пробелом
-			if m.group( 2 ) in (u'гг', u'мг', u'г', u'кг', u'мл', u'л', u'ч', u'мм', u'см', u'дм', u'м', u'км' ):
-				return m.expand( u'\\1\u00A0\\2' )
+			if m.group( 2 ) in ('гг', 'мг', 'г', 'кг', 'мл', 'л', 'ч', 'мм', 'см', 'дм', 'м', 'км' ):
+				return m.expand( '\\1\u00A0\\2' )
 			# Русские окончания отделяем дефисом
-			if m.group( 2 ) in (u'ый', u'ой', u'й', u'ым', u'ом', u'я', u'ая', u'е', u'ое', u'го', u'ого', u'ю', u'ую'):
-				return m.expand( ur'\1-\2' )
+			if m.group( 2 ) in ('ый', 'ой', 'й', 'ым', 'ом', 'я', 'ая', 'е', 'ое', 'го', 'ого', 'ю', 'ую'):
+				return m.expand( r'\1-\2' )
 			# А английские оставляем так
 			if m.group( 2 ) in ('st', 'nd', 'rd', 'th', 's', 'd', 'ff', 'mm', 'cm', 'mm', 'km', 'unt', 'cc', 'F'):
 				return word
-			if word[0] in u'036' and ( iscyrlower( word[1:] ) or iscyrupper( word[1:] ) ):
+			if word[0] in '036' and ( iscyrlower( word[1:] ) or iscyrupper( word[1:] ) ):
 				return num2cyr[word[0]] + word[1:]
 			# Иначе просто собираем статистику
 			logtr( word, '!' )
 			return word
 
 		# Начальная единица распозналась как 'I"
-		m = re.match( ur'\AI[0-9]+(?:st|nd|rd|th|s|d)\Z', word )
+		m = re.match( r'\AI[0-9]+(?:st|nd|rd|th|s|d)\Z', word )
 		if m:
-			return u'1' + word[1:]
+			return '1' + word[1:]
 
 		# Возможно цифра -- на самом деле буква.
 		# Дело тёмное и рискованное.
-		word2 = word.replace( u'ь1', u'ы' ).replace( u'Ь1', u'Ы' )
+		word2 = word.replace( 'ь1', 'ы' ).replace( 'Ь1', 'Ы' )
 		if word2 != word:
 			if ispseudorus( word2 ):
 				return tocyr( word2 )
 
-		if re.search( ur'6[аеиоуaeuoy]|[аеиоуaeuoy]6', word ):
-			word2 = word.replace( u'6', u'б' )
+		if re.search( r'6[аеиоуaeuoy]|[аеиоуaeuoy]6', word ):
+			word2 = word.replace( '6', 'б' )
 			if ispseudorus( word2 ):
 				return tocyr( word2 )
 
@@ -218,31 +222,31 @@
 
 	# Слово состоит из кириллических букв и похожих на кириллические и содержит i с точкой
 	# Явно (псевдо)украинское или старорусское
-	if (u'i' in word or u'I' in word) and ispseudocyr( word ):
+	if ('i' in word or 'I' in word) and ispseudocyr( word ):
 		# Часто 'п', за которой следуют 'о' или 'е' неправильно распознаётся
-		word2 = re.sub( u'^ii|^[гт]i(?=о)|[гi]i(?=[еоeo])', u'п', word )
+		word2 = re.sub( '^ii|^[гт]i(?=о)|[гi]i(?=[еоeo])', 'п', word )
 		# Также начальные 'Ш' и 'П'
-		word2 = re.sub( u'^III', u'Ш', word2 )
-		word2 = re.sub( u'^II', u'П', word2 )
+		word2 = re.sub( '^III', 'Ш', word2 )
+		word2 = re.sub( '^II', 'П', word2 )
 		# Украинское окончание
-		word2 = re.sub( u'ii$', u'ії', word2 )
-		word2 = re.sub( u'II$', u'ІЇ', word2 )
+		word2 = re.sub( 'ii$', 'ії', word2 )
+		word2 = re.sub( 'II$', 'ІЇ', word2 )
 		word2 = tocyr( word2 )
 		return word2
 
 	# Слово состоит из русских букв и непонятного символа, похожего на J.
 	# На самом деле это 'ё'
-	if u'\u0408' in word and isrusJ( word ) and word.replace( u'\u0408', u'' ):
-		return word.replace( u'\u0408', u'ё' )
+	if '\u0408' in word and isrusJ( word ) and word.replace( '\u0408', '' ):
+		return word.replace( '\u0408', 'ё' )
 	# Слетевшая кодировка для кавычек-ёлочек
-	if word[0] == u'\u0458' and isrus( word[1:] ):
-		return u'\xab' + word[1:]
-	if word[-1] == u'\u0405' and isrus( word[:-1] ):
-		return word[:-1] + u'\xbb'
+	if word[0] == '\u0458' and isrus( word[1:] ):
+		return '\xab' + word[1:]
+	if word[-1] == '\u0405' and isrus( word[:-1] ):
+		return word[:-1] + '\xbb'
 
 	# Для обозначения ударения в русском слове использованы диакритические знаки.
-	for c in u'áéúóý':
-		if isrus( word.replace( c, u'' ) ):
+	for c in 'áéúóý':
+		if isrus( word.replace( c, '' ) ):
 			return word
 
 	# Возможно оригинальный текст был в европейской кодировке iso-8859-15,
@@ -260,26 +264,26 @@
 	logtr( word, '!' )
 	return word
 
-utf_illegal_pref_re = re.compile( u'\u0432\u0402(?:\ufffd|[\u2000-\u203f])?', re.DOTALL )
+utf_illegal_pref_re = re.compile( '\u0432\u0402(?:\ufffd|[\u2000-\u203f])?', re.DOTALL )
 
 def fix_utf_illegal_pref( m ):
 	data = m.group()
-	if data == u'\u0432\u0402' or data == u'\u0432\u0402\ufffd':
-		return u'\u2018'
+	if data == '\u0432\u0402' or data == '\u0432\u0402\ufffd':
+		return '\u2018'
 	return data.encode( 'cp1251' ).decode( 'utf-8' )
 
 def fixtr_text( text ):
 	global quick
 
 	changed = False
-	if u'\u0432\u0402' in text: #'вЂ'
+	if '\u0432\u0402' in text: #'вЂ'
 		# Указана кодировка cp1251, а на самом деле -- utf-8
 		text = utf_illegal_pref_re.sub( fix_utf_illegal_pref, text )
 		changed = True
 
 	# Символы номера и копирайта, оставшиеся с HTML
-	text = text.replace( u'&#x2116;', u'\u2116' )
-	text = text.replace( u'&#169;', u'\xa9' )
+	text = text.replace( '&#x2116;', '\u2116' )
+	text = text.replace( '&#169;', '\xa9' )
 
 	# Разбиваем текст на слова и обрабатываем их по отдельности.
 	# Потом склеиваем.
@@ -302,7 +306,7 @@
 				changed = True
 
 	if changed:
-		text = u''.join( words )
+		text = ''.join( words )
 
 	return text
 
@@ -324,7 +328,7 @@
 		reserved_tr.add( word )
 
 def read_trdict( fname ):
-	for word in readlist( open( fname ) ):
+	for word in readlist( fname ):
 		update_trdict( word )
 		tword = word[0].upper() + word[1:]
 		if tword != word:
@@ -343,12 +347,12 @@
 	try:
 		opts, args = getopt.getopt( sys.argv[1:], '@:d:hko:qTvV',
 			['backup', 'dictionary=', 'help', 'log-file', 'progress', 'quick', 'text', 'version'] )
-	except getopt.GetoptError, err:
-		print >>sys.stderr, 'Error:', err
+	except getopt.GetoptError as err:
+		print( 'Error:', err, file = sys.stderr )
 		sys.exit( 2 )
 
 	keepBackup = False
-	backupSuffix = '.bak'
+	backupSuffix = str( '.bak' )
 	verbose = False
 	plainText = False
 
@@ -357,13 +361,13 @@
 			sys.stdout.write( __doc__ )
 			sys.exit( 0 )
 		elif option in ('-V', '--version'):
-			print __version__
+			print( __version__ )
 			sys.exit( 0 )
 		elif option == '-@':
 			if value == '-':
-				args.extend( line.rstrip( '\n' ) for line in sys.stdin )
+				args.extend( line.rstrip( str( '\n' ) ) for line in sys.stdin )
 			else:
-				args.extend( line.rstrip( '\n' ) for line in open( value ) )
+				args.extend( line.rstrip( str( '\n' ) ) for line in open( value ) )
 		elif option in ('-k', '--backup'):
 			keepBackup = True
 		elif option in ('-q', '--quick'):
@@ -373,7 +377,7 @@
 		elif option in ('-T', '--text'):
 			plainText = True
 		elif option in ('-o', '--log-file'):
-			logfile = open( value, 'w' )
+			logfile = io.open( value, 'wt', encoding = 'utf-8' )
 		elif option in ('-d', '--dictionary'):
 			read_trdict( value )
 
@@ -386,40 +390,53 @@
 		try:
 			if plainText:
 				# Process plain text in UTF-8
-				if filename == '-':
-					data0 = sys.stdin.read().decode( 'UTF-8' )
-					data = fixtr_text( data0 )
-					sys.stdout.write( data.encode( 'UTF-8' ) )
+				if filename == str( '-' ):
+					if sys.version_info[0] >= 3:
+						data0 = sys.stdin.read()
+						data = fixtr_text( data0 )
+						sys.stdout.write( data )
+					else:
+						data0 = sys.stdin.read().decode( 'utf-8' )
+						data = fixtr_text( data0 )
+						sys.stdout.write( data.encode( 'utf-8' ) )
 				else:
-					data0 = open( filename, 'r' ).read().decode( 'UTF-8' )
+					data0 = io.open( filename, 'rt', encoding = 'utf-8' )
 					data = fixtr_text( data0 )
 					if data != data0:
-						tmpfilename = filename + '.tmp'
-						open( tmpfilename, 'w' ).write( data.encode( 'UTF-8' ) )
+						tmpfilename = filename + str( '.tmp' )
+						io.open( tmpfilename, 'wt', encoding = 'utf-8' ).write( data )
 						if keepBackup:
 							os.rename( filename, filename + backupSuffix )
 						os.rename( tmpfilename, filename )
 			else:
 				# Process FB2
-				if filename == '-':
-					doc = xml.dom.minidom.parse( sys.stdin )
-					encoding = doc.encoding or 'UTF-8'
+				if filename == str( '-' ):
+					if sys.version_info[0] >= 3:
+						f = sys.stdin.buffer.raw
+					else:
+						f = sys.stdin
+					doc = xml.dom.minidom.parse( f )
+					encoding = doc.encoding or str( 'utf-8' )
 					fixtr_fb2( doc )
-					writexml( doc, sys.stdout, encoding )
+					if sys.version_info[0] >= 3:
+						f = sys.stdout.buffer.raw
+					else:
+						f = sys.stdout
+					writexml( doc, f, encoding )
 				else:
-					doc = xml.dom.minidom.parse( open( filename, 'r' ) )
-					encoding = doc.encoding or 'UTF-8'
+					doc = xml.dom.minidom.parse( open( filename, 'rb' ) )
+					encoding = doc.encoding or str( 'utf-8' )
 					if fixtr_fb2( doc ):
-						tmpfilename = filename + '.tmp'
-						writexml( doc, open( tmpfilename, 'w' ), encoding )
+						tmpfilename = filename + str( '.tmp' )
+						writexml( doc, open( tmpfilename, 'wb' ), encoding )
 						if keepBackup:
 							os.rename( filename, filename + backupSuffix )
 						os.rename( tmpfilename, filename )
 		except (KeyboardInterrupt, SystemExit):
 			raise
-		except Exception, err:
-			print >>sys.stderr, 'Error processing "%s":' % filename
-			print >>sys.stderr, err
+		except Exception as err:
+			print( str( 'Error processing "%s":' ) % filename, file = sys.stderr )
+			print( err, file = sys.stderr )
 			raise
 
 	if logfile:

Modified: trunk/fb2-python-tools/fb2format.py
===================================================================
--- trunk/fb2-python-tools/fb2format.py	2011-12-10 21:19:05 UTC (rev 70)
+++ trunk/fb2-python-tools/fb2format.py	2011-12-16 22:02:28 UTC (rev 71)
@@ -1,5 +1,5 @@
 #!/usr/bin/python
-# -*- coding: UTF-8 -*-
+# -*- coding: utf-8 -*-
 
 '''\
 Usage:
@@ -19,6 +19,7 @@
 File name '-' means standard input.
 '''
 
+from __future__ import division, print_function, unicode_literals
 __author__ = 'Serhiy Storchaka <sto...@us...>'
 __version__ = '0.2'
 
@@ -29,47 +30,47 @@
 	pass
 
 import re, base64
-import sys, getopt, os, os.path, xml.dom.minidom, codecs, cStringIO
+import sys, getopt, os, os.path, xml.dom.minidom, codecs, io
 
-_spaces_re = re.compile( r'[ \t\r\n]{2,}|[\t\r\n]' )
-_empty_element_re = re.compile( r'<([^ >]+)([^>]*)(?<!/)></\1>' )
+_spaces_re = re.compile( br'[ \t\r\n]{2,}|[\t\r\n]' )
+_empty_element_re = re.compile( br'<([^ >]+)([^>]*)(?<!/)></\1>' )
 def _make_tags_switch( tags ):
-	return re.compile( '(%s)' % '|'.join( '<%s(?: [^>]*)?>.*?</%s>' % (tag, tag) for tag in tags ), re.DOTALL )
-_text_re = _make_tags_switch( ('p', 'v', 'subtitle', 'text-author', 'th', 'td') )
-_oneline_re = _make_tags_switch( ('title', 'author', 'translator') )
-_binary_re = re.compile( '(<binary [^>]*>)([^<]*)(</binary>)', re.DOTALL )
+	return re.compile( b'(' + b'|'.join( b'<' + tag + b'(?: [^>]*)?>.*?</' + tag + b'>' for tag in tags ) + b')', re.DOTALL )
+_text_re = _make_tags_switch( (b'p', b'v', b'subtitle', b'text-author', b'th', b'td') )
+_oneline_re = _make_tags_switch( (b'title', b'author', b'translator') )
+_binary_re = re.compile( b'(<binary [^>]*>)([^<]*)(</binary>)', re.DOTALL )
 
 def _remove_eols( m ):
-	return m.group().replace( '\n', '' )
+	return m.group().replace( b'\n', b'' )
 
 def _binary_squeeze( m ):
-	return m.group( 1 ) + m.group( 2 ).replace( ' ', '' ) + m.group( 3 )
+	return m.group( 1 ) + m.group( 2 ).replace( b' ', b'' ) + m.group( 3 )
 
 def _binary_recode( m ):
-	return m.group( 1 ) + base64.encodestring( base64.decodestring( m.group( 2 ) ) ) + m.group( 3 )
+	return m.group( 1 ) + base64.b64encode( base64.b64decode( m.group( 2 ) ) ) + m.group( 3 )
 
 def _squeeze_tag( s ):
 	if _text_re.match( s ):
 		return s
 	else:
-		return _empty_element_re.sub( r'<\1\2/>', s.strip( ' ' ).replace( '> ', '>' ).replace( ' <', '<' ) )
+		return _empty_element_re.sub( br'<\1\2/>', s.strip( b' ' ).replace( b'> ', b'>' ).replace( b' <', b'<' ) )
 
 def _format_tag( s ):
 	if _text_re.match( s ):
 		return s
 	else:
-		return _empty_element_re.sub( r'<\1\2/>', s.strip( ' ' ).replace( '> ', '>' ).replace( ' <', '<' ) ).replace( '><', '>\n<' )
+		return _empty_element_re.sub( br'<\1\2/>', s.strip( b' ' ).replace( b'> ', b'>' ).replace( b' <', b'<' ) ).replace( b'><', b'>\n<' )
 
 def fb2format( data, squeeze = False, squeezeBinary = False ):
-	data = _spaces_re.sub( ' ', data )
+	data = _spaces_re.sub( b' ', data )
 
 	if squeeze:
-		data = ''.join( _squeeze_tag( s ) for s in _text_re.split( data ) )
-		data = data.replace( '>', '>\n', 1 )
+		data = b''.join( _squeeze_tag( s ) for s in _text_re.split( data ) )
+		data = data.replace( b'>', b'>\n', 1 )
 	else:
-		data = '\n'.join( s for s in (_format_tag( s ) for s in _text_re.split( data )) if s )
+		data = b'\n'.join( s for s in (_format_tag( s ) for s in _text_re.split( data )) if s )
 		data = _oneline_re.sub( _remove_eols, data )
-		data = data.replace( '>\n<title>', '><title>' )
+		data = data.replace( b'>\n<title>', b'><title>' )
 
 	if squeezeBinary or squeeze:
 		data = _binary_re.sub( _binary_squeeze, data )
@@ -83,8 +84,8 @@
 	try:
 		opts, args = getopt.getopt( sys.argv[1:], '@:be:fhksvV',
 			['backup', 'encoding=', 'format', 'help', 'progress', 'squeeze', 'squeeze-binaries', 'version'] )
-	except getopt.GetoptError, err:
-		print >>sys.stderr, 'Error:', err
+	except getopt.GetoptError as err:
+		print( 'Error:', err, file = sys.stderr )
 		sys.exit( 2 )
 
 	forceEncoding = None
@@ -100,11 +101,11 @@
 			sys.stdout.write( __doc__ )
 			sys.exit( 0 )
 		elif option in ('-V', '--version'):
-			print __version__
+			print( __version__ )
 			sys.exit( 0 )
 		elif option == '-@':
 			if value == '-':
-				args.extend( line.rstrip( '\n' ) for line in sys.stdin )
+				args.extend( line.rstrip( str( '\n' ) ) for line in sys.stdin )
 			else:
 				args.extend( line.rstrip( '\n' ) for line in open( value ) )
 		elif option in ('-e', '--encoding'):
@@ -127,14 +128,18 @@
 
 	for filename in args:
 		try:
-			if filename == '-':
-				data0 = sys.stdin.read()
+			if filename == str( '-' ):
+				if sys.version_info[0] >= 3:
+					f = sys.stdin.buffer.raw
+				else:
+					f = sys.stdin
+				data0 = f.read()
 			else:
-				data0 = open( filename, 'r' ).read()
+				data0 = open( filename, 'rb' ).read()
 
-			doc = xml.dom.minidom.parseString( data0 )
-			encoding = forceEncoding or doc.encoding or 'UTF-8'
-			writer = cStringIO.StringIO()
+			doc = xml.dom.minidom.parse( io.BytesIO( data0 ) )
+			encoding = forceEncoding or doc.encoding or str( 'utf-8' )
+			writer = io.BytesIO()
 			writer = codecs.getwriter( encoding )( writer,  'xmlcharrefreplace' )
 			doc.writexml( writer, encoding = encoding )
 			data = writer.getvalue()
@@ -143,16 +148,20 @@
 			if format:
 				data = fb2format( data, squeeze = squeeze, squeezeBinary = squeezeBinary )
 
-			if filename == '-':
-				sys.stdout.write( data )
+			if filename == str( '-' ):
+				if sys.version_info[0] >= 3:
+					f = sys.stdout.buffer.raw
+				else:
+					f = sys.stdout
+				f.write( data )
 			elif data != data0:
-					tmpfilename = filename + '.tmp'
-					open( tmpfilename, 'w' ).write( data )
-					if keepBackup:
-						os.rename( filename, filename + backupSuffix )
-					os.rename( tmpfilename, filename )
+				tmpfilename = filename + str( '.tmp' )
+				open( tmpfilename, 'wb' ).write( data )
+				if keepBackup:
+					os.rename( filename, filename + backupSuffix )
+				os.rename( tmpfilename, filename )
 		except (KeyboardInterrupt, SystemExit):
 			raise
-		except Exception, err:
-			print >>sys.stderr, 'Error processing "%s":' % filename
-			print >>sys.stderr, err
+		except Exception as err:
+			print( str( 'Error processing "%s":' ) % filename, file = sys.stderr )
+			print( err, file = sys.stderr )

Modified: trunk/fb2-python-tools/fb2maketree.py
===================================================================
--- trunk/fb2-python-tools/fb2maketree.py	2011-12-10 21:19:05 UTC (rev 70)
+++ trunk/fb2-python-tools/fb2maketree.py	2011-12-16 22:02:28 UTC (rev 71)
@@ -1,5 +1,5 @@
 #!/usr/bin/env python
-# -*- coding: UTF-8 -*-
+# -*- coding: utf-8 -*-
 
 '''\
 Usage:
@@ -17,6 +17,7 @@
 File name '-' means standard input.
 '''
 
+from __future__ import division, print_function, unicode_literals
 __author__ = 'Serhiy Storchaka <sto...@us...>'
 __version__ = '0.2'
 __all__ = []
@@ -30,6 +31,11 @@
 
 filesystemencoding = sys.getfilesystemencoding()
 # filesystemencoding = 'utf-8'
+def warn( tag, path ):
+	# hack for Python 2.x
+	if isinstance( path, bytes ):
+		path = path.encode( filesystemencoding )
+	print( tag, path )
 
 def genname( dirname, filename, otherpath = None ):
 	filename = filename.replace( '"', "'" )
@@ -40,8 +46,8 @@
 	try:
 		if not os.path.exists( dirname ):
 			os.makedirs( dirname )
-	except os.error, err:
-		print >>sys.stderr, err
+	except os.error as err:
+		print( err, file = sys.stderr )
 		pass
 	count = 0
 	path = os.path.join( dirname, filename )
@@ -50,19 +56,19 @@
 			if os.path.samefile( path, otherpath ):
 				return None
 			if filecmp.cmp( path, otherpath, 0 ):
-				print '#', path.encode( filesystemencoding )
+				warn( '#', path )
 				return None
 		count += 1
 		path = os.path.join( dirname, '%s__%d%s' % (basename, count, suffix) )
 	if count > 0:
-		print '!', path.encode( filesystemencoding )
+		warn( '!', path )
 	return path
 
 def mklink( src, dst ):
 	try:
 		os.link( src, dst )
-	except OSError, err:
-		print '@', dst.encode( filesystemencoding )
+	except OSError as err:
+		warn( '@', dst )
 		os.symlink( src, dst )
 
 def linkauthors( path, authornames, book_title ):
@@ -83,14 +89,14 @@
 		authorname += ' [%s]' % nickname
 	return authorname
 
-xml_re = re.compile( r'<\?xml version="(?:[^">]*)" encoding="(?:[^">]*)"\?>', re.DOTALL )
-desc_re = re.compile( r'<description>.*?</description>', re.DOTALL )
+xml_re = re.compile( br'<\?xml version="(?:[^">]*)" encoding="(?:[^">]*)"\?>', re.DOTALL )
+desc_re = re.compile( br'<description>.*?</description>', re.DOTALL )
 
 if __name__ == '__main__':
 	try:
 		opts, args = getopt.getopt( sys.argv[1:], '@:hf:o:svV', ['help', 'format=', 'output=', 'symbolic', 'version', 'progress'] )
-	except getopt.GetoptError, err:
-		print >>sys.stderr, 'Error:', err
+	except getopt.GetoptError as err:
+		print( 'Error:', err, file = sys.stderr )
 		sys.exit( 2 )
 	outputdir = '.'
 	verbose = False
@@ -100,13 +106,13 @@
 			sys.stdout.write( __doc__ )
 			sys.exit( 0 )
 		elif option in ('-V', '--version'):
-			print __version__
+			print( __version__ )
 			sys.exit( 0 )
 		elif option == '-@':
 			if value == '-':
-				args.extend( line.rstrip( '\n' ) for line in sys.stdin )
+				args.extend( line.rstrip( str( '\n' ) ) for line in sys.stdin )
 			else:
-				args.extend( line.rstrip( '\n' ) for line in open( value ) )
+				args.extend( line.rstrip( str( '\n' ) ) for line in open( value ) )
 		elif option in ('-v', '--progress'):
 			verbose = True
 		elif option in ('-f', '--format'):
@@ -123,24 +129,23 @@
 	for fb2name in args:
 		srcpath = os.path.abspath( fb2name )
 		#if verbose:
-		#	print fb2name
+		#	print( fb2name )
 		try:
-			f = open( srcpath )
-			data = ''
-			while True:
-				data += f.read( 1 << 13 )
-				try:
-					doc = xml_re.match( data ).group() + '\n' + desc_re.search( data ).group()
-				except AttributeError:
-					continue
-				break
-			f.close()
-			doc = doc.replace( 'xlink:href=', 'href=' ).replace( 'l:href=', 'href=' )
+			with open( srcpath, 'rb' ) as f:
+				data = b''
+				while True:
+					data += f.read( 1 << 13 )
+					try:
+						doc = xml_re.match( data ).group() + b'\n' + desc_re.search( data ).group()
+					except AttributeError:
+						continue
+					break
+			doc = doc.replace( b'xlink:href=', b'href=' ).replace( b'l:href=', b'href=' )
 
 			try:
 				description = xml.etree.ElementTree.fromstring( doc )
 			except:
-				print doc
+				print( doc )
 				raise
 
 			title_info = description.find( 'title-info' )
@@ -178,7 +183,7 @@
 					linkauthors( path, authornames, book_title )
 			elif format == 'series':
 				for sequence_name, sequence_number, sequence_src_name in sequences:
-					dirname = sequence_name
+					dirname = sequence_name or '-'
 					if sequence_src_name:
 						dirname += ' [%s]' % sequence_src_name
 					dirname += ' : ' + authornames_str
@@ -214,7 +219,7 @@
 					mklink( srcpath, path )
 		except (KeyboardInterrupt, SystemExit):
 			raise
-		except Exception, err:
-			print >>sys.stderr, 'Error processing "%s":' % fb2name
-			print >>sys.stderr, err
+		except Exception as err:
+			print( str( 'Error processing "%s":' ) % fb2name, file = sys.stderr )
+			print( err, file = sys.stderr )
 			sys.exit( 1 )

Modified: trunk/fb2-python-tools/progress_display.py
===================================================================
--- trunk/fb2-python-tools/progress_display.py	2011-12-10 21:19:05 UTC (rev 70)
+++ trunk/fb2-python-tools/progress_display.py	2011-12-16 22:02:28 UTC (rev 71)
@@ -1,4 +1,5 @@
-# emacs-mode: -*- python-*-
+# -*- coding: utf-8 -*-
+from __future__ import division, print_function, unicode_literals
 try:
 	import psyco
 	psyco.full()
@@ -7,21 +8,21 @@
 import sys, time
 
 class progress_display:
-	def __init__( self, expected_count, width = 75, fout = sys.stderr ):
+	def __init__( self, expected_count, width = 75, file = sys.stderr ):
 		self.__start = time.time()
 		self.__expected_count = expected_count
 		self.__count = 0
 		self.__width = width - 25
-		
-		self.__fout = fout
+
+		self.__file = file
 		self.__progress( 0, 0 )
 
 	def next( self, increment = 1 ):
 		self.__count += increment
-		self.__progress( float( self.__count ) / self.__expected_count, time.time() - self.__start )
+		self.__progress( self.__count / self.__expected_count, time.time() - self.__start )
 
 	def close( self ):
-		print >>self.__fout
+		print( file = self.__file )
 
 	def __progress( self, perc, delta ):
 		estimated = round( perc and delta / perc )
@@ -30,9 +31,11 @@
 			bar = '|' + '#' * int( width * perc ) + '.' * ( width - int( width * perc ) ) + '|'
 		else:
 			bar = ''
-		self.__fout.write( '\r%s%3d%% %s/%s' % ( bar, int( 100 * perc ), time.strftime( '%X', time.gmtime( round( delta ) ) ), time.strftime( '%X', time.gmtime( estimated ) ) ) )
+		self.__file.write( '\r%s%3d%% %s/%s' % ( bar, int( 100 * perc ),
+			time.strftime( '%X', time.gmtime( round( delta ) ) ),
+			time.strftime( '%X', time.gmtime( estimated ) ) ) )
 
-def progress_iter( iter, width = 75, vis = None, fout = sys.stderr ):
+def progress_iter( iter, vis = None, width = 75, file = sys.stderr ):
 	if not vis: vis = lambda x: x
 	start = time.time()
 	data = list( iter )
@@ -44,11 +47,13 @@
 			bar = '|' + '#' * int( width * perc ) + '.' * ( width - int( width * perc ) ) + '|'
 		else:
 			bar = ''
-		fout.write( '\r%s%3d%% %s/%s ' % ( bar, int( 100 * perc ), time.strftime( '%X', time.gmtime( round( delta ) ) ), time.strftime( '%X', time.gmtime( estimated ) ) ) )
+		file.write( '\r%s%3d%% %s/%s ' % ( bar, int( 100 * perc ),
+			time.strftime( '%X', time.gmtime( round( delta ) ) ),
+			time.strftime( '%X', time.gmtime( estimated ) ) ) )
 
 	_progress( 0, 0 )
 	for value in data:
 		yield value
 		count += 1
-		_progress( float( count ) / len( data  ), time.time() - start )
-	print >>fout
+		_progress( count / len( data  ), time.time() - start )
+	print( file = file )

This was sent by the SourceForge.net collaborative development platform, the world's largest Open Source development site.





2006	Jan	Feb	Mar	Apr	May	Jun	Jul	Aug	Sep	Oct	Nov	Dec (1)
2007	Jan	Feb	Mar	Apr	May	Jun (44)	Jul	Aug (6)	Sep (1)	Oct (1)	Nov (1)	Dec
2008	Jan (4)	Feb	Mar	Apr (1)	May	Jun	Jul	Aug	Sep	Oct	Nov	Dec
2009	Jan	Feb	Mar	Apr	May	Jun	Jul	Aug	Sep	Oct	Nov (5)	Dec
2010	Jan	Feb	Mar	Apr	May	Jun	Jul	Aug	Sep	Oct	Nov	Dec (1)
2011	Jan	Feb (1)	Mar	Apr	May	Jun (4)	Jul	Aug	Sep	Oct	Nov	Dec (2)

fb2-perl-tools-svn Mailing List for Fb2 Perl Tools

fb2-perl-tools-svn — Fb2 Perl Tools SVN Commit Notification List