From: Tomohiro K. <tk...@ri...> - 2001-12-15 03:26:13
|
久保田です。 Big5 テストをしているのですが、いくつかの点について。 - まず、Big5 なペーストの受け入れですが、--big5buggy で切り替えるの ではなく、いつでも何でも受け入れる、というのがいいと思います。 mlterm 以外にも、COMPOUND_TEXT を独自に生成しているソフトウェアが あります (たとえば emacs)。そういうソフトウェアが生成する COMPOUND_TEXT に対応するには、そうするのがいいと思います。 - ペーストのテストをしていたら、ごくたまに、segfault することがありま す。感覚的には 20 回から 100 回に 1 回くらいの割合で。 - ペーストのとき、COMPOUND_TEXT を Unicode にいったん変換する (そして さらに現在のエンコーディングに変換する) というオプションがあります が、 それがオフのときでも、Unicode でやってきたセレクションを現在の エンコーディングに変換する、というのは、やったほうがいいと思います。 これで、たとえば xterm -u8 から Big5 mlterm へのペーストが可能に なります。COMPOUND_TEXT から Unicode に変換するというオプションを オンにしてもこれは可能になりますが、そうすると、ISO-2022-JP-3 など で漢字がごっちゃになってしまうという副作用が現れてしまうので。 あるいは、エンコーディングごとに Unicode のサブセットになっているか どうか、という情報を持たせ、もしサブセットになっているなら Unicode 変換を使う、そうでなければ使わない、という切り分けでもいいと思い ます。Unicode のサブセットであるようなエンコーディングは、 UTF-8, EUC-JP, Shift_JIS, EUC-CN, EUC-KR, Big5, ISO-2022-KR, ISO-8859-*, TIS-620 などで、そうでないエンコーディングは、 ISO-2022-JP, ISO-2022-JP-2 などです。 まとめると、 mlterm encoding が Unicode のサブセットのとき selection(XCTorUCS) -> Unicode -> (mlterm encoding) mlterm encoding が Unicode のサブセットでないとき selection(XCTorUCS) -> (mlterm encoding) というぐあいにするモードがあればと思います。 それから、Xutf8LookupString() パッチですが、うまく動いています。 LANG=ja_JP.eucJP な状態で mlterm -E TIS620 あるいは mlterm -E UTF8 として、setxkbmap th やって、タイ文字を入力できています。 また、mlconfig 起動状態での動作も快適です。(mlconfig の二重起動も ないですし)。 --- 久保田智広 Tomohiro KUBOTA <ku...@de...> http://www.debian.or.jp/~kubota/ "Introduction to I18N" http://www.debian.org/doc/manuals/intro-i18n/ |