From: Araki K. <ara...@us...> - 2003-03-02 09:26:03
|
荒木です:-) Subject: Re: [Mlterm-dev-ja] word selection From: Tomohiro KUBOTA <ku...@de...> Message-ID: <200...@tm...> Date: Sun, 02 Mar 2003 18:05:28 +0900 (JST) >> > いえ、アルファベット、漢字、ひらがな、記号といったスクリプトの境界で >> > 区切ってくれるとうれしいなと。 >> > >> > ただ、それは大変だと思うので、せめて ASCII と JIS部分の境界で区切って >> > 欲しいなということでした。 >> > # 『JIS部分』というのを単語選択する時に『JIS』『部分』と分けて欲しい。 >> >> 文字集合が変わるところを境界とするようにしました。 >> >> # commit 済みです > > これだと、ISO-8859-1 など、ASCII 以外の文字集合にもラテンアルファベットが > あるような場合、うれしくないのではないかと思います。 > > それから、UTF-8 の場合、「文字集合」はどのように扱われるのでしょうか? > (Unicode のブロックの情報を持ち、それを使うしかないと思います)。 > > # 欲を言えば、全角スペースもスペース扱いしてもらえると、ありがたいです。 その辺は、もう、どこで妥協するかちう程度の話だと思いますので、あまり 拘っても仕方ないかと ^^; ただ、ISO-8859-1 なんかで、US_ASCII と ISO_8859_1_R が別物として扱わ れるのはちょっと不自然かもしれないですね。 Unicode のことも考えると、全角幅か半角幅かを境界にするのが、現実的な 線かなと思うんですが、どうでしょうか? では -- Araki Ken ara...@us... h |