You can subscribe to this list here.
| 2007 |
Jan
|
Feb
|
Mar
(2) |
Apr
|
May
|
Jun
|
Jul
|
Aug
|
Sep
|
Oct
|
Nov
|
Dec
|
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2008 |
Jan
|
Feb
|
Mar
(2) |
Apr
|
May
|
Jun
|
Jul
|
Aug
(2) |
Sep
(1) |
Oct
|
Nov
|
Dec
|
| 2009 |
Jan
|
Feb
|
Mar
|
Apr
|
May
(2) |
Jun
|
Jul
|
Aug
|
Sep
(4) |
Oct
|
Nov
(2) |
Dec
|
| 2011 |
Jan
|
Feb
|
Mar
|
Apr
|
May
|
Jun
(1) |
Jul
|
Aug
|
Sep
|
Oct
|
Nov
|
Dec
(1) |
| 2012 |
Jan
(1) |
Feb
|
Mar
|
Apr
(1) |
May
(1) |
Jun
|
Jul
|
Aug
|
Sep
|
Oct
|
Nov
|
Dec
(1) |
| 2013 |
Jan
(8) |
Feb
|
Mar
|
Apr
|
May
|
Jun
|
Jul
|
Aug
|
Sep
|
Oct
|
Nov
(3) |
Dec
|
| 2015 |
Jan
|
Feb
|
Mar
(3) |
Apr
|
May
|
Jun
|
Jul
|
Aug
|
Sep
(2) |
Oct
|
Nov
|
Dec
(1) |
| 2016 |
Jan
|
Feb
|
Mar
|
Apr
|
May
|
Jun
|
Jul
|
Aug
(1) |
Sep
(6) |
Oct
|
Nov
|
Dec
|
| 2017 |
Jan
|
Feb
|
Mar
|
Apr
|
May
|
Jun
|
Jul
(2) |
Aug
|
Sep
(1) |
Oct
|
Nov
|
Dec
|
| 2022 |
Jan
|
Feb
|
Mar
|
Apr
|
May
|
Jun
|
Jul
|
Aug
|
Sep
(1) |
Oct
|
Nov
|
Dec
|
|
From: Ryusei Y. <man...@gm...> - 2022-09-01 12:18:00
|
リポジトリ名: cjkvi-variants ファイル名: jp-old-style.txt <https://github.com/cjkvi/cjkvi-variants/blob/e4f1da248c9737a243f9930b5dc497cef5d5ae16/jp-old-style.txt#L734>URL: https://github.com/cjkvi/cjkvi-variants/blob/e4f1da248c9737a243f9930b5dc497cef5d5ae16/jp-old-style.txt#L734 <https://github.com/cjkvi/cjkvi-variants/blob/e4f1da248c9737a243f9930b5dc497cef5d5ae16/jp-old-style.txt#L734> エラー内容: 栃󠄀 擔󠄀 という新字体・旧字体ペアが存在しています。 |
|
From: Reinaert A. <rei...@gm...> - 2017-09-16 21:52:04
|
Hi, First off, thanks for your great resource. I noticed on this page http://kanji-database.sourceforge.net/dict/misc.html that you are in the process of constructing a database to the 広漢和辞典. Is this still in the works? Is any data ready yet? I'm working on the page numbers to my 1984 edition of the morohashi database. I think there are a few differences to your data in the dkw2ucs file probably due to changes in the differing editions. Are you interested in my data once I'm finished checking it? I will be using the data on my chinese character mnemonic site http://rtega.be/chmn Kind regards, Reinaert Albrecht |
|
From: Katsuhiko O. <kat...@gm...> - 2017-07-07 13:12:07
|
こんにちは、いつもお世話になっております。 𠮟(3247), 叱(3248)ですが、熟語が載っているのは 3247 の方です。 しかし、dkw-word.txt では 3248 の方になっていました。補巻にも1箇所ありました。 ご連絡まで。 大久保克彦 |
|
From: Pit H <lin...@ya...> - 2017-07-03 07:20:46
|
Konnichiwa, I have been strolling through your Kanji Database data, a truly impressive and very useful cooperative work! My interest has centered so far on those tables that are dedicated to Morohashi's Dai Kan-Wa Jiten (DKW), as I am eager to add references to DKW to my Wenlin Chinese character database, for personal use. May I ask you two questions at this stage? 1/ Has any attempt been made to digitize the Four-Corner Index (4CI) data contained in DKW vol.13? If no, I can supply 4CI data for a greater part of the DKW entries, but still need to countercheck them with DKW vol.13. 2/ Is there any table that "translates" SAT (dzk.l.u-tokyo.ac.jp/SAT/ddb-bdk-sat2.php) Gaiji such as &MT02057; or &T005101; into UCS or component strings? I am looking forward to hearing from you. Please feel free to write me in Japanese, as I can read Japanese (although I am unfortunately not yet "pera-pera"). Best regards, Peter E. HauerVienna, Austria |
|
From: Katsuhiko O. <kat...@gm...> - 2016-09-10 04:28:00
|
川幡さま、みなさま On 2016/09/09 21:28, kawabata taichi wrote: > 画数が異なるという非常に重要な指摘であり、参考になりました。 お役に立ったようで何よりです。ただのまぐれ当たりです。 ちなみに私はご指摘のようにあれこれ字形を調べたわけではありません(そういう素養は全くありません)。 図書館でコピーしてきた全巻の画数索引とにらめっこしただけです。 #そして図書館に通うのがめんどくさすぎるので、ヤフオク&自炊となりました。 そういえば、今週木曜に気がついたのですが、6-14596 (柹)は、大漢和では部首内5画、総9画となっていますが、 新漢語林第2版では、漢字番号5423、部首内4画、総8画となっていました。 1-132の𠂔も、ノ部、部首内4画、総5画でした(新漢語林にはなし)。 あと、13巻の字訓索引がおもしろすぎるので、読みと大漢和番号のデータが作ってみたくなっています。 親字はともかくページ番号くらいまではOCRで何とかならないかと思いましたが、ちょっと厳しいようでした。 もし、完成することがありましたらご報告いたします(何の確約も出来ませんが)。 |
|
From: kawabata t. <kaw...@gm...> - 2016-09-09 12:28:37
|
ところで、幾つかのご指摘は興味深いものがあり、 参考になりました。 たとえば、D07139の画数は「6画」ではないか、という指摘ですが、 対応するとされるUCSを参照すると、「宧」はどうみても7画に 見えますね。「宧」はUCS規格書では中国・香港・台湾、いずれも 下側が「𦣞」になっていますが、大漢和は「𦣝」となっているために、 画数が異なるという非常に重要な指摘であり、参考になりました。 (𦣝も7画に数えてしまうんではないかなぁ、とも思うのですが・・・^_^;) 2016-09-09 21:24 GMT+09:00 kawabata taichi <kaw...@gm...>: > 大久保さま、 > > 修正の指摘、ありがとうございました。 > 原文を確認の上、修正してコミットさせて頂きました。 > > # 私自身も EPWINGをよく使っていました。 > # Japan Knowledge に移行してからは不沙汰していましたが、 > # 最近、辞書自身もめっきり使わなくなり、JKも脱退した > # ばかりですのでまたEPWINGにお世話になるかもしれません。 > > > 2016-09-07 6:27 GMT+09:00 Katsuhiko OHKUBO <kat...@gm...>: > >> 川幡さま、みなさま >> >> dkw-word.txtのページ番号が3万以上になっているところが2カ所ありました。 >> これは単純なミスタイプだと思います。ご参考までに。 >> >> DW09099.0.0001.0 DP03879 .. >> DW09102.0.0001.0 DP38800 .. >> DW09103.0.0001.0 DP38800 .. >> DW09103.0.0002.0 DP38800 .. >> DW09122.0.0001.0 DP03881 .. >> >> DW16701.0.0002.0 DP06503 .. >> DW16721.0.0001.0 DP36504 .. >> ・・・ >> DW16722.0.0003.0 DP36504 .. >> DW16723.0.0001.0 DP06505 .. >> >> >> 先日届いた修訂版を全巻断裁して、自炊しました。 >> やはりPDFになっていると取り回しが楽です。 >> >> ------------------------------------------------------------ >> ------------------ >> _______________________________________________ >> Kanji-database-contact mailing list >> Kan...@li... >> https://lists.sourceforge.net/lists/listinfo/kanji-database-contact >> > > > > -- > --------------------------------------------------------------------- > 川幡 太一 (KAWABATA, Taichi) E-mail: kaw...@gm... > > -- --------------------------------------------------------------------- 川幡 太一 (KAWABATA, Taichi) E-mail: kaw...@gm... |
|
From: kawabata t. <kaw...@gm...> - 2016-09-09 12:24:22
|
大久保さま、 修正の指摘、ありがとうございました。 原文を確認の上、修正してコミットさせて頂きました。 # 私自身も EPWINGをよく使っていました。 # Japan Knowledge に移行してからは不沙汰していましたが、 # 最近、辞書自身もめっきり使わなくなり、JKも脱退した # ばかりですのでまたEPWINGにお世話になるかもしれません。 2016-09-07 6:27 GMT+09:00 Katsuhiko OHKUBO <kat...@gm...>: > 川幡さま、みなさま > > dkw-word.txtのページ番号が3万以上になっているところが2カ所ありました。 > これは単純なミスタイプだと思います。ご参考までに。 > > DW09099.0.0001.0 DP03879 .. > DW09102.0.0001.0 DP38800 .. > DW09103.0.0001.0 DP38800 .. > DW09103.0.0002.0 DP38800 .. > DW09122.0.0001.0 DP03881 .. > > DW16701.0.0002.0 DP06503 .. > DW16721.0.0001.0 DP36504 .. > ・・・ > DW16722.0.0003.0 DP36504 .. > DW16723.0.0001.0 DP06505 .. > > > 先日届いた修訂版を全巻断裁して、自炊しました。 > やはりPDFになっていると取り回しが楽です。 > > ------------------------------------------------------------ > ------------------ > _______________________________________________ > Kanji-database-contact mailing list > Kan...@li... > https://lists.sourceforge.net/lists/listinfo/kanji-database-contact > -- --------------------------------------------------------------------- 川幡 太一 (KAWABATA, Taichi) E-mail: kaw...@gm... |
|
From: Katsuhiko O. <kat...@gm...> - 2016-09-06 21:27:34
|
川幡さま、みなさま dkw-word.txtのページ番号が3万以上になっているところが2カ所ありました。 これは単純なミスタイプだと思います。ご参考までに。 DW09099.0.0001.0 DP03879 .. DW09102.0.0001.0 DP38800 .. DW09103.0.0001.0 DP38800 .. DW09103.0.0002.0 DP38800 .. DW09122.0.0001.0 DP03881 .. DW16701.0.0002.0 DP06503 .. DW16721.0.0001.0 DP36504 .. ・・・ DW16722.0.0003.0 DP36504 .. DW16723.0.0001.0 DP06505 .. 先日届いた修訂版を全巻断裁して、自炊しました。 やはりPDFになっていると取り回しが楽です。 |
|
From: kawabata t. <kaw...@gm...> - 2016-09-01 14:19:23
|
大久保さま、 川幡ともうします。 連絡と確認、ありがとうございます。 最近、多忙その他の理由によりほとんど漢字DBとしての活動はできていないのですが、 できるだけ早いうちに修正できるよう、急ぎたいと思います。 (申し訳ありませんが、今日からしばらく、海外に行くため、対応できない状況です。) 今後ともよろしくお願い致します。 2016-09-01 19:46 GMT+09:00 Katsuhiko OHKUBO <kat...@gm...>: > 漢字データベース開発者のみなさま > > まずは、このようなデータを再利用可能な形で公開してくださいましたこと、 > 深くお礼申し上げます。大変な時間と手間を掛けられたこととお察しします。 > 私は、様々な言語の電子辞書やテキスト化などを趣味としております大久保と申します。 > > 春に大槻文彦『言海』の全文テキスト化を始めました( http://genkai.osdn.jp/ )。 > その過程で度々図書館に通って大漢和辞典を参照していたのですが、余りに面倒なので > 漢字データベースにある情報、GlyphWikiにあるSVGデータ、花園フォントを利用させていただき、 > 「大漢和辞典 親字と熟語だけ」EPWINGを制作中です。 > 開発中の動作画面はこちら。総画数、大漢和番号、部首別、JIS第1・2漢字で検索、ジャンプできます。 > http://projectzephyr.osdn.jp/img/daikanwa.html > 敢えて外字は使わず、字形画像を大量に使用しています。 > > EPWINGは、90年代に流行し、今も細々と使われている電子辞書フォーマットです。 > http://classicalepwing.osdn.jp/ > http://aozorawing.osdn.jp/ > http://projectzephyr.osdn.jp/ などは、私のEPWINGサイトです。 > > > データを機械処理する過程で気がついた点があり、ご参考までにお知らせ致します。 > なお、私は全くの素人ですので、何か意図してそのようになさっていたのでしたら無視してください。 > > ★dkw2ucs.txtについて(dkw2ucs.txt.patch.txt添付) > dkw2ucs.txtの部首内画数(DSxx)は、(補巻を別として)常にゼロから単調増加のはずですが、 > 突如減っていることがあります。修訂第二版の索引を元に、修正してみました。 > > また、新たな部首番号(DRxx)が現れた時、部首内画数はゼロのはずですが、そうでない箇所が2つありました。 > これは部首番号のミスタイプだろうと思います(修訂第二版でも確認しました)。 > --- dkw2ucs.txt 27 Aug 2016 22:56:00 -0000 1.2 > +++ dkw2ucs.txt 27 Aug 2016 22:58:25 -0000 1.3 > @@ -22018,3 +22018,3 @@ > D21826.0 DR102 DS05 DP08009 U+24C64 > -D21827.0 DR106 DS05 DP08009 U+07560 > +D21827.0 DR102 DS05 DP08009 U+07560 > D21828.0 DR102 DS06 DP08009 U+07561 > @@ -30614,3 +30614,3 @@ > D30328.0 DR135 DS11 DP09826 U+269F1 > -D30329.0 DR138 DS12 DP09826 U+269F4 > +D30329.0 DR135 DS12 DP09826 U+269F4 > D30330.0 DR135 DS12 DP09826 U+08219 > > なお、ページ番号についても単調増加であることをチェックしましたが、問題ありませんでした。 > 親字番号の重複もありませんでした。 > > ★dkw-word.txtについて > DW00035.0.H001 DPH0012 ... > DW01328.0.H001 DPH0072 ... > この2行だけ、H001.0 のような最後の .0 がありませんでした。 > > ★ucs-strokes.txt (UCS画数データベース)について > U+9FC3 8,9 > となっております。 > http://glyphwiki.org/wiki/u9fc3 > https://codepoints.net/U+9FC3 > を見る限り、画数が少なすぎると思います(12画でしょうか)。これは偶然気がついたものです。 > > > ★添付のsoukaku.txt > これは私が作成したデータです。 > > 大漢和辞典の親字で、総画数が不確か・不明であるもの、つまり、 > ・dkw2ucs.txtで、画数不明のUCS文字と関連づけられている > ・dkw2ucs.txtで、UCS文字に関連づけられていない > について、修訂第二版の冒頭索引を参考に、総画数を調べました。 > ucs-strokes.txt のように、あり得る画数(複数の場合在り)ではなく、大漢和辞典の > 総画数一つだけとしています。 > dkw2ucs.txtの1カラム目の番号、総画数、#以降はコメントです。 > Dxxxxx 番号は、部首番号、部首内画数順に並んでいるので、補巻のエントリが途中に > 移動していることもあります。 > GlyphWikiの字形画像について気になった点も、コメントに載せてあります。 > > 実はこの作業過程で、dkw2ucs.txtの部首番号、部首内画数の異常に気がつきました。 > 何かのご参考になりましたらどうぞ。 > > > #今、ヤフオクで落札した、大漢和辞典修訂版(第2版ではありません。かなり使い込まれていて > 索引がぼろぼろのためか、4千円でした)の発送通知が来ました!楽しみです。 > > -- > 大久保克彦 kat...@gm... > > > > ------------------------------------------------------------ > ------------------ > > _______________________________________________ > Kanji-database-contact mailing list > Kan...@li... > https://lists.sourceforge.net/lists/listinfo/kanji-database-contact > > -- --------------------------------------------------------------------- 川幡 太一 (KAWABATA, Taichi) E-mail: kaw...@gm... |
|
From: Katsuhiko O. <kat...@gm...> - 2016-09-01 10:46:22
|
漢字データベース開発者のみなさま まずは、このようなデータを再利用可能な形で公開してくださいましたこと、 深くお礼申し上げます。大変な時間と手間を掛けられたこととお察しします。 私は、様々な言語の電子辞書やテキスト化などを趣味としております大久保と申します。 春に大槻文彦『言海』の全文テキスト化を始めました( http://genkai.osdn.jp/ )。 その過程で度々図書館に通って大漢和辞典を参照していたのですが、余りに面倒なので 漢字データベースにある情報、GlyphWikiにあるSVGデータ、花園フォントを利用させていただき、 「大漢和辞典 親字と熟語だけ」EPWINGを制作中です。 開発中の動作画面はこちら。総画数、大漢和番号、部首別、JIS第1・2漢字で検索、ジャンプできます。 http://projectzephyr.osdn.jp/img/daikanwa.html 敢えて外字は使わず、字形画像を大量に使用しています。 EPWINGは、90年代に流行し、今も細々と使われている電子辞書フォーマットです。 http://classicalepwing.osdn.jp/ http://aozorawing.osdn.jp/ http://projectzephyr.osdn.jp/ などは、私のEPWINGサイトです。 データを機械処理する過程で気がついた点があり、ご参考までにお知らせ致します。 なお、私は全くの素人ですので、何か意図してそのようになさっていたのでしたら無視してください。 ★dkw2ucs.txtについて(dkw2ucs.txt.patch.txt添付) dkw2ucs.txtの部首内画数(DSxx)は、(補巻を別として)常にゼロから単調増加のはずですが、 突如減っていることがあります。修訂第二版の索引を元に、修正してみました。 また、新たな部首番号(DRxx)が現れた時、部首内画数はゼロのはずですが、そうでない箇所が2つありました。 これは部首番号のミスタイプだろうと思います(修訂第二版でも確認しました)。 --- dkw2ucs.txt 27 Aug 2016 22:56:00 -0000 1.2 +++ dkw2ucs.txt 27 Aug 2016 22:58:25 -0000 1.3 @@ -22018,3 +22018,3 @@ D21826.0 DR102 DS05 DP08009 U+24C64 -D21827.0 DR106 DS05 DP08009 U+07560 +D21827.0 DR102 DS05 DP08009 U+07560 D21828.0 DR102 DS06 DP08009 U+07561 @@ -30614,3 +30614,3 @@ D30328.0 DR135 DS11 DP09826 U+269F1 -D30329.0 DR138 DS12 DP09826 U+269F4 +D30329.0 DR135 DS12 DP09826 U+269F4 D30330.0 DR135 DS12 DP09826 U+08219 なお、ページ番号についても単調増加であることをチェックしましたが、問題ありませんでした。 親字番号の重複もありませんでした。 ★dkw-word.txtについて DW00035.0.H001 DPH0012 ... DW01328.0.H001 DPH0072 ... この2行だけ、H001.0 のような最後の .0 がありませんでした。 ★ucs-strokes.txt (UCS画数データベース)について U+9FC3 8,9 となっております。 http://glyphwiki.org/wiki/u9fc3 https://codepoints.net/U+9FC3 を見る限り、画数が少なすぎると思います(12画でしょうか)。これは偶然気がついたものです。 ★添付のsoukaku.txt これは私が作成したデータです。 大漢和辞典の親字で、総画数が不確か・不明であるもの、つまり、 ・dkw2ucs.txtで、画数不明のUCS文字と関連づけられている ・dkw2ucs.txtで、UCS文字に関連づけられていない について、修訂第二版の冒頭索引を参考に、総画数を調べました。 ucs-strokes.txt のように、あり得る画数(複数の場合在り)ではなく、大漢和辞典の 総画数一つだけとしています。 dkw2ucs.txtの1カラム目の番号、総画数、#以降はコメントです。 Dxxxxx 番号は、部首番号、部首内画数順に並んでいるので、補巻のエントリが途中に 移動していることもあります。 GlyphWikiの字形画像について気になった点も、コメントに載せてあります。 実はこの作業過程で、dkw2ucs.txtの部首番号、部首内画数の異常に気がつきました。 何かのご参考になりましたらどうぞ。 #今、ヤフオクで落札した、大漢和辞典修訂版(第2版ではありません。かなり使い込まれていて 索引がぼろぼろのためか、4千円でした)の発送通知が来ました!楽しみです。 -- 大久保克彦 kat...@gm... |
|
From: <app...@gm...> - 2015-12-08 13:39:23
|
漢字データベース 開発者 様 尾崎と申します。 こちらのメールアドレスで良いか分かりませんが、 「漢字画数データベース」について お聞きしたいことがありメール致しました。 http://kanji-database.sourceforge.net/misc/strokes.html こちらで公開されている「UCS画数データ」のライセンスは、 GPLライセンスもしくはMITライセンスのどちらになるでしょうか? 使用させていただくと決めたわけではありませんが、 ライセンスの状況によっては検討していきたいと思います。 お忙しいところ申し訳ございませんが、 ご確認のうえご回答くださいますようお願い申し上げます。 尾崎 iPhoneから送信 |
|
From: kawabata t. <kaw...@gm...> - 2015-09-25 15:31:56
|
Dear Tsui,
IPA data in "sbgy.xml" is totally made up by myself, based on survey on
several papers and web infomations. Of course, as there is no way to record
the pronunciation of Middle-Aged Chinese, this is an tentative assumption.
It is especially heavily based on 漢語史稿 by 王力 (Chapter 2, Section 10).
Here I attach biblatex bibliography data file which I referred when I tried
to
create IPA data (and various other Web infos, too.)
Regards,
@Book{4472014793,
title = {金田一春彦著作集. 第9巻},
sorttitle = {キンダイチ ハルヒコ チョサクシュウ. ダイ 9カン},
author = {金田一 春彦 (1913-2004) },
sortname = {キンダイチ, ハルヒコ (1913-2004) },
date = {2005-9},
publisher = {玉川大学出版部},
location = {町田},
size = {654p ; 22cm},
price = {本体価格 : 8500円},
language = {JPN},
isbn = {4-472-01479-3},
url = {
http://api.porta.ndl.go.jp/ndlopac/cgi-bin/ndlopac/ndl-book?kywd=20887914},
note = {肖像あり},
ndc = {810. 8},
ndlcn = {KF21-H137},
ndlsh = {日本語∥アクセント},
nbn = {jp-20887914},
size = {654p ; 22cm},
contents = {論文拾遺:補忘記の研究續貂. 移りゆく東京アクセント. 東京語アクセントの再検討. 日本四声古義.
日本語のアクセントから中国唐時代の四声値を推定する. 平曲の音声. 音韻史資料としての真言声明. 契沖の仮名遺書所載の国語アクセント.
類聚名義抄和訓に施されたる声符に就て. 金光明最勝王経音義に見える一種の万葉仮名遣について. 平声軽の声点について.
国語アクセント史の研究が何に役立つか. 古代アクセントから近代アクセントへ. 国語のアクセントの時代的変遷. 去声点ではじまる語彙について.
現代諸方言の比較から觀た平安朝アクセント. 奈良・平安・室町時代の日本語を再現する. 朗読源氏物語. 平家語釈僻案抄.
埼玉縣下に分布する特殊アクセントの考察}
}
@Article{,
title = {漢音の声明とその声調},
sorttitle = {カンオン ノ セイメイ ト ソノ セイチョウ},
author = {頼 惟勤},
volume = {1951-03, (通号 17・18)},
pages = {1 -- 46},
journaltitle = {言語研究},
date = {1951-03},
publisher = {日本言語学会 / 日本言語学会 編},
issn = {0024-3914},
url = {http://opac.ndl.go.jp/articleid/5253152/jpn},
ndlcn = {Z12-71}
}
@Book{,
title = {漢語史稿. 上冊},
sorttitle = {カンゴシ コウ. 1},
author = {王 力 (1901-1986) },
sortname = {オウ, リキ (1901-1986) },
date = {1957},
publisher = {科学出版社},
location = {北京},
size = {209p ; 21cm},
language = {CHI},
url = {
http://api.porta.ndl.go.jp/ndlopac/cgi-bin/ndlopac/ndl-book?kywd=57013085},
file = {http://bjkoro.net/chinese/7-101-01553-0/index.html},
ndc = {820. 2},
ndlcn = {820. 2-O145k},
ndlsh = {中国語∥歴史},
nbn = {jp-57013085},
size = {209p ; 21cm}
}
@Book{,
title = {漢語史稿. 中冊},
sorttitle = {カンゴ シコウ. 2},
author = {王 力 (1901-1986) },
sortname = {オウ, リキ (1901-1986) },
date = {1958},
publisher = {科学出版社},
location = {北京},
size = {282p ; 21cm},
language = {CHI},
url = {
http://api.porta.ndl.go.jp/ndlopac/cgi-bin/ndlopac/ndl-book?kywd=59008898},
note = {上海版},
ndc = {820. 2},
ndlcn = {820. 2-O145k},
ndlsh = {中国語∥歴史},
nbn = {jp-59008898},
size = {282p ; 21cm}
}
@Book{,
title = {漢語史稿. 下冊},
sorttitle = {カンゴ シコウ. 3},
author = {王 力 (1901-1986) },
sortname = {オウ, リキ (1901-1986) },
date = {1958},
publisher = {科学出版社},
location = {北京},
size = {122p ; 21cm},
language = {CHI},
url = {
http://api.porta.ndl.go.jp/ndlopac/cgi-bin/ndlopac/ndl-book?kywd=59003182},
ndc = {820. 2},
ndlcn = {820. 2-O145k},
ndlsh = {中国語∥歴史},
nbn = {jp-59003182},
size = {122p ; 21cm}
}
@Article{,
title = {「開合」に就て},
sorttitle = {カイゴウ ニ ツイテ},
author = {豊島 正之},
sortname = {トヨシマ マサユキ},
volume = {1984-03, (通号 136)},
pages = {p152 -- 140},
journaltitle = {国語学},
date = {1984-03},
publisher = {国語学会 / 国語学会 編},
language = {jpn},
issn = {0491-3337},
url = {http://opac.ndl.go.jp/articleid/2655980/jpn},
ndlcn = {Z13-341}
}
On Thu, Sep 24, 2015 at 6:26 PM, Tsui, Tsz-Him <ts...@bu...>
wrote:
> Dear Kanji Database Project,
>
> I'm Tsz-Him Tsui, a PhD student at the Ohio State University. I'm
> interested in using the Songben Guanyun data available on your SourceForge
> site.
>
> May I ask where you have received the IPA transcriptions for the Guangyun
> data from? I'd like to mention which system of reconstruction the database
> is using when I'm presenting my research.
>
> Thank you very much in advance,
> Tsz-Him
>
> --------------------
> Tsz-Him Tsui
> PhD student
> Department of Linguistics
> The Ohio State University
>
>
>
> ------------------------------------------------------------------------------
> _______________________________________________
> Kanji-database-contact mailing list
> Kan...@li...
> https://lists.sourceforge.net/lists/listinfo/kanji-database-contact
>
--
---------------------------------------------------------------------
川幡 太一 (KAWABATA, Taichi) E-mail: kaw...@gm...
|
|
From: Tsui, Tsz-H. <ts...@bu...> - 2015-09-24 10:00:01
|
Dear Kanji Database Project, I'm Tsz-Him Tsui, a PhD student at the Ohio State University. I'm interested in using the Songben Guanyun data available on your SourceForge site. May I ask where you have received the IPA transcriptions for the Guangyun data from? I'd like to mention which system of reconstruction the database is using when I'm presenting my research. Thank you very much in advance, Tsz-Him -------------------- Tsz-Him Tsui PhD student Department of Linguistics The Ohio State University |
|
From: Yutaka O. <ohn...@gm...> - 2015-03-16 16:09:15
|
Niibe さん、 5日ほど前に漢字データベースプロジェクトのことでお便りをいただきました大野です。ありがとうございました。体調を崩していて、お返事が遅くなりました。申し訳ありません。 (私はメーリングリストに入っているわけではないので、たぶん返送されてくると思いますが、リストのほうにも返信しています。なお、私の問い合わせに関しては、川幡さんからも私信にてお返事をいただきました。) JIS X 0213 の制定のころのことや、そもそも規格がどこでだれによって定められたのかなどについて私は全く疎いのですが、富田倫生さんをはじめとする青空文庫呼びかけ人のところには、森光淳司さんというかたを通じて、関係者と何らかのやり取りがあったように聞いています。南方熊楠の「十二支考」の公開が青空文庫で始まっていたが、まだ途中だったので、それまでに公開されたぶんに入っていた漢字は 0213 に入り、当時まだ入力が終わっていなかったぶんのみに出てくる漢字は 0213 に入るのを逃した、みたいな話を聞いたことがあります。オフ会で聞いた伝説のようなものなので、真偽のほどは分かりません… ご存知かと思いますが、青空文庫では現在でも JIS X 0208 の文字集合や包摂規準等を作業指針とし、公開されるファイルにはシフト JIS を使っています。私のような素人の目から見ると、なんか時代に付いて行ききれていない感じがするのですが、(i) 0213 を基準にするには、包摂規準の変わった文字について、底本にあたって確認作業をしなくてはならない。その労力は青空文庫ではまかなえない。(ii) ユニコードの統合基準等は、JIS のものとは全く別物なので、それらを作業指針にするのには無理がある。ということで、身動きが取れなくなっています。富田さんが存命だった間は、彼がしっかりと考えていたので、それでよかったのですが、今は詳しい人が内部にいないので、とりあえず現状維持で、という方針で活動しています。ここらへんのことは必ず議論が繰り返されるので、文字コード等に詳しいかたがたから助言等がいただけるようにしていかなくてはならないなあと考えています。 Niibe さんがメールの最後に書いていらっしゃった著作権保護期間延長のことについても、私はあまり詳しくないのですが、青空文庫の運営に関わっている者の間では、来年(2016年)元旦は大丈夫そうだが、再来年(2017年)は危ないだろうという雰囲気だと言えるように思います。それでも、鈴木大拙に関しては「禅とは何か」と「日本的霊性」の入力にすでに取り組んでいらっしゃるかたがいるようです。 今後とも、よろしくご指導いただければ幸いです。よろしくお願いいたします。 -- Yutaka Ohno ohn...@gm... 2015-03-11 23:04 GMT-04:00 NIIBE Yutaka <gn...@fs...>: > 大野様: > > 青空文庫の活動に敬意を表します。 > > 月の初めにこちらに流れてきたメールが埋もれたままなので、書いてみます。 > > わたくしは、漢字データベースプロジェクトのメーリングリストに参加してま > すが、特に貢献をしているわけではなく、今となっては「なんでここにいるん > だっけ?」というような位置付けのメンバです。 > > On 03/01/2015 12:55 PM, Yutaka Ohno wrote: > > 漢字データベースプロジェクトは富田さんとのやり取りはあったのでしょうか。 > > わたくしの知る限り、特にないと思います。 > > これだけではあまりにもそっけないので、漢字データベースプロジェクトとは > 直接の関連がありませんが、ご挨拶程度になりますが、情報を書きます。 > > > 1997年の JIS X 0208の改訂、2000年の JIS X 0213の制定にかけて、 > 情報規格調査会で、この規格の制定のみならず、ISO/IEC 10646 関連して、ど > うしたものかという活動があり、わたくしは事務局のお手伝いで、当時の通商 > 産業省 工業技術院 標準部 (電気なんでしたっけ? の課です、もしかしたら情 > 報電気規格課だったかも)からの発注で、国内各位にヒアリング、中国に行っ > て書道の達人が見守るフォント作成の現場の見学等の仕事をしたことがありま > す。 > > その際に、芥川賞作家の方、今昔文字鏡、規格制定の委員会に参加いただいた > 大学の先生、産業界各位、などなどは記憶にありますが、富田さんには、標準 > 部はリーチし得ていなかったと思います。 > > わたくし事ですが、鈴木大拙先生没後50年の来年を経る2017年1月1日と、TPP > 関連の対応とどちらが早いぞなもし、と懸念しています。 > -- > g新部 裕 > |
|
From: NIIBE Y. <gn...@fs...> - 2015-03-12 03:33:29
|
大野様: 青空文庫の活動に敬意を表します。 月の初めにこちらに流れてきたメールが埋もれたままなので、書いてみます。 わたくしは、漢字データベースプロジェクトのメーリングリストに参加してま すが、特に貢献をしているわけではなく、今となっては「なんでここにいるん だっけ?」というような位置付けのメンバです。 On 03/01/2015 12:55 PM, Yutaka Ohno wrote: > 漢字データベースプロジェクトは富田さんとのやり取りはあったのでしょうか。 わたくしの知る限り、特にないと思います。 これだけではあまりにもそっけないので、漢字データベースプロジェクトとは 直接の関連がありませんが、ご挨拶程度になりますが、情報を書きます。 1997年の JIS X 0208の改訂、2000年の JIS X 0213の制定にかけて、 情報規格調査会で、この規格の制定のみならず、ISO/IEC 10646 関連して、ど うしたものかという活動があり、わたくしは事務局のお手伝いで、当時の通商 産業省 工業技術院 標準部 (電気なんでしたっけ? の課です、もしかしたら情 報電気規格課だったかも)からの発注で、国内各位にヒアリング、中国に行っ て書道の達人が見守るフォント作成の現場の見学等の仕事をしたことがありま す。 その際に、芥川賞作家の方、今昔文字鏡、規格制定の委員会に参加いただいた 大学の先生、産業界各位、などなどは記憶にありますが、富田さんには、標準 部はリーチし得ていなかったと思います。 わたくし事ですが、鈴木大拙先生没後50年の来年を経る2017年1月1日と、TPP 関連の対応とどちらが早いぞなもし、と懸念しています。 -- g新部 裕 |
|
From: Yutaka O. <ohn...@gm...> - 2015-03-01 03:55:47
|
漢字データベースプロジェクト 御中 はじめてお便りいたします。ごく最近になって、「漢字データベースプロジェクト」の存在をはじめて知りました。整然とした網羅的なお仕事に、ただただ頭が下がります。 私は、青空文庫の「点検チーム」と呼ばれるグループに加わっている大野裕と申します。送られてくるテキストファイルの形式上の不備を直すかたわら、入力や校正を支援するツール作りを行なっています。漢字データベースプロジェクトの資産を活用させていただきたく、そのご挨拶と、いろいろとご指導を仰ぎたく思い、そのお願いのためにこのメールをお送りすることにいたしました。 一か月ほど前、漢字データベースプロジェクトの存在に気づく前に、必要に迫られて、青空文庫の外字注記の検索ツールというのを作りました。これです: http://eunheui.sakura.ne.jp/aozora/gaijichuki.html 既に公開されていたネット上の情報にもっと注意を払っていれば「車輪を再発明する」ようなことは避けられたのにと、悔やまれてなりません。 ご存知のように、青空文庫を牽引してきた富田倫生さんが一昨年に他界されました。私自身、青空文庫や富田さんとの付き合いは十年以上になるのですが、日々の運営に関わるようになったのは、彼の死後です。彼が窓口になって進めていた青空文庫の「外」のかたがたとの連携については、流れが断ち切られてしまった感じで、彼が関わっていた技術的なことの多くが受け継がれずにいます。漢字データベースプロジェクトは富田さんとのやり取りはあったのでしょうか。もし経緯等について差し支えない範囲でお教えいただければ、とてもうれしいです。 ぶしつけなメールになってしまいましたが、よろしくお願いいたします。 -- Yutaka Ohno ohn...@gm... |
|
From: KOMURA T. <ko...@me...> - 2013-11-28 11:58:15
|
川幡様 古村です. お忙しいところお返事ありがとうございます. https://github.com/cjkvi/ からデータを確認できました. さっそく利用させて頂きます. どうもありがとうございました. ---- _θθ_ |古村 隆明 @ 京都大学情報環境機構 IT企画室 | (≡⊥≡)○|KOMURA Takaaki <ko...@me...>| ○~=Θ=/ | tel: 075-753-7429 fax: 075-753-7438 | From: kawabata taichi <kaw...@gm...> Date: Thu, 28 Nov 2013 18:04:40 +0900 >川幡です。 > >連絡が遅れまして申し訳ありません。 >github では、 > >https://github.com/cjkvi/ > >に引っ越したのですが、ホームページの更新が滞っている状態です。 >更新をすっかり忘れていたのですが、できるだけ近いうちに >修正したいと思います。 > >宜しくお願いいたします。 > > >2013年11月25日 4:34 KOMURA Takaaki <ko...@me...>: > >> 漢字データベースプロジェクト御中 >> >> 京都大学の古村と申します. >> >> 異体字の処理を行う必要があり,検索したところ漢字データベースプロ >> ジェクトのページに辿り着きました. >> このようなデータを整備して頂いていること,感謝いたします. >> >> ところで,異体字のデータを利用させて頂こうと思ったのですが, >> http://kanji-database.sourceforge.net/variants/variants.html >> から, >> https://github.com/kawabata/kanji-database-variants >> へのリンクを辿るとリンク切れになっていました. >> >> github で誰か fork しているかと思って探してみましたが,同名のプロ >> ジェクトは見当たりませんでした. >> 異体字データを是非利用させて頂きたいので,再度公開して頂くことは >> できるでしょうか? >> >> ---- >> _θθ_ |古村 隆明 @ 京都大学情報環境機構 IT企画室 | >> (≡⊥≡)○|KOMURA Takaaki <ko...@me...>| >> ○~=Θ=/ | tel: 075-753-7429 fax: 075-753-7438 | >> >> >> ------------------------------------------------------------------------------ >> Rapidly troubleshoot problems before they affect your business. Most IT >> organizations don't have a clear picture of how application performance >> affects their revenue. With AppDynamics, you get 100% visibility into your >> Java,.NET, & PHP application. Start your 15-day FREE TRIAL of AppDynamics >> Pro! >> http://pubads.g.doubleclick.net/gampad/clk?id=84349351&iu=/4140/ostg.clktrk >> _______________________________________________ >> Kanji-database-contact mailing list >> Kan...@li... >> https://lists.sourceforge.net/lists/listinfo/kanji-database-contact >> > > > >-- >--------------------------------------------------------------------- >川幡 太一 (KAWABATA, Taichi) E-mail: kaw...@gm... |
|
From: kawabata t. <kaw...@gm...> - 2013-11-28 09:04:48
|
川幡です。 連絡が遅れまして申し訳ありません。 github では、 https://github.com/cjkvi/ に引っ越したのですが、ホームページの更新が滞っている状態です。 更新をすっかり忘れていたのですが、できるだけ近いうちに 修正したいと思います。 宜しくお願いいたします。 2013年11月25日 4:34 KOMURA Takaaki <ko...@me...>: > 漢字データベースプロジェクト御中 > > 京都大学の古村と申します. > > 異体字の処理を行う必要があり,検索したところ漢字データベースプロ > ジェクトのページに辿り着きました. > このようなデータを整備して頂いていること,感謝いたします. > > ところで,異体字のデータを利用させて頂こうと思ったのですが, > http://kanji-database.sourceforge.net/variants/variants.html > から, > https://github.com/kawabata/kanji-database-variants > へのリンクを辿るとリンク切れになっていました. > > github で誰か fork しているかと思って探してみましたが,同名のプロ > ジェクトは見当たりませんでした. > 異体字データを是非利用させて頂きたいので,再度公開して頂くことは > できるでしょうか? > > ---- > _θθ_ |古村 隆明 @ 京都大学情報環境機構 IT企画室 | > (≡⊥≡)○|KOMURA Takaaki <ko...@me...>| > ○~=Θ=/ | tel: 075-753-7429 fax: 075-753-7438 | > > > ------------------------------------------------------------------------------ > Rapidly troubleshoot problems before they affect your business. Most IT > organizations don't have a clear picture of how application performance > affects their revenue. With AppDynamics, you get 100% visibility into your > Java,.NET, & PHP application. Start your 15-day FREE TRIAL of AppDynamics > Pro! > http://pubads.g.doubleclick.net/gampad/clk?id=84349351&iu=/4140/ostg.clktrk > _______________________________________________ > Kanji-database-contact mailing list > Kan...@li... > https://lists.sourceforge.net/lists/listinfo/kanji-database-contact > -- --------------------------------------------------------------------- 川幡 太一 (KAWABATA, Taichi) E-mail: kaw...@gm... |
|
From: KOMURA T. <ko...@me...> - 2013-11-24 19:56:55
|
漢字データベースプロジェクト御中 京都大学の古村と申します. 異体字の処理を行う必要があり,検索したところ漢字データベースプロ ジェクトのページに辿り着きました. このようなデータを整備して頂いていること,感謝いたします. ところで,異体字のデータを利用させて頂こうと思ったのですが, http://kanji-database.sourceforge.net/variants/variants.html から, https://github.com/kawabata/kanji-database-variants へのリンクを辿るとリンク切れになっていました. github で誰か fork しているかと思って探してみましたが,同名のプロ ジェクトは見当たりませんでした. 異体字データを是非利用させて頂きたいので,再度公開して頂くことは できるでしょうか? ---- _θθ_ |古村 隆明 @ 京都大学情報環境機構 IT企画室 | (≡⊥≡)○|KOMURA Takaaki <ko...@me...>| ○~=Θ=/ | tel: 075-753-7429 fax: 075-753-7438 | |
|
From: suzuki t. <mps...@hi...> - 2013-01-04 02:31:44
|
I got a response from Professor Kiyonori Nagasaki, the delegate from SAT to IRG; SAT is going to register a glyph shaped like ⿰口芉 as a variant of U+54F6, although concrete schedule of the registration is not discussed yet. Regards, mpsuzuki suzuki toshiya wrote: > It seems that > http://chise.org/chisewiki/view.cgi?character=rep.cbeta:0x94A > was taken from Taisho Tripitaka. Please find attached JPEG. > I will ask whether SAT experts want to register it to IVS. > > Regards, > mpsuzuki > > suzuki toshiya wrote: >> Mitrophan Chin wrote: >>> Thanks. The link to the variant dictionary in Taiwan was helpful. Are >>> there any plans to put any or all those variants from that website >>> into Unicode Ideographic Variation Database or integrate the variant >>> mappings with http://www.unicode.org/charts/unihan.html ? >> >> Yes. At last IRG#39 (on November, Hanoi), >> TCA has submitted 4000 characters to Ext. F that are taken from >> the variant dictionary and scheduled to be coded in CNS 11643, >> but, their submission was without the printing typeface fonts, and >> without IDS. >> As a result, all TCA submission was dropped :-( >> It was a pity. >> >> However, even if they are coded in ISO/IEC 10646, I'm suspicious >> whether the variant dictionary website will have better interface >> to lookup the variants from UCS codepoints. >> >>> >>> In my evidence the character also appears as part of 錫⿰口芉汶, >>> which is the name of the Prophet Simeon (Συμεών in Greek/Симеон in >>> Cyrillic) who in his elderly age was awaiting to meet the small child >>> Jesus being presented at the Temple (cf. Luke 2:25). So based on the >>> pronunciation of the name Simeon, I think ⿰口芉 can be unified with >>> 哶. So if we want to display 哶 with the glyph rendered from ⿰口芉, >>> is that where IVD plays that role and is it supported by major web >>> browsers? >> >> I think using IVS is better than the separated encoding of the >> character (because of same pronunciation). Of course, UTC can >> propose to encode it to CJK Compatibility Ideographs, but it >> would not be welcomed much because compatibility ideograph block is >> now recognized as a compatibility with existing legacy encoding >> in existing systems. >> >> You may ask "how to register ⿰口芉 to IVS?". At present, I don't >> have good idea on proper process. The original genuine process was >> the registration with fee, but recently the registration without >> fee is discussed. >> >> I will try to find ⿰口芉 in Taisho Tripitaka and ask SAT experts >> whether they are interested in the registration of ⿰口芉 glyph shape >> in IVD, as an alternate form for U+54F6. If they are interested in, >> you would not have to do anything :-) >> >> Regards, >> mpsuzuki >> >> >>> >>> >>> >>> >>> ________________________________ >>> From: suzuki toshiya <mps...@hi...> >>> To: Mitrophan Chin <stm...@ya...> Cc: >>> "kan...@li..." >>> <kan...@li...>; Yuri Shardt >>> <yur...@gm...> Sent: Thursday, January 3, 2013 10:18 AM >>> Subject: Re: >>> http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf >>> >>> Hi, >>> >>> Sorry for lazy response! >>> >>> Talking about the glyph shapes between 哶(U+54F6) and >>> CB02378/HZK02-D0A1, >>> the info that CHISE provides is only where CHISE picked it from, so it's >>> not fruitful to discuss whether they are same or not. >>> >>> The right component of CB02378/HZK02-D0A1 is looking like as if it were >>> 芉(U+8289) (ah, CHISE's IDS does so), a composition of "grass" (upper) + >>> sound "gan" (or "kan") (lower). But, the right component of 哶(U+ >>> 54F6) is slightly >>> different; it is an alternate form of sheep "羊". In fact, the sound of >>> 哶(U+54F6) is "mie" or "me", different from the sound of 芉(U+8289). >>> For further information of the background of U+54F6, >>> http://dict.variants.moe.edu.tw/yitia/fra/fra03217.htm >>> would be helpful. >>> >>> I don't know how many IRG experts are aware of the semantic & phonetic >>> difference between the right component of 芉(U+8289) and 哶(U+54F6), >>> but, >>> if you propose the character with only the scanned image evidence, >>> somebody will ask whether it could not be unified with U+54F6. >>> Thus, it is expected to find the meaning or the pronunciation of it. >>> CHISE is not helpful at all for such purpose. Is it possible to identify >>> the pronunciation of the character in your evidence? If it is NOT >>> mie/me, >>> the pronunciation difference could be a reason to encode it separately, >>> if you want to encode it separately. >>> >>> # I guess, CB02378 might have been picked by CBETA project from some >>> # Buddhist sutra or Taisho Tripitaka, so, it could be a poorly >>> typecasted >>> # result of U+54F6. Anyway, CHISE does not identify the character in >>> *your* evidence. >>> >>> Regards, >>> mpsuzuki >>> >>> Mitrophan Chin wrote: >>>> Suzuki, >>>> >>>> Do you know if this >>>> characterhttp://www.chise.org/chisewiki/view.cgi?char=&CB02378; >>>> which also looks like >>>> http://www.chise.org/chisewiki/view.cgi?char=&HZK02-D0A1; if they >>>> areunified or same kanji with 哶 or will they be separately encoded >>>> by IRG or Unicode? If they are not unifiable and have not already >>>> been submitted to IRG or UTC already >>>> to be encoded, I would like include it for Russian Mission >>>> character submission to UTC as well for proper name transliteration >>>> appearing on >>>> http://orthodox.cn/liturgical/festalmenaion/1884/0202meetinglord/jpg/0202-01.jpg >>>> >>>> >>>> -Mitrophan >>>> >>>> >>>> >>>> ________________________________ >>>> From: suzuki toshiya <mps...@hi...> >>>> To: Mitrophan Chin <stm...@ya...> Cc: >>>> "kan...@li..." >>>> <kan...@li...> Sent: Monday, >>>> December 17, 2012 8:19 AM >>>> Subject: Re: >>>> http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf >>>> >>>>> Attached is some documented example evidence of the use of the >>>>> un-coded characters. >>>>> They were specifically introduced by the Russian Orthodox Mission >>>>> in China at the >>>>> turn of the 19th century to assist in transliterating Slavonic >>>>> names into Chinese. >>>> Quite interesting! When I saw your IDSes, my impression was "these >>>> are something >>>> like Vietnamese ChuNom, or, the pronunciation transliterating >>>> characters in old >>>> Bhuddist texts, because, it's difficult to distinguish the meaning >>>> and pronunciation >>>> components". It's reasonable to hear that they are for the >>>> transliteration of >>>> Slavonic names. But, seeing "利爾" and "羅爾" examples, I'm not sure >>>> why "爾" was >>>> added. "利" already instructs a pronunciation "ri", and "羅" already >>>> instructs "ro" >>>> (or "ra", in Japan), so why "爾" is needed? >>>> >>>> I guess most easiest way to add your characters to next CJK Ext. G >>>> would be the >>>> submission via UTC. So... you will be needed to write some documents >>>> to propose >>>> the inclusion of your characters to UTC's CJK Ext. G submission. >>>> Jenkins already >>>> posted the short how-to in the forum. >>>> >>>> Now CJK Ext. F is just beginning, so, it would not be impossible for >>>> Russia to >>>> participate IRG and submit something to CJK Ext. G, but I'm afraid >>>> that Russian >>>> national body is not active participants in face to face meeting of >>>> ISO/IEC >>>> JTC1/SC2, so making Russian national body submit your characters >>>> would not be >>>> so easy. >>>> >>>> Regards, >>>> mpsuzuki >> >> > > |
|
From: suzuki t. <mps...@hi...> - 2013-01-03 17:07:33
|
TCA will resubmit 4000 characters with completed form (printing typeface fonts, IDS, etc), they said so. The registration to IVD/IVS does not request the submission of IDS. Regards, mpsuzuki Mitrophan Chin wrote: > Thanks. > > So for the 4000 variants characters that were dropped from CJK ext. F, are those to be resubmitted to ext. G with printing typeface fonts, and IDS, or will they be submitted to IVS? Which is the preferred approach by IRG for adding variant characters? Does submission to IVS also require printing typeface fonts, and IDS to be included with submission? > > > > > ________________________________ > From: suzuki toshiya <mps...@hi...> > To: Mitrophan Chin <stm...@ya...> > Cc: "kan...@li..." <kan...@li...>; Yuri Shardt <yur...@gm...> > Sent: Thursday, January 3, 2013 11:32 AM > Subject: Re: http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf > > It seems that > http://chise.org/chisewiki/view.cgi?character=rep.cbeta:0x94A > was taken from Taisho Tripitaka. Please find attached JPEG. > I will ask whether SAT experts want to register it to IVS. > > Regards, > mpsuzuki > > suzuki toshiya wrote: >> Mitrophan Chin wrote: >>> Thanks. The link to the variant dictionary in Taiwan was helpful. Are there any plans to put any or all those variants from that website into Unicode Ideographic Variation Database or integrate the variant mappings with http://www.unicode.org/charts/unihan.html ? >> Yes. At last IRG#39 (on November, Hanoi), >> TCA has submitted 4000 characters to Ext. F that are taken from >> the variant dictionary and scheduled to be coded in CNS 11643, >> but, their submission was without the printing typeface fonts, and without IDS. >> As a result, all TCA submission was dropped :-( >> It was a pity. |
|
From: Mitrophan C. <stm...@ya...> - 2013-01-03 16:48:17
|
Thanks. So for the 4000 variants characters that were dropped from CJK ext. F, are those to be resubmitted to ext. G with printing typeface fonts, and IDS, or will they be submitted to IVS? Which is the preferred approach by IRG for adding variant characters? Does submission to IVS also require printing typeface fonts, and IDS to be included with submission? ________________________________ From: suzuki toshiya <mps...@hi...> To: Mitrophan Chin <stm...@ya...> Cc: "kan...@li..." <kan...@li...>; Yuri Shardt <yur...@gm...> Sent: Thursday, January 3, 2013 11:32 AM Subject: Re: http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf It seems that http://chise.org/chisewiki/view.cgi?character=rep.cbeta:0x94A was taken from Taisho Tripitaka. Please find attached JPEG. I will ask whether SAT experts want to register it to IVS. Regards, mpsuzuki suzuki toshiya wrote: > Mitrophan Chin wrote: >> Thanks. The link to the variant dictionary in Taiwan was helpful. Are there any plans to put any or all those variants from that website into Unicode Ideographic Variation Database or integrate the variant mappings with http://www.unicode.org/charts/unihan.html ? > > Yes. At last IRG#39 (on November, Hanoi), > TCA has submitted 4000 characters to Ext. F that are taken from > the variant dictionary and scheduled to be coded in CNS 11643, > but, their submission was without the printing typeface fonts, and without IDS. > As a result, all TCA submission was dropped :-( > It was a pity. |
|
From: suzuki t. <mps...@hi...> - 2013-01-03 16:33:05
|
It seems that http://chise.org/chisewiki/view.cgi?character=rep.cbeta:0x94A was taken from Taisho Tripitaka. Please find attached JPEG. I will ask whether SAT experts want to register it to IVS. Regards, mpsuzuki suzuki toshiya wrote: > Mitrophan Chin wrote: >> Thanks. The link to the variant dictionary in Taiwan was helpful. Are >> there any plans to put any or all those variants from that website >> into Unicode Ideographic Variation Database or integrate the variant >> mappings with http://www.unicode.org/charts/unihan.html ? > > Yes. At last IRG#39 (on November, Hanoi), > TCA has submitted 4000 characters to Ext. F that are taken from > the variant dictionary and scheduled to be coded in CNS 11643, > but, their submission was without the printing typeface fonts, and > without IDS. > As a result, all TCA submission was dropped :-( > It was a pity. > > However, even if they are coded in ISO/IEC 10646, I'm suspicious > whether the variant dictionary website will have better interface > to lookup the variants from UCS codepoints. > >> >> In my evidence the character also appears as part of 錫⿰口芉汶, which >> is the name of the Prophet Simeon (Συμεών in Greek/Симеон in Cyrillic) >> who in his elderly age was awaiting to meet the small child Jesus >> being presented at the Temple (cf. Luke 2:25). So based on the >> pronunciation of the name Simeon, I think ⿰口芉 can be unified with >> 哶. So if we want to display 哶 with the glyph rendered from ⿰口芉, >> is that where IVD plays that role and is it supported by major web >> browsers? > > I think using IVS is better than the separated encoding of the > character (because of same pronunciation). Of course, UTC can > propose to encode it to CJK Compatibility Ideographs, but it > would not be welcomed much because compatibility ideograph block is > now recognized as a compatibility with existing legacy encoding > in existing systems. > > You may ask "how to register ⿰口芉 to IVS?". At present, I don't > have good idea on proper process. The original genuine process was > the registration with fee, but recently the registration without > fee is discussed. > > I will try to find ⿰口芉 in Taisho Tripitaka and ask SAT experts > whether they are interested in the registration of ⿰口芉 glyph shape > in IVD, as an alternate form for U+54F6. If they are interested in, > you would not have to do anything :-) > > Regards, > mpsuzuki > > >> >> >> >> >> ________________________________ >> From: suzuki toshiya <mps...@hi...> >> To: Mitrophan Chin <stm...@ya...> Cc: >> "kan...@li..." >> <kan...@li...>; Yuri Shardt >> <yur...@gm...> Sent: Thursday, January 3, 2013 10:18 AM >> Subject: Re: >> http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf >> >> Hi, >> >> Sorry for lazy response! >> >> Talking about the glyph shapes between 哶(U+54F6) and CB02378/HZK02-D0A1, >> the info that CHISE provides is only where CHISE picked it from, so it's >> not fruitful to discuss whether they are same or not. >> >> The right component of CB02378/HZK02-D0A1 is looking like as if it were >> 芉(U+8289) (ah, CHISE's IDS does so), a composition of "grass" (upper) + >> sound "gan" (or "kan") (lower). But, the right component of 哶(U+54F6) >> is slightly >> different; it is an alternate form of sheep "羊". In fact, the sound of >> 哶(U+54F6) is "mie" or "me", different from the sound of 芉(U+8289). >> For further information of the background of U+54F6, >> http://dict.variants.moe.edu.tw/yitia/fra/fra03217.htm >> would be helpful. >> >> I don't know how many IRG experts are aware of the semantic & phonetic >> difference between the right component of 芉(U+8289) and 哶(U+54F6), but, >> if you propose the character with only the scanned image evidence, >> somebody will ask whether it could not be unified with U+54F6. >> Thus, it is expected to find the meaning or the pronunciation of it. >> CHISE is not helpful at all for such purpose. Is it possible to identify >> the pronunciation of the character in your evidence? If it is NOT mie/me, >> the pronunciation difference could be a reason to encode it separately, >> if you want to encode it separately. >> >> # I guess, CB02378 might have been picked by CBETA project from some >> # Buddhist sutra or Taisho Tripitaka, so, it could be a poorly typecasted >> # result of U+54F6. Anyway, CHISE does not identify the character in >> *your* evidence. >> >> Regards, >> mpsuzuki >> >> Mitrophan Chin wrote: >>> Suzuki, >>> >>> Do you know if this >>> characterhttp://www.chise.org/chisewiki/view.cgi?char=&CB02378; which >>> also looks like >>> http://www.chise.org/chisewiki/view.cgi?char=&HZK02-D0A1; if they >>> areunified or same kanji with 哶 or will they be separately encoded >>> by IRG or Unicode? If they are not unifiable and have not already >>> been submitted to IRG or UTC already >>> to be encoded, I would like include it for Russian Mission >>> character submission to UTC as well for proper name transliteration >>> appearing on >>> http://orthodox.cn/liturgical/festalmenaion/1884/0202meetinglord/jpg/0202-01.jpg >>> >>> >>> -Mitrophan >>> >>> >>> >>> ________________________________ >>> From: suzuki toshiya <mps...@hi...> >>> To: Mitrophan Chin <stm...@ya...> Cc: >>> "kan...@li..." >>> <kan...@li...> Sent: Monday, December >>> 17, 2012 8:19 AM >>> Subject: Re: >>> http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf >>> >>>> Attached is some documented example evidence of the use of the >>>> un-coded characters. >>>> They were specifically introduced by the Russian Orthodox Mission in >>>> China at the >>>> turn of the 19th century to assist in transliterating Slavonic names >>>> into Chinese. >>> Quite interesting! When I saw your IDSes, my impression was "these >>> are something >>> like Vietnamese ChuNom, or, the pronunciation transliterating >>> characters in old >>> Bhuddist texts, because, it's difficult to distinguish the meaning >>> and pronunciation >>> components". It's reasonable to hear that they are for the >>> transliteration of >>> Slavonic names. But, seeing "利爾" and "羅爾" examples, I'm not sure >>> why "爾" was >>> added. "利" already instructs a pronunciation "ri", and "羅" already >>> instructs "ro" >>> (or "ra", in Japan), so why "爾" is needed? >>> >>> I guess most easiest way to add your characters to next CJK Ext. G >>> would be the >>> submission via UTC. So... you will be needed to write some documents >>> to propose >>> the inclusion of your characters to UTC's CJK Ext. G submission. >>> Jenkins already >>> posted the short how-to in the forum. >>> >>> Now CJK Ext. F is just beginning, so, it would not be impossible for >>> Russia to >>> participate IRG and submit something to CJK Ext. G, but I'm afraid >>> that Russian >>> national body is not active participants in face to face meeting of >>> ISO/IEC >>> JTC1/SC2, so making Russian national body submit your characters >>> would not be >>> so easy. >>> >>> Regards, >>> mpsuzuki > > |
|
From: suzuki t. <mps...@hi...> - 2013-01-03 16:19:52
|
Mitrophan Chin wrote: > Thanks. The link to the variant dictionary in Taiwan was helpful. Are there any plans to put any or all those variants from that website into Unicode Ideographic Variation Database or integrate the variant mappings with http://www.unicode.org/charts/unihan.html ? Yes. At last IRG#39 (on November, Hanoi), TCA has submitted 4000 characters to Ext. F that are taken from the variant dictionary and scheduled to be coded in CNS 11643, but, their submission was without the printing typeface fonts, and without IDS. As a result, all TCA submission was dropped :-( It was a pity. However, even if they are coded in ISO/IEC 10646, I'm suspicious whether the variant dictionary website will have better interface to lookup the variants from UCS codepoints. > > In my evidence the character also appears as part of 錫⿰口芉汶, which is the name of the Prophet Simeon (Συμεών in Greek/Симеон in Cyrillic) who in his elderly age was awaiting to meet the small child Jesus being presented at the Temple (cf. Luke 2:25). So based on the pronunciation of the name Simeon, I think ⿰口芉 can be unified with 哶. So if we want to display 哶 with the glyph rendered from ⿰口芉, is that where IVD plays that role and is it supported by major web browsers? I think using IVS is better than the separated encoding of the character (because of same pronunciation). Of course, UTC can propose to encode it to CJK Compatibility Ideographs, but it would not be welcomed much because compatibility ideograph block is now recognized as a compatibility with existing legacy encoding in existing systems. You may ask "how to register ⿰口芉 to IVS?". At present, I don't have good idea on proper process. The original genuine process was the registration with fee, but recently the registration without fee is discussed. I will try to find ⿰口芉 in Taisho Tripitaka and ask SAT experts whether they are interested in the registration of ⿰口芉 glyph shape in IVD, as an alternate form for U+54F6. If they are interested in, you would not have to do anything :-) Regards, mpsuzuki > > > > > ________________________________ > From: suzuki toshiya <mps...@hi...> > To: Mitrophan Chin <stm...@ya...> > Cc: "kan...@li..." <kan...@li...>; Yuri Shardt <yur...@gm...> > Sent: Thursday, January 3, 2013 10:18 AM > Subject: Re: http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf > > Hi, > > Sorry for lazy response! > > Talking about the glyph shapes between 哶(U+54F6) and CB02378/HZK02-D0A1, > the info that CHISE provides is only where CHISE picked it from, so it's > not fruitful to discuss whether they are same or not. > > The right component of CB02378/HZK02-D0A1 is looking like as if it were > 芉(U+8289) (ah, CHISE's IDS does so), a composition of "grass" (upper) + > sound "gan" (or "kan") (lower). But, the right component of 哶(U+54F6) is slightly > different; it is an alternate form of sheep "羊". In fact, the sound of > 哶(U+54F6) is "mie" or "me", different from the sound of 芉(U+8289). > For further information of the background of U+54F6, > http://dict.variants.moe.edu.tw/yitia/fra/fra03217.htm > would be helpful. > > I don't know how many IRG experts are aware of the semantic & phonetic > difference between the right component of 芉(U+8289) and 哶(U+54F6), but, > if you propose the character with only the scanned image evidence, > somebody will ask whether it could not be unified with U+54F6. > Thus, it is expected to find the meaning or the pronunciation of it. > CHISE is not helpful at all for such purpose. Is it possible to identify > the pronunciation of the character in your evidence? If it is NOT mie/me, > the pronunciation difference could be a reason to encode it separately, > if you want to encode it separately. > > # I guess, CB02378 might have been picked by CBETA project from some > # Buddhist sutra or Taisho Tripitaka, so, it could be a poorly typecasted > # result of U+54F6. Anyway, CHISE does not identify the character in *your* evidence. > > Regards, > mpsuzuki > > Mitrophan Chin wrote: >> Suzuki, >> >> Do you know if this characterhttp://www.chise.org/chisewiki/view.cgi?char=&CB02378; which also looks like http://www.chise.org/chisewiki/view.cgi?char=&HZK02-D0A1; if they areunified or same kanji with 哶 or will they be separately encoded by IRG or Unicode? >> If they are not unifiable and have not already been submitted to IRG or UTC already >> to be encoded, I would like include it for Russian Mission character submission to UTC as well for proper name transliteration appearing on http://orthodox.cn/liturgical/festalmenaion/1884/0202meetinglord/jpg/0202-01.jpg >> >> -Mitrophan >> >> >> >> ________________________________ >> From: suzuki toshiya <mps...@hi...> >> To: Mitrophan Chin <stm...@ya...> Cc: "kan...@li..." <kan...@li...> Sent: Monday, December 17, 2012 8:19 AM >> Subject: Re: http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf >> >>> Attached is some documented example evidence of the use of the un-coded characters. >>> They were specifically introduced by the Russian Orthodox Mission in China at the >>> turn of the 19th century to assist in transliterating Slavonic names into Chinese. >> Quite interesting! When I saw your IDSes, my impression was "these are something >> like Vietnamese ChuNom, or, the pronunciation transliterating characters in old >> Bhuddist texts, because, it's difficult to distinguish the meaning and pronunciation >> components". It's reasonable to hear that they are for the transliteration of >> Slavonic names. But, seeing "利爾" and "羅爾" examples, I'm not sure why "爾" was >> added. "利" already instructs a pronunciation "ri", and "羅" already instructs "ro" >> (or "ra", in Japan), so why "爾" is needed? >> >> I guess most easiest way to add your characters to next CJK Ext. G would be the >> submission via UTC. So... you will be needed to write some documents to propose >> the inclusion of your characters to UTC's CJK Ext. G submission. Jenkins already >> posted the short how-to in the forum. >> >> Now CJK Ext. F is just beginning, so, it would not be impossible for Russia to >> participate IRG and submit something to CJK Ext. G, but I'm afraid that Russian >> national body is not active participants in face to face meeting of ISO/IEC >> JTC1/SC2, so making Russian national body submit your characters would not be >> so easy. >> >> Regards, >> mpsuzuki |
|
From: Mitrophan C. <stm...@ya...> - 2013-01-03 15:58:36
|
Thanks. The link to the variant dictionary in Taiwan was helpful. Are there any plans to put any or all those variants from that website into Unicode Ideographic Variation Database or integrate the variant mappings with http://www.unicode.org/charts/unihan.html ? In my evidence the character also appears as part of 錫⿰口芉汶, which is the name of the Prophet Simeon (Συμεών in Greek/Симеон in Cyrillic) who in his elderly age was awaiting to meet the small child Jesus being presented at the Temple (cf. Luke 2:25). So based on the pronunciation of the name Simeon, I think ⿰口芉 can be unified with 哶. So if we want to display 哶 with the glyph rendered from ⿰口芉, is that where IVD plays that role and is it supported by major web browsers? ________________________________ From: suzuki toshiya <mps...@hi...> To: Mitrophan Chin <stm...@ya...> Cc: "kan...@li..." <kan...@li...>; Yuri Shardt <yur...@gm...> Sent: Thursday, January 3, 2013 10:18 AM Subject: Re: http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf Hi, Sorry for lazy response! Talking about the glyph shapes between 哶(U+54F6) and CB02378/HZK02-D0A1, the info that CHISE provides is only where CHISE picked it from, so it's not fruitful to discuss whether they are same or not. The right component of CB02378/HZK02-D0A1 is looking like as if it were 芉(U+8289) (ah, CHISE's IDS does so), a composition of "grass" (upper) + sound "gan" (or "kan") (lower). But, the right component of 哶(U+54F6) is slightly different; it is an alternate form of sheep "羊". In fact, the sound of 哶(U+54F6) is "mie" or "me", different from the sound of 芉(U+8289). For further information of the background of U+54F6, http://dict.variants.moe.edu.tw/yitia/fra/fra03217.htm would be helpful. I don't know how many IRG experts are aware of the semantic & phonetic difference between the right component of 芉(U+8289) and 哶(U+54F6), but, if you propose the character with only the scanned image evidence, somebody will ask whether it could not be unified with U+54F6. Thus, it is expected to find the meaning or the pronunciation of it. CHISE is not helpful at all for such purpose. Is it possible to identify the pronunciation of the character in your evidence? If it is NOT mie/me, the pronunciation difference could be a reason to encode it separately, if you want to encode it separately. # I guess, CB02378 might have been picked by CBETA project from some # Buddhist sutra or Taisho Tripitaka, so, it could be a poorly typecasted # result of U+54F6. Anyway, CHISE does not identify the character in *your* evidence. Regards, mpsuzuki Mitrophan Chin wrote: > Suzuki, > > Do you know if this characterhttp://www.chise.org/chisewiki/view.cgi?char=&CB02378; which also looks like http://www.chise.org/chisewiki/view.cgi?char=&HZK02-D0A1; if they areunified or same kanji with 哶 or will they be separately encoded by IRG or Unicode? > If they are not unifiable and have not already been submitted to IRG or UTC already > to be encoded, I would like include it for Russian Mission character submission to UTC as well for proper name transliteration appearing on http://orthodox.cn/liturgical/festalmenaion/1884/0202meetinglord/jpg/0202-01.jpg > > -Mitrophan > > > > ________________________________ > From: suzuki toshiya <mps...@hi...> > To: Mitrophan Chin <stm...@ya...> Cc: "kan...@li..." <kan...@li...> Sent: Monday, December 17, 2012 8:19 AM > Subject: Re: http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg38/IRGN1860_parseIDS.pdf > >> Attached is some documented example evidence of the use of the un-coded characters. >> They were specifically introduced by the Russian Orthodox Mission in China at the >> turn of the 19th century to assist in transliterating Slavonic names into Chinese. > > Quite interesting! When I saw your IDSes, my impression was "these are something > like Vietnamese ChuNom, or, the pronunciation transliterating characters in old > Bhuddist texts, because, it's difficult to distinguish the meaning and pronunciation > components". It's reasonable to hear that they are for the transliteration of > Slavonic names. But, seeing "利爾" and "羅爾" examples, I'm not sure why "爾" was > added. "利" already instructs a pronunciation "ri", and "羅" already instructs "ro" > (or "ra", in Japan), so why "爾" is needed? > > I guess most easiest way to add your characters to next CJK Ext. G would be the > submission via UTC. So... you will be needed to write some documents to propose > the inclusion of your characters to UTC's CJK Ext. G submission. Jenkins already > posted the short how-to in the forum. > > Now CJK Ext. F is just beginning, so, it would not be impossible for Russia to > participate IRG and submit something to CJK Ext. G, but I'm afraid that Russian > national body is not active participants in face to face meeting of ISO/IEC > JTC1/SC2, so making Russian national body submit your characters would not be > so easy. > > Regards, > mpsuzuki |