二月三十日の出来事を収集しています。「二月三十日」
軽便鉄道(廃線跡)を捜し歩いています。「両備軽便鉄道」「鞆軽便鉄道」
中古地図と古写真を頼りに見えない線路、水路、道路、海岸線を訪ねて
現代の風景に蘇らせる実物大パズルです。
最新囲碁ソフトの実力比較テスト。
健康管理の散歩代わりにDIY軽作業。(para1002n)・・・★★★彡・・・
BlogPet「ぷちぷにゅ」の言葉学習テキストとして、日台中共通漢字コード構想を取り上げる。BlogPetはRSSからことば(最近は複数のフレーズ)を採取しているが、投稿記事のはじめから250字分しか反映されない。そこで、本文を三分割して、後から投稿することにした次第。
翻訳ソフトを通じて、日本語を中国語に変換すると、日中共通コード表で表示するので、日本語にない簡体字は空き番号になって「?」が表示される。もう一度、中国語に翻訳すると、「?」はそのまま「?」に対応しているのでもとのコードには戻らない。最初に完全な形で中国語が表示されているからといって、これを中国に送信すれば、相手は中国独自コードで受け取るので、全体が全く分けの分らない文字化けをしてしまう。相手もこちらと同じコード表の日本製のソフトを使う人は、やはり日本人なので、初めから日本語の方がいい。文字化けは、[表示]→[エンコード]→[その他]→[簡体中国語GB2312]とか、[表示]→[エンコード]→[日本語シフトJIS]で巧くいきそうだが、送受信システムはそう簡単にはいかない。日台中完全漢字統合か共通辞書ソフトしかないのです。
中国の文字コード
周到に準備されたGB基本漢字「図解雑学文字コード」加藤弘一著
中国は1981年にGB2312という簡体字コードを制定した(本書ではGB基本漢字と呼ぶ。GBとは国家標準の意味でGuojia biaozhunの略)。GB基本漢字は94x94の文字面を構成するISO 2022系文字コードで、最初に記号類、数字、アルファベット、ピンイン、注音字母など非漢字を置き、JIS基本漢字同様、16区から漢字領域になる。漢字は使用頻度の高い第一級漢字3,755字と、低い第二級漢字3,008字に分かれ、第一級漢字はピンイン順、第二級漢字は部首順に配列している。
JIS基本漢字の影響が顕著だが、それも当然で、78JIS原案委員会の西村恕彦ら中心的な委員を制定直後に招聘し、翌年にはJIS批判派と目されていた田嶋一夫を招いて、JIS基本漢字の設計思想と問題点について、詳しく教えを受けている。漢字の選定・振り分けに当たっては頻度調査を実施している。
GB基本漢字は基本集という位置付けであり、最初から補助集を作ることになっていた。1987年に二つの補助集が作られ、2万字を超える簡体字が符号化された。簡体字コードに相当する伝統字版補助集も作られたが、文字コードを切り替えるだけで、簡体字と伝統字を変換できるよう、「bei=(貝の中国簡体字)」の位置に「貝」を置くというように、マッピングを同じにしている。