電子書籍ケーススタディ 13
 外字をどうする =今昔文字鏡= 
イースト株式会社 下川 和男

 先月号で、電子書籍やインターネット出版でどのように外字を処理するかを、XKPJepaXでご説明したが、外字についての仕組みや理論をいくら振り回しても、実際にその文字が画面やプリンターに表示できなければ意味がない。今回は、10万もの文字コレクションを誇る、今昔文字鏡をご紹介する。

文字鏡とは何か
 文字鏡は、一種のコンピュータ漢字普及運動のようなプロジェクトである。推進母体は、株式会社エーアイ・ネットで、調査研究的な作業は文字鏡研究会という非営利団体が担当し、販売は紀伊國屋書店が担当している。
 推進者である、エーアイ・ネット古家社長のお話では、16年ほど前に、仏典の複雑な文字をPC-9800の画面に表示したのが起源で、その後、JISにない文字の番号付けとフォントの制作を延々と続けられている。
 文字鏡は、2001年9月現在、以下の文字をサポートしている。

文字の種類文字数
漢字101,936字
非漢字2,382字
梵字1,875字
甲骨文字3,398字
西夏文字6,000字
合計115,591字
文字鏡WEBの検索結果画面
クリックすると拡大します

 文字鏡プロジェクトには、以下のような製品やサービスがある。
●今昔文字鏡CD-ROM
 Windows上で稼動する検索ソフトで、価格は28000円。簡単に言うと、10万文字の文字コード辞典のようなソフトで、漢和辞典風の「読み」や「部首+画数」のほか、「部品(文字の一部分のかたち)」、「英単語」、「ピンイン」、「韓音」、「ISOコード」、「大漢和コード」から、漢字を探し出すことができる。
 漢和辞典といったが、その文字の解説が載っているわけではなく、その文字のJISコード、ユニコード、文字鏡番号を知ることができる。
●文字鏡WEB
 今昔文字鏡CD-ROMのWEB版である。インターネットで文字鏡の文字の検索が行える。アクセス数で課金される方式で、2000回で12000円となっている。
●文字鏡フォント・サーバ
 文字鏡CD-ROMや文字鏡WEBで調べた文字鏡番号を、実際にブラウザー画面に表示させるための仕組みである。インターネットへの常時接続が前提となるが、12、16、24、48、96ドットのビットマップ・フォントを高速に配信するもので、年間200万文字の配信が、100万円となっている。
 文字鏡TrueTypeフォントのように、個々のパソコンのハードディスクを占有することもなく、常に最新のフォントが世界中で受信でき、かつ、外字が必要な場合のみ、リアルタイムに、このサーバが呼び出される。
 様々な文字をブラウザー上に表示するという、至って単純で基礎的な仕組みなので、本来は国家的な機関が管理・運営すべきサーバだが、このような仕組みを国が理解するのは、少し先になるので、当面は営利事業とせざるを得ない。
●筆文字鏡 楷書体
 文字鏡番号に準拠した7万文字の毛筆楷書体フォントセットで、WindowsのシフトJIS、1880文字の外字領域に選択した楷書フォントを登録するツールが付いている。
●悠々漢字術2001 (ISBN:4-314-10142-3)
 文字鏡プロジェクトの紹介本で、付録のCD-ROMには、9万文字をシフトJISの漢字コード領域にマッピングした文字フォントが入っている。このフォントは、WindowsやMacで、書体を切り替えることで、画面表示や印刷が可能である。

 イーストは、文字鏡WEBとフォント・サーバの開発と運営を担当させていただいた。開発は、2000年の春から秋にかけて、半年ほどで行った。
 決済システムは、紀伊國屋さんが持たれているオフラインでの仕組みを使うので、開発していない。
また、「読み」、部首+画数」、「部品」などの検索データベースや、文字鏡番号とユニコード、JISコードなどの変換テーブルは、エーアイ・ネット社のサーバをリアルタイムに呼び出すという、分散処理を行っている。もちろん、このインタフェースにはXMLを使用している。
決済と検索を、他に依存しているシステムであるが、会員登録やアクセス数管理などの管理者画面やユーザ画面を、Javaスクリプトを使ったアクティブ・サーバ・ページというWindows 2000サーバの利用環境で動かしている。
 http://www.mojikyo.com/cat/web/trial.htmで申し込めば、無料トライアルができるので、どんなソフトなのか、体験していただきたい。

文字鏡で何ができるか
 文字鏡の仕組みで嬉しいのは、文字鏡番号を調べるのは有料だが、その後の利用は無料となるところである。書籍「悠々漢字術」に添付されている、TrueTypeフォントは、インターネットから誰でも無料でダウンロードすることができる。
 http://www.mojikyo.org/html/download/にアクセスし、使用許諾条件文を理解した上で、圧縮形式で33ファイル、55メガバイトをダウンロードし、自分のパソコンにTrueTypeフォントとしてインストールすることにより、画面表示や印刷が可能となる。
 この膨大な漢字フォントの無料配布は、欧米でも歓迎されており、スタンフォード大学仏教研究センターが、米国でのダウンロードをボランティアで担当している。

 文字鏡プロジェクトのもう一つの大きなメリットは、「文字鏡にない文字には、文字鏡番号を新たに振り、そのフォントも提供される」という仕組みにある。
 文字鏡研究会に、出典を示して申請すれば、番号が付与される。漢字クイズ風の創作漢字は受け付けてもらえないが、「人名」、「地名」などの証票があれば、問題ない。
 今までに、戦後すべての「国会議事録」や、戦後すべての「官報」などのデジタル化が完了し、イージャパン構想や電子政府を実現するために、今後も様々なドキュメントのデジタル化が行われるが、その際、この申請制度を使えば、「すべての文字のコード化」が可能となる。

 「XMLによる画像参照交換方式」(JIS TR X 0047、http://www.y-adagio.com/public/standards/tr_lsi_xml/lsi_xml.htm)という、XMLドキュメント内での外字画像の表記方法もJIS化されており、着々と、日本固有の外字問題も解決の方向に向かっている。


目次へ
Kazuo Shimokawa [EAST Co., Ltd.]