電子書籍ケーススタディ 14
 世界中のパソコンで日本語を =JiBOOKS=
イースト株式会社 下川 和男

 今回は、昨年12月号でご紹介した「Webサービスとは何か」と2月号の「外字をどうするか? =今昔文字鏡=」を組み合わせたJiBOOKSをご紹介する。JiBOOKSは国立国語研究所さんからの依頼で開発を担当した、海外向け日本語情報配信サーバシステムである。

JiBOOKSとは
 JiBOOKSは、国立国語研究所の横山詔一先生が企画、推進されているシステムで、海外で日本語を勉強する人を対象として、日本語関連の情報をインターネットで提供するプロジェクトの一環として、開発された。
 名称にBOOKSとある通り、日本でどのような書籍が出版されているかを知るためのサイトである。書誌情報の検索には、社団法人日本書籍出版協会のご協力で、本のサーチエンジン「Books」を利用している。Booksには、今、日本で購入が可能な、約60万点の書籍情報が入っており、しかも、月次更新されているので、話題の新刊書なども入っている。

 日本の書籍の検索なら、世界中のインターネットに接続されたパソコンから、BookWEBでもAmazonでもアクセスできる。しかも、インターネット・エクスローラの場合、たとえば、北京大学を見ようと思って、http://www.pku.edu.cn/と入力すると、簡体字のフォントをインストールしますか?というメッセージが表示される。高速回線なら数十秒で中文フォントがダウンロードされ、ブラウザー画面に中国語が現れる。各国語のサイト閲覧には、まことに便利な機能である。
 私は頻繁に海外の展示会に行くが、プレスセンターにはインターネットに繋がったパソコンがずらりと並んでおり、自由に使うことができる。そこで、日本のニュースを知りたいと思い、http://www.asahi.comにアクセスすると、「日本語フォントをダウンロードしますか?」と英語でメッセージが表示され、ダウンロードできる。しかし、これは幸運なケースで、「ダウンロードできません」とのメッセージで、なにやら訳のわからないアルファベットが並んだ文字化けしたAsahi.comが表示される場合も多い。
 前者と後者の違いは、ネットワーク管理者が真剣に仕事をしているか、その場限りの展示会なので、とりあえずの仕事をしているかの違いである。公共の場にあるパソコンに勝手に、数メガバイトのデータをダウンロードするのは、本来は禁止すべきだし、特に、外国語のフォントをインストールすると、文字化けの原因となる。
 また、個人のパソコンでもダイヤルアップで、数メガバイトのファイルをダウンロードするには、多くの時間とプロバイダー料金が必要となる。「欧米はブロードバンドでしょ」と言われそうだが、韓国以外のアジアの国々は、ADSLの整備は遅れているし、光ファイバーなど論外である。

 JiBOOKSは、そのような海外の図書館、学校などの公共の場所や、個人の貧弱な回線や古いパソコンでも日本語の入力や表示できるように工夫されたシステムで、入力はローマ字、表示はビットマップ・フォントを使い、海外のパソコンでの日本語書籍検索を実現している。

 百聞は一見にしかず、以下の手順で実際に使ってみていただきたい。
1.http://www.kokken.go.jp/jibooks へ
2.click hereで、検索画面を表示させる
3.Title:やAuthor:欄に、「ローマ字」で検索したい書名や著者名を入れる
4.Convert into Kanaボタンを押すと、ローマ字がひらがなで表示される
5.Searchボタンを押す
6.該当する日本の書籍が5点ずつ大きな漢字で表示される
 日本語が表示できるブラウザーで操作しても、何の驚きもないが、アジアの片隅のインターネット・カフェで、なみなみと注がれた熱いチャイでも飲みながら、386パソコンの遅い回線からポッポッポッと出てくる大きな漢字を見れば、これは感動ものである。

Webサービスを利用した開発
 このシステムは、「ローマ字変換」、「Books検索」、「フォントサーバ」という三種類のWebサービスの上に構築されている。
 ローマ字変換は、4.でローマ字をひらがなに変換する部分だが、こんな簡単な処理をなぜWebサービスにしたかというと、将来の拡張を考慮したためである。かな漢字変換の辞書を搭載し、本格的な、日本語入力Webサービスを、いつの日か実現させたいと思っている。
 Books検索は、このシステムの核の部分であるが、ここは、最初から別サーバとして設計され、JiBOOKS以外にも、いくつかの案件で使用することになっている。検索部分には、昨年3月号の「三省堂 e辞林」でご紹介した、XMLドキュメントの全文検索エンジン「BTONIC」を使っている。
 フォントサーバは、先月号でご紹介した、文字鏡フォントサーバに、Webサービスのインタフェースを追加した。希望する文字のユニコードやシフトJISコードと文字サイズをXMLでこのサーバに問い合わせると、該当する文字のビットマップ・データがもらえる、という仕組みである。

 VisualStudio.NETという開発環境とC#(シーシャープ)というJavaを拡張した言語を使い、三ヶ月ほどで開発を完了した。と言っても、Books検索とフォントサーバは一年以上前から開発を行っていたので、全体システムの組み込みと稼動確認試験、そしてブラシュアップが主な作業である。
 Webサービスの場合、サーバごとに独立した機能を開発し、それらのサーバを繋ぐ形となるので、プログラムの独立性が従来のサブルーチンやサブシステムよりも高くなり、個々のサーバ試験も行いやすい。
 JiBOOKSは、今後、様々な分野への応用が検討されているが、Books検索部分を他の検索サイトや情報サイトとのWebサービスに変更するだけで、ひらがなの入力と、漢字の表示が可能となる。しかも文字鏡の10万文字が使えるので、中国語や外字にめっぽう強い。

 今後、PDAや携帯電話が進化したインターネット・デバイスが多数登場するが、それらが、インターネット・エクスプローラのような各国語フォントのダウンロード機能を持っていることは稀なので、JiBOOKSの需要は日増しに増加する。今、私の心配は、一般のテキストに比べて、数十倍の容量となるビットマップ・フォントの配信にイーストが所有する実質20メガの回線がいつまで耐えるかである。
 日本語を勉強する多くの人に使ってもらいたいという気持ちと、回線パンクの不安が交錯して、複雑な心境である。

目次へ
Kazuo Shimokawa [EAST Co., Ltd.]