電子書籍ケーススタディ 23
 世界最大の音楽事典 =GroveMusic.jp=
イースト株式会社 下川 和男

 今回は、昨年11月に販売が開始された、ニューグローヴ世界音楽大事典Web をご紹介する。2年かけて完成した世界最大のクラシック音楽事典の開発には多くの困難があったが、何とか販売を開始することができた。

ニューグローヴ音楽事典
 ニューグローヴ音楽事典の歴史は、1800年代に遡る。ロンドンのロイヤル音楽カレッジの校長も務めたグローヴ卿が、全四巻の音楽事典を1878年から1890年にかけて、マクミラン社から出版した。その後、第5版まで版を重ね、1980年、全20巻の「The New Grove」として内容が一新された。

 これを日本語に翻訳し、日本固有の情報を追加したのが、講談社が1992年に刊行した「ニューグローヴ世界音楽大事典」である。本巻21巻、別巻2巻で、並べると1メートル以上になる。ちょっとした百科事典と同じ規模である。本巻総頁数は12000、本文8ポイントで22字詰め、65行、3段組みで、ぎっしり文字が詰まっている。

 見出し項目は26500。「広辞苑」や「大辞林」の23万項目に比べると、9分の1だが、テキストファイルのサイズは3倍以上の80メガバイトある。これは、バッハ、モーツアルトなどの有名作曲家、イタリア、日本などの国別音楽事情など1433項目については、項目内に目次があり、一冊の単行本程度の文章が入っている。
 翻訳者だけでも380名、日本の音楽研究者を総動員した大翻訳プロジェクトであった。
 講談社が発行し、文献社が販売を担当して、多くの図書館に納入されたので、近くに図書館に行けば、見ることができる。

 デジタル化プロジェクトは1999年に講談社内でスタートし、2000年からイーストも参加した。講談社の担当者は、12000頁を、印刷用のCTSデータからタグ付きテキストに変換し、校正、外字の調査とコード化を行い、3000以上の譜例や図については、製版フィルムから紙焼きを作り、それをスキャンしてデジタル化する、という気の遠くなるような作業を行われた。
 それをイーストでDicXという辞書用XMLスキーマを使ってXML化した。

 XML化は小学館が支援し、販売も小学館系のネットアドバンス社が担当した。他の業種では大企業同士の提携は珍しいが、出版界、なかでも電子出版の分野では、講談社+小学館に限らず、様々な出版社が共同プロジェクトを推進している。
 楽器やホールなどの写真は、著作権の問題で、ほとんど掲載できなかったが、書籍版を参照してもらえるように、図版番号はそのままにした。それでも、3500点近くの譜例と図と表が入っている。

Web版開発のポイント
 検索には、この連載で何度かご紹介している、XMLドキュメントの全文検索エンジン「BTONIC」(http://www.btonic.com)を使用した。BTONICを使った検索システムは10例以上の開発実績があり、扱ったXMLコンテンツは70種類以上あるが、ニューグローヴでは、以下のような点で苦労した。

・とにかく量が多い
 XML化作業は、自由電子出版という業界では名を知られたタグ付け会社と共同で行ったが、この会社でなければ、XML化できなかったと思う。何せ、プレーンテキストで80メガバイトもあるファイルの処理には時間もかかるので、処理手順の検討やファイル分割など、長年のノウハウを活かした作業をしてもらった。

・読みの揺れ
 本家マクミラン社のオンライン辞書GroveMusic.comは丸善から販売されており、日本でも多くの音楽学者の方々が活用されている。これで、「剣の舞」で有名なハチャトリアンを引こうとすると、「Khachaturian」と入力しなければならない。Kから始まるなんて知っている人は、ごくわずかである。
 日本語版のGroveMusic.jpでは、ハチャトリヤンでもハチャトリアンでもハチャトゥリアンでも該当項目がヒットするようにした。モーツァルト、モーツアルト、モーッアルトもOKだし、チェコ語と英語読みが異なる、ドヴォルザーク、ドボルザーク、ドヴォジャーク、ドボジャークにも対応している。
 読みの揺れだけではなく、「バッハ」と入れると、一番有名なヨハン・セバスチャン・バッハには★印をつけるなど、音楽研究者だけではなく、音楽を学ぶ学生や愛好家の方々にも使いやすい機能を入れ、音楽事典のユーザ層が広がるように工夫した。このあたり、GroveMusic.jpで体験検索が行えるので、試していただきたい。
 音楽に疎い方にご説明すると、バッハは音楽家の家系で、ニューグローヴには14人のバッハが見出し項目となっている。モーツアルトは父や姉など6人。そのため有名な作曲家166名には★をつけることにした。

・項目内目次
 これも、大作業だった。辞書の中に1000冊以上の単行本が入っているような構造になっており、モーツアルトを引くと、彼は年代ごとにザルツブルグ、ウィーン、プラハと移り住んで、そこで作曲したので、それが目次となっている。目次は最大4階層の構造を持っており、これを忠実にWeb版でも表現した。

・ユニコード、外字、ルビ
 コード系は、最初シフトJISにしていたが、あまりにも外字が多くなるので、ユニコードに変更した。ヨーロッパ各国の言語が複雑に絡む、クラシック音楽の辞書にはユニコードが最適である。中国の音楽についての説明など、「日本語」と「中文」と「四声風のアクセント記号付きのピンイン」と「ルビ」をブラウザー画面に表示させることができた。
 ユニコードを使い、サーバ側で合成文字を自動生成してビットマップで配信する技術も開発したので、最終的に、約4千万文字のテキストの中で、外字は20文字程度となった。

販売状況
 本家、マクミランの「GroveMusic.com」は、快進撃を続けている。昨年2月に契約交渉でロンドンに行った際、アイスランドやジョージア州と契約したとの事だったが、10月のフランクフルトでは、フィンランドやカリフォルニア州とも契約したと言っていた。
 アイスランドは28万人の全国民が自由にインターネットで辞書引きが行え、カリフォルニア州はUCLA、UCB、UCSDなどの州立大学で、GroveMusic.comとGroveArt.comという34巻の美術事典を自由に検索できる。

 日本での販売は開始されたばかりだが、複数の音楽大学から、同時アクセス数7以上の照会が来ており、こちらの思惑通り、学生に広くIDを発行して、学内でも、自宅でもアクセスしてもらう計画のようだ。
年間24万円なので個人では手が出ないが、IDを共有できるの、市民交響楽団や一般の音楽サークルで共同購入することも可能である。同時アクセス数方式なので、頻繁に使われるなら、契約を更新して、蛇口を広げることも簡単にできる。

 10年前に多くの労力をかけて出版された辞書が、インターネットで蘇り、広く、音楽を愛す方々に読んでいただきたいと思い、我々は、このプロジェクトをスタートさせた。ユビキタスではないが、何時でも何処でも手軽に、GroveMusic.jpにアクセスできる「Information at your fingertips(パチンと指を鳴らせば、得たい情報が手に入る)」環境を、ご提供したいと思っている。

目次へ
Kazuo Shimokawa [EAST Co., Ltd.]