パソコン悠悠漢字術
今昔文字鏡徹底活用
文字鏡研究会
目次
■基礎編
■第2章 Mojikyo Character Mapの入手とインストール
1. 動作環境
2. フリー版の必要ファイル入手と解凍
3. フォントのインストール
4. Mojikyo Character Mapのインストール
5. 製品版のインストール
■第3章 Mojikyo Character Map の操作法
1. 起動してみる
2. 部首ジャンプ機能
3. 文字の拡大と番号表示
4. クリップボードへ転送
5. どんなソフトで使えるの?
■第4章 今昔文字鏡製品版はどう違う?
1. 画面表示と検索機能の違い
2. 出力の違い
■第6章 住所録・名簿・データベースでも文字鏡
1. Excel97
2. 三四六
3. ファイルメーカーPro
4. 検索について
■第7章 ワープロで楽々文書作成
1. さようなら外字作成のつらい日々
2. ワープロソフトで快適9万字
3. 検索だってできる
4. 作った文章をみんなに読んでもらおう
■実践編
■第8章 多漢字文書入稿マニュアル
1. ATOKやMS-IMEなどで多漢字入力
2. 外字は文字鏡番号で
3. Unicodeにしかない文字を「〓」に変換する
4. 文字鏡番号を「〓」に変換する
■第9章 DTPと文字鏡
1. Windows DTPと文字鏡TTF Windows版
2. Macintoshと文字鏡TTF Macintosh版
3. 文字鏡PS Font
4. TeXで文字鏡を使う
5. 文字の特定方法
6. 文字整理番号としての可搬性
7. ライセンスについて
8. 謝辞
■第10章 メディア研究と文字鏡
1. はじめに
2. 文字鏡フォントの活用事例
3. まとめ
■第11章 パーソナル環境での漢字文献情報処理の実際
1. 人文系研究とフィルタ系プログラム
2. テキストデータ
3. 最強の漢字エディタ Aprotool TM Editor
4. Unicode2.0での拡張
5. Aprotool TM Editorの外字サロゲート
6. Aprotool TM Editorで文字鏡を使ってみる
7. Aprotool TM Editorの今後
■第12章 データベースの未来へ
1. 世界に見いだされた "Mojikyo"
2. 仏典の電子化と『今昔文字鏡』
3. XMLと『今昔文字鏡』―データベースの未来に向けて
■第13章 文字鏡番号を使った文字の統計調査
1. 文字鏡番号とコンピュータ
2. 実例:『妙法蓮華経』の漢字頻度調査
3. 調査結果
■第14章 文字鏡番号を扱うための汎用JPerlスクリプト
1. はじめに
2. e-count.pl
3. m2html.pl
■第15章 文字鏡研究会へのお誘い
■第16章 未収録文字の登録について
■第17章 付録CD-ROMの使いかた
1. ご利用の前に必ずお読みください
2. CD-ROMを使う
3. 付録CD-ROMの内容
■コラム
コラム 無料フォント作成サービス
コラム 水文で壁紙を作る
コラム 外字に登録したい
コラム 文字鏡がTRONに載る!?
電話によるお問い合わせには、文字鏡研究会、株式会社エーアイ・ネット、株式会社紀伊國屋書店ともに、一切お答えしておりません。
又、本書の内容によって発生した、事故・障害・経済的および精神的損失などについても、文字鏡研究会、株式会社エーアイ・ネット、株式会社紀伊國屋書店は保証を一切致しません。
その他、各ソフトウェアの免責事項に関しましては、各ソフトウェアの使用許諾条件文をご参照の上、ご利用下さい。
MicrosoftR WindowsR 95 operating system,MicrosoftR WindowsR 98 operating system, Windows NTR operating system,WindowsR 95, WindowsR 98, Windows NTR, FrontPageR, OutlookR, Microsoft Internet ExplorerR, Microsoft OfficeR及びOffice製品群に含まれる個別アプリケーション、その他Microsoft社製品の名称は、米国Microsoft Corporationの米国およびその他の国における登録商標または商標です。これらソフトウェアの名称は本文中で、適宜省略表記することがあります。
又、これらの製品の画面画像は、Microsoft Corporationのガイドラインに従って画面写真を使用しています。
その他本書に記載の会社名や商品名などは各社の商標または登録商標です。本文中では?,R,cなどのマークは特に明示しておりません。
個人・団体名で頒布されているフリーウェアやシェアウェアなどのソフトウェアは、原則としてその作者である個人・団体に著作権が帰属しています。
漢字は日本文化の基盤をなすものである。今さら言うまでもないが、日本に文字のない時に、中国から漢字が入ってきた。われわれの先祖は漢字の意味や用法を学ぶとともに、漢字を元にして仮名を発明した。さらには、仮名を利用して漢文(中国古典)の訓読法(翻訳法)を考案し、中国語を介することなしに高度な中国文化を我が物とすることができた。遣唐使の往来の頃(七〜九世紀)にはすでに漢字はすっかり日本の土壌に根を下ろしたのである。十世紀には、その土壌の上に「物語」「随筆」「日記」「和歌」など日本独自の文化が花開いた。また、漢詩、漢文と呼ばれる中国古典詩文をそのまま模倣する(模倣しているうちに、これも日本独自なものが生み出されるようになる)ことも盛んに行われ、日本文化に大きな分野を占めるに至る。このように、漢字抜きでは日本文化を語ることはできないのである。
漢字は極めて便利な表記の道具″である。その発生以来、いろいろ改良や工夫が加えられ、形と音と意味(義)が一体となって機能を発揮してきた。これを「表意文字」と呼ぶが、このような機能を持つ文字は、世界で漢字だけである。形・音・義が兼ね備わっているゆえに、漢字を組み合せて新しい語を造ることが容易になる。造語力″が豊かなのも漢字の持つ利点である。また、音の機能を活用して音楽性も生ずる。この結果、世界で最も優れた詩歌が産み出されることになる。
さらに、目で見る要素から、形の美″が意識され、楷書、行書、草書などの書法芸術へも発展してゆく。
日本人の場合、漢字と、漢字から造り出された表音文字″の仮名(しかも二種類)を駆使して、漢字仮名まじり文″という表記法を造りだしたが、これは大脳生理学の方面で、右脳と左脳の双方を活動させる優れた方法であることが証明されたことも、この際付け加えておこう。
戦後、敗戦のショックから、漢字は時代遅れであり非能率であるとして、仮名文字論やローマ字論が跳梁跋扈したが、それがいかに愚かであったか、今にして思うことである。面白いのは、その論拠を成した漢字の非能率性″は、パソコン、ワープロの出現によってすっかり解消されてしまったことだ。
これらの機器の出現を、漢字の学習にマイナスになると憂うる向きもあるようだが、簡単な操作で見たこともない字に接する機会が増える、というプラス思考が大切だろう。今や新しい機器は、これ無くしては先に進めない必須の物″になっているのだから、ビジネスに、研究に、教育に積極的に取り入れていかねばならない。若い人たちがコンピューターに果敢に挑戦して、漢文の世界を電子の世界に持ちこんで研究成果を発表している姿を見ていると、私自身もこれによって拡がる研究の行く手を思い、胸をふくらませているところである。
この度、世に行われている漢字八万字余を内包する今昔文字鏡″紹介の本を出すに当り、日ごろの所懐の一端を述べて、ご挨拶とする次第である。
平成十一年三月十二日 石川忠久
(文字鏡研究会 会長/財団法人 斯文会 理事長)
ここでは、多漢字活用ユーティリティ「今昔文字鏡」の機能紹介を行います。 更に、よく使われるソフトを例にして、日常の用途で、たくさんの文字を使う方法をご紹介いたします。
<このような方に>
無料で9万字を活用する方法を知りたい
ワープロで使いたい
住所録や名簿に使いたい
ホームページを作りたい
.
「『今昔文字鏡』って何?」という質問に答えるのはなかなか難しい問題です。それと言うのも、『今昔文字鏡』は誰もが欲しかったのに、今まで開拓されていなかった分野のソフトだからです。
以下に、大きな特徴だけを列挙しましょう。
.
9万字の内、漢字は約8万字を収めています。この8万字の中には、あの有名な『大漢和辞典』に収められている約5万字の漢字全部も入っています。その他に変体仮名、甲骨文字、仏教で使われている梵字、易者さんが使ったりする六十四卦、さらには昔、宮中で行われたお香の遊技で使われた源氏香の記号、はたまた中国の少数民族「水族」の民族固有文字などまで含んでいます。
■ 約9万字全部が、あなたのパソコンで使用できます
ちょっとパソコンに詳しい人なら、JIS規格とかJISコードという言葉を聞いたことがあるでしょう。
大雑把に言うとJIS第一水準、JIS第二水準というのが普通、ワープロソフトで使われている文字です。記号も含めて合計で6,879文字あります。1999年中に新しくJIS第三水準、JIS第四水準が制定される予定ですが、いずれにしても9万字にまでは届きません。
それが、『今昔文字鏡』では全部使えるようになるのです。
文字鏡には製品版もありますが、使用期限など全く設けられていないフリーソフト版も提供されています。フリーソフト版は無料で友達にもドンドン配布できます。学校の先生が漢文の授業で配るためのプリント作成などにも利用されています。
中国・台湾・日本・韓国のパソコンで使われている漢字は合計で約2万字あります。
この約2万字は、ISO 10646という国際的に統一された文字コード(日本では「ユニコード」として有名です)に一括で登録されています。文字鏡は、この約2万字をすべて収録していますので、中国大陸のパソコンで使われている簡体字(日本人にはちょっと馴染みのない字形です)、台湾のパソコンで使われている繁体字(日本の旧字と大体一致します)、韓国のパソコンで使われている漢字も全部あなたのパソコンで使えるのです。
図で示すと、文字の収録範囲は次のようになります。
文字鏡への文字収録状況
■ 『今昔文字鏡』は無料で文字をどんどん増やします
もし、あなたに、とても珍しい名前の友人がいたとしましょう。
文字鏡にその文字が登録されていなかったら?
文字鏡研究会に、その文字を報告して下さい。
無料でその文字を作成します。今までワープロソフトで使うために外字を作っていた人も、これで面倒な外字作成の手間から解放されます。
いかがでしょうか?
まだ全部の特徴を書き尽くしていませんが、なかなかすごいソフトでしょう?本書では付録CD-ROMと連動して、この『今昔文字鏡』を徹底活用する方法を書いて行きます。
.
筆者一同は皆、いわゆる「文系」の人間です。
もともと、筆者一同だって「どうやったらパソコンでもっと漢字が使えるだろう?」と考えて試行錯誤してきたのです。
ですから、私たちと同じ悩みを持っているすべての方に、この本を読んで頂きたいと考えています。 例えば…
●お客さんの名前を正しい字で打ち出した宛名を作りたい方
●生徒の名前を正しい字で打ち出した名簿を作りたい先生
●ホームページで『三国志』の事を書いてみたい方
●漢詩や万葉集に興味を持っている方
→これらは皆、きちんとした字で表現できるようになります。
●中国との貿易を行うビジネスマン、中国語を習っている方や中国語の先生
→契約書、レポート、テストなどで、簡体字と日本語の混在したワープロ文章が簡単に作れます。
●市民講座で古文書の研究会、郷土の歴史研究会などに参加している方
●カルチャーで習っている『源氏物語』のレポートを書きたい方
●最近、占いに興味を持っている方
→ワープロに変体仮名で書いたり、巻名に源氏香を付けたり、易の結果を六十四卦で示したりできます。
●郷土資料館・史料館・美術館・博物館などにお勤めの方
→中国美術の展示プレート、パンフレットに甲骨文字の釈文を入れる場合など、様々な場面で役に立つでしょう。
●ワープロで電子写経をしてみたい方
●卒塔婆を書くために梵字の練習をしたいお坊さん
→梵字の世界的権威である児玉義隆先生のご指導で作られた綺麗な梵字をワープロで大きく印刷することが可能です。
●デザイン関係の仕事をしている方
→甲骨文字や梵字、民族固有文字などから多くのインスピレーションを受けることができるでしょう。
もちろん、歴史・哲学・文学など…それぞれの分野を専門に研究している学生さん、そして研究者の皆さんにも多大な便宜が与えられるはずです。
本書では、前半で「今までパソコンで使えなかったような特殊な文字」が必要な場面を具体例として想定し、それら様々な場面で「どのようにすれば目的を達することができるか」を書いて行く方法を採ることにしました。
当面必要な目的を直接解決する方法を読んで行くうちに、コンピュータで情報をどのように保存し、どのように発信し、どのように共有するか…ということが自然と理解できるようになる事を狙っています。
後半では、更に一歩進めて情報の再利用について具体例を交えつつ書くことにしました。
この後半部分は、そのままマネをすればOKという発想ではなく、読者の皆さんそれぞれが興味をお持ちの分野に対して、どのように応用できるか…という事を考えていただくためのヒント集として位置づけています。大学1、2年生(文系学部)の教養課程で、サブ・テキストとしても機能できるように…という位のちょっとハイレベルな内容です。
読み進んで行く中で、ワンランクアップを目指していただければ幸いです。
.
文字鏡には大きく分けて二種類のラインナップがあります。
一つは無償で提供されているフリー版。
もう一つは付加価値機能が充実した製品版です。
多彩な出力機能に関してはフリー版も製品版も同一です。
本書の付録CD-ROMには、フリー版を収録しています。
そこで、本書では製品版に関しては、どんな付加価値機能があるかだけを図版を交えながら紹介するに留め、主にフリー版を利用して具体的な事例を挙げて行きます。
以下にソフトウェアの一覧を挙げてみます。
|
ソ フ ト 名 |
内 容 |
入手先 |
付録CD-ROM収録 |
1 |
Mojikyo Character Map Ver2.02 TTF対応版 |
Free版
出力ツール |
文字鏡研究会 |
○ |
2 |
『今昔文字鏡』Ver2.0 |
製品版
28000円(税別) |
紀伊國屋書店 |
× |
3 |
Windows用TrueType Font |
Free版/製品版
共通使用フォント |
文字鏡研究会 |
○ |
4 |
Macintosh用TrueType Font |
Free版
Macintosh用フォント |
文字鏡研究会 |
○ |
5 |
Type1形式
1バイトPS Font |
Free版
PSプリンタ用フォント |
文字鏡研究会 |
○ |
6 |
GIF画像形式字形表示
(24dot,96dot) |
Free版
画像フォント |
文字鏡研究会 |
24dotは1,2から出力可 |
7 |
Tex用フォント |
Free版
Tex用フォント |
文字鏡研究会 |
○ |
上記表中の「文字鏡研究会」とは、文字鏡研究会のホームページから入手可能であることを示します。urlは次の通りです。
■ Mojikyo Character Map Ver2.02 TTF対応版
本書で一番重点的に紹介するWindows用の検索・出力ツールです。このツールを使って文字を見つけだし、多彩な出力機能を使ってワープロなどに入力します。本書の付録CD-ROMにも収録しています。
(株)エーアイ・ネット開発、紀伊國屋書店発行の製品版で、全国の書店等で入手できます。フリー版と製品版の違いについては、後でやや詳しく見て行くことにします。
フリー版、製品版で共通に使われるWindows 用のフォントです。
製品版に付いているモノもフォントは無償で第三者に配布できます。文字鏡は、フォントに関してはあくまでも無償なのです。
このフォントも本書付録CD-ROMに収録しています。
文字鏡は9万字を超えた今も、ドンドン文字を新しく追加して行きますので、半月に一度追加更新されます。更新されたフォントは文字鏡研究会のホームページで無償公開されます。インターネットに繋げられる環境の人は、時々はフォントをここから入手して更新して下さい。
なお、今後の予定を簡単に書いておきますと、1999年中に制定予定のJIS第三/第四水準にも対応予定です。
また、中国の考古出土物に見られる楚系文字、既に言語自体が失われてしまった西夏文字、ハンコなどで今も使われる篆書(小篆)、青銅器などに見られる金文なども収録を予定しています。
■ Macintosh用TrueType Font
Windows用TrueType Fontを元にしてMacintosh用に変換されたフォントです。
Macintosh用の検索ソフトは今のところ準備できていませんが、『大漢和辞典』収録範囲の文字に関しては簡易索引が作成されています。
このフォントと簡易索引も、本書付録CD-ROMに収録しています。
これらは主に印刷業者さんやTeX(パーソナル環境で使われる組版用のソフト)ユーザの方のため、また、FreeBSDやLinuxなどのUnixベースの環境でも使用できるように、という意図で作成しました。
一般のパソコンユーザはまず関係ありませんが、幅広い分野で使って頂くという目的で開発しました。
1byteの文字領域に256文字単位で割り当てていますので海外のソフトウェアでも利用できるでしょうし、PSプリンタやセッタのハードディスクへダウンロードして利用する際にも、必要な外字を含む部分だけ、転送すれば済みます。TeXユーザは容易に1byte PK Fontへ変換して利用できるでしょう。
この*.psフォントに加えて*.afm,*.inf,*.map,*.pfb,*.pfm,*.tfm等のファイルを、本書付録CD-ROMに収録しています。
24dotの大きさと96dotの大きさがあります。
Mojikyo Character Map Ver2.02 TTF対応版や、『今昔文字鏡』製品版からは24dotの大きさのBitMap形式画像が出力できます。
また、インターネットにある文字鏡研究会のホームページには24dot、96dot双方の大きさのGif形式画像がそれぞれ約9万個分ずつ置いてあります。海外の人に漢字やかなが入った自分のホームページを見て貰いたいときなどに、この画像ファイルへリンクを張れば日本語版のWindows用フォントが無くても確実に読めるようになります。
■第2章 Mojikyo Character Mapの入手とインストール
4. Mojikyo Character Mapのインストール
■第3章 Mojikyo Character Map の操作法
.
.
インターネットの爆発的な普及によって、数千万とも数億とも言われるホームページからさまざまな情報を入手することができ、また個人が手軽に、全世界に向けて情報を発信することができるようになりました。しかし、画像や音楽といったいわゆるマルチメディアに関してはどんどんと開発が進められていますが、肝心の文字や言語に関しては、多言語の混在が難しい、文字が足りない、などの問題があり、まだまだ真の普及とは言えないかもしれません。
このセクションでは、文字鏡研究会からフリーで公開されているフォントを使って、これまでのホームページとは一味も二味も違うものを、作りたいと思います。文字鏡フォントに収録されている数多くの漢字のみならず、まるで絵のような甲骨文字・水文や、流麗な書体の梵字のフォントは、ただの文字にとどまらない、目で見るだけでも楽しめる一種のマルチメディアと言えるかもしれません。
例題として、甲骨文字を使ったごく簡単なページを完成させたいと思います【図1】。
【図1】
.
文字鏡フォントを使ったホームページを作って世界中の人に見てもらう場合、注意しておかなければいけない点がいくつかあります。
本当に文字鏡フォントじゃなきゃだめなのか?
文字鏡フォントを使っていることを表示しているか?
まず1.の場合、先の例題で言うと、丸で囲った文字【図2】はMSIMEなどでは普通、入力できない文字ですが、文字鏡フォントがなくても表示できてしまう文字です。
【図2】
この「

」と「

」という字は、Unicodeという文字コードに含まれている文字です。Unicodeは約2万字の漢字のほか、さまざまな国の文字を収録したコードであり、Internet ExplorerやNetscape Communicatorなどを適切に設定することによって、文字鏡フォントの多様さには及ばないにしても、かなり多くの文字を表示することができるのです。文字鏡フォントがフリーで公開されているとは言え、全世界に普及している、というわけではないのですから、国際規格にとりいれられているUnicodeを優先して使う、というのがマナーと言えるかもしれません。その文字がUnicodeに含まれているのかどうかについては、『今昔文字鏡』製品版の「文字情報」ウィンドウなどでわかります。
【図3】の「ISO/IEC」とは、ISOという国際標準化機構による規格番号のことで、次の「773E」というのが
Unicodeの番号1
になります。
【図3】
『今昔文字鏡』では製品版でもフリー版でもUnicodeテキストでの出力にも対応していますし、またUnicodeを扱うための便利なツールもたくさん出回っていますので、Unicodeを使ったホームページを作るのはそれほど難しいことではありません。Unicodeのフォントを利用したホームページの作り方については、このセクションでも簡単に説明しますが、本格的にとりくみたい人は漢字文献情報処理研究会編『電脳中国学』などを参考にしてください。
次に2.についてですが、文字鏡フォントは、文字鏡研究会を中心とした多くの人の善意と情熱によって情報が集められ、デザインされ、フリーで公開されています。その業績に正当な評価を与え、またその善意に感謝することがない限り、規律ある「フリー」の環境は保てないでしょうし、ましてや発展させていくことはできないでしょう。
【図4】
【図4】のように文字鏡のバナーを掲示し(デザインの都合などでバナーを使えない場合は「今昔文字鏡」と文字で書けばいいようです)、文字鏡研究会のホームページ(文字鏡Net)へのリンクを張ることで、文字鏡を利用する人々の輪が拡がり、文字についての知識の蓄積と交流がスムーズに行われるでしょう。
.
3. ホームページの設計
――TrueType Fontかビットマップフォントか
さて次に、ホームページの見栄えを決定するフォントの問題について考えてみましょう。文字鏡フォントにはご存じの通り、3種類(TrueType Font、24dotビットマップフォント、24dotと96dotのGIFリンクシステム)があるわけですが、それぞれに長所と短所があるので、どのようなホームページを作るのかによって使い分けなければなりません。
|
長所 |
短所 |
TrueType Font |
大きさを変えてもきれい。
表示が速い。 |
フォントをインストールしなければならない。 |
24dotビットマップフォント |
サイズが小さいので表示が比較的速い。
フォントを持っていなくてもよい。 |
大きさを変えると見にくい。
画数が多い文字を正確に表示できない。 |
24dot・96dotGIFリンクシステム |
フォントを持っていなくてもよい。 |
大きさを変えると見にくい。 |
TrueType Fontの場合、インストールさえされていれば、先の例にあげたようなページがあっと言う間に表示されます。しかも、大きさを変えても滑らかな曲線で表示されます。しかし、文字鏡TrueType Fontがインストールされていないコンピュータでこれを見ると、【図5】のようになってしまいます。これでは、シュールを通り越して意味不明です。
【図5】
見る側にもフォントをダウンロードさせればいいのでしょうが、総計数十MBにもおよぶファイルをダウンロードし、インストールするのは一苦労です。
一方、ビットマップフォントの場合は画像ですから、他のホームページの画像と同じでその場その場でダウンロードされます。ですから、TrueType Fontがインストールされていなくても、ちゃんと見ることができます。サイズの小さい24ドットフォントを使い、数が少なければTrueType Fontほどではないにせよあっと言う間に表示されることでしょう【図6】。
【図6】
しかしビットマップフォントの問題は、TrueType Fontとちがって、大きさを変えると曲線などにデコボコが目立ってしまうことです。また、画数の多い文字については、表現に限界があります。『今昔文字鏡』には84画の漢字が収録されていますが【図7】、TrueType Fontではきちんと表示されるものの、解像度の高い96ドットGIF画像でも一部、潰れてしまいますし、24ドットGIF画像では「雲」ではなく「雨」になってしまっています(それでもなんとなく読めてしまうのは、デザインがよいからでしょう)。
【図7】
いずれにせよ、各種フォントの特性を把握し試行錯誤をしながら、自分の作りたいホームページに最もふさわしいフォントを選んで使っていくことが肝心です。手軽に表示したい場合は24ドットフォントで、(84画の漢字などを除いて)筆画などをしっかり見せたい場合は96ドットフォントで、フォントの大きさやデザインなどにこだわりたい場合はTrueType Fontで、といった具合に、場合に応じて使い分けましょう。
.
ここでは、文字鏡フォントを使ったホームページ作りの説明については比較的詳しく記述しますが、一般的なホームページの作り方について一から説明するような紙幅はないので、書店にたくさん並んでいるマニュアル本等を参照してください。
ホームページ作成のためのHTMLエディタは、インターネット人気に押されて数限りなくありますので、ここですべてを紹介することはできませんが、ここではNetscape Composerについて解説したいと思います。Netscape Composerは、Netscape Communicatorの一部として、インターネットや雑誌の付録CD-ROMなどで無償配布されています。
TrueType Fontを入力する場合、Netscape Composerはそれほど適しているとは言えません。Netscape Composerには[リッチテキスト]形式をそのまま貼りつけるができないからです。
TrueType Fontを入力するためには、まず[形式を選択してコピー]で[フォント名+テキスト]を選び、クリップボードにコピーします【図8】。それをNetscape Composerに貼りつけると、「Mojikyo M117 肅」という文字列がコピーされますので、この「肅」を選択して「Mojikyo M117」というフォントに変更すれば【図9】、文字鏡フォントの甲骨文字になります【図10】。最後に「Mojikyo M117」を消せばひととおり終わりです。
【図8】
【図9】
【図10
逆に、ビットマップを入力する方法は簡単です。[形式を選択してコピー]で[ビットマップイメージ24dot]を選択し、クリップボードにコピーしたものを、そのまま貼りつけることができます。また、[Internet URL 24dot]あるいは[Internet URL 96dot」をコピーした場合、メニューの[挿入]から[HTMLタグ]ダイアログをたちあげ、そこに『今昔文字鏡』からコピーしたURLを貼りつけます【図11】。コピーした直後はちゃんと表示されませんが、インターネットに接続されている状態でメニューの[表示]→[再読み込み]を実行すると、ちゃんとした表示になります。
【図11】
Unicodeの文字を入力するためには、[文字コードセット]を[UTF-8]に設定します【図12】。『今昔文字鏡』から入力する場合、[形式を選択してコピー]で[Unicodeテキスト]を選び、クリップボードにコピーします。それをそのままNetscape Composerに貼りつけることができます。ただし、Unicodeを表示できるフォントがないと、空白になったり文字化けしたりします。
【図12】
TrueType Fontを使う場合、Microsoft Word97/98を使うのも手かもしれません。新規作成の場合、[Webページ]を選択することで【図13】、WordがHTMLエディタとしてを起動します。また、Word97/98で普通に作った文書をHTMLで保存したい場合、[HTML形式で保存]を選択します【図14】。
【図13】
【図14】
Word97/98では、『今昔文字鏡』で出力されるリッチテキストを、普通のワープロでの編集と同じように(Wordはワープロ・ソフトなのですから、当たり前かもしれませんが)直接貼りつけることができますし、Unicodeにも最初から対応しています。『今昔文字鏡』からは、[形式を選択してコピー]で[Unicodeテキスト]を選び、クリップボードにコピーします。それをそのままWord97/98に貼りつけることができます。ただし、Unicodeを表示できるフォントがないと、空白になったり文字化けしたりします。
Unicode文字を使ってホームページを作った場合、保存の際に少し注意が必要です。最初からHTMLを編集していた場合(新規作成で[Webページ]を選択していた場合)は、メニューの[ファイル]→[プロパティ]で、ホームページの文字コードを[多国語(UTF-8)]に設定します【図15】。また、普通に編集した文書を[ファイル]メニューの[HTML形式で保存]によって保存する場合、[HTMLコンバータ]というダイアログが表示されますので【図16】、そこで[多国語(UTF-8/KSC 5700)]を選択します。こうすることで、Unicodeの文字がきちんと保存されます。
【図15】
【図16】
一方、ビットマップについては注意が必要です。例題のように、文字と同じような扱いでビットマップを利用しようとしても、Wordの編集機能はただの「図」として認識してしまって、文中にビットマップを埋め込むことができないようです(右寄せ、左寄せ等しか選択肢がない)。
タグを自動生成してくれるHTMLエディタやWordは便利ですが、世の中には「機械の吐き出すコードなど、あてにならん!」とばかりに、普通のエディタでHTMLタグを書かないと気が済まない人もいます(実は筆者もそのひとりです)。また、そうでない人でも、HTMLエディタやWordではできない微妙な調整をしたい場合などに、エディタを使って直接タグを編集する場合があるかもしれません。
TrueType Fontについてのタグを書く場合、まず、『今昔文字鏡』の[形式を選択してコピー]で[フォント名+テキスト]を選び、クリップボードにコピーします。それをエディタに貼りつけると、「Mojikyo M117 肅」というような文字列がコピーされますので、次のようにFONTタグを追加します。
↓
<FONT FACE="Mojikyo M117">肅</FONT>
ビットマップフォントの場合は、[形式を選択してコピー]から[Internet URL 24dot]あるいは[Internet URL 96dot]をコピーし、それを直接エディタに貼りつけます【図17】。
【図17】
Unicodeの文字を入力する場合、Aprotool TM Editor(第11章参照)のようにUnicodeを直接編集できるアプリケーションを使うのも手ですが、日本語(JISコード)しか扱えない普通のエディタでも、Unicodeを編集・表示するための「裏技」があります。ただしこのテクニックは、Microsoft Internet Explorerのバージョン4以降との組み合わせでのみ可能です。
『今昔文字鏡』の[形式を選択してコピー]で[Unicodeタグ(10進)]を選択、コピーし【図18】、エディタに貼りつけます。貼りつけた結果は次のようになっているはずです。
【図18】
これは一見、意味不明な記号ですが、Internet Explorerを通して見れば、きちんと表示されます【図19】。
【図19】
これは、HTMLの次にインターネットで標準になると目されているXML(eXtensible Markup Language)の「文字参照」と呼ばれるもので、「&#」と「;」の間にUnicode番号を表記することでそれがUnicodeのある文字であることを表現しています。現在、Internet ExplorerがXML機能を一部実装しているため、このように表示される、という仕掛けです。バージョン4では、まだ、16進数のUnicodeタグはサポートされていませんので、[形式を選択してコピー]→[Unicodeタグ(16進)]の使い道はあまりありませんが、Internet Explorer のバージョン5をはじめ、XMLはこれからどんどん普及していきますので、いずれ使い道が出てくるでしょう。
その他、HTMLのタグについては、専門書を参照してください。
5) Perlによるテキストエディタからの一括変換(上級編)
ここからは、プログラミングやPerlなどについての知識がある人のための「上級編」です。理解できなくても困ることではないので、読み飛ばしていただいてもけっこうです。
プレーンテキストで作られたファイルがたくさんあって、その外字を文字鏡番号や『大漢和辞典〔修訂版〕』の番号で入れていた場合、それらを一括してHTML形式にできないだろうか?という要望があるとおもいます。文字鏡番号と文字鏡フォントは一定の法則で対応しているので、一括変換は可能です。
ビットマップフォントで表示する場合、文字鏡番号と文字フォントのファイル名が対応していますので、変換は容易です。サンプルとして次のスクリプトをあげます。
$filename = shift;
$s = '<IMG SRC="';
$e = '.gif">';
open(f, $filename);
open(w, "> $filename.html");
print w "<HTML>\n";
print w "<HEAD>\n";
print w "<TITLE>$filename</TITLE>\n";
print w "</HEAD>\n";
print w "<BODY>\n";
print w "<PRE>\n";
while(<f>){
s/\@(\d+)/$s.substr("00000$1", -6, 6).$e/eg; ………(1)
print w;
}
print w "</PRE>\n";
print w "</BODY>\n";
print w "</HTML>\n";
内容はとても単純ですが、処理の(唯一の)中心である(1)について補足すると、「@」に続く数字の列を文字鏡番号と見なして、数字の前と後ろにタグを付けています。中の「substr」は、数字が6桁でない場合を想定して(例えば「123」だとすると)、数字の頭に「00000」をつけて(「00000123」)、後ろから6桁を切り取っています(「000123」)。
このスクリプトで下の例文は次のように変化します。
甲骨文字で「人」は@095200や@095201です。横から見た人の姿なん
でしょうが、ちょっと類人猿にも見えます。
↓
<HTML>
<HEAD>
<TITLE>sample.txt</TITLE>
</HEAD>
<BODY>
<PRE>
甲骨文字で「人」は<IMG SRC="095200.gif">や<IMG
SRC="095201.gif">です。横から見た人の姿なんでしょうが、ちょっと
類人猿にも見えます。
</PRE>
</BODY>
</HTML>
TrueType Fontへと変換する場合、文字鏡番号から計算が少し面倒です。ここでは、拙作のサブルーチン(m2html.pl)を使って変換してしまいましょう。
require 'm2html.pl'; ………(1)
$filename = shift;
$s = '<FONT face="';
$e = '</FONT>';
open(f, $filename);
open(w, "> $filename.html");
print w "<HTML>\n";
print w "<HEAD>\n";
print w "<TITLE>$filename</TITLE>\n";
print w "</HEAD>\n";
print w "<BODY>\n";
print w "<PRE>\n";
while(<f>){
s/\@(\d+)/$s.join('">', &m2html($1)).$e/eg; ………(2)
print w;
}
print w "</PRE>\n";
print w "</BODY>\n";
print w "</HTML>\n";
先ほどのスクリプトとほとんど変わりませんが、(1)でサブルーチンを呼び出している点に注意してください。(2)では、m2htmlが返してくれたフォント名と代理文字をくっつけて、タグの形にしています(m2htmlについては第14章参照)。
このスクリプトで、先ほどの例文は次のように変化します。
(前略)
甲骨文字で「人」は<FONT face="Mojikyo M117">肆</FONT>や
<FONT face="Mojikyo M117">肅</FONT>です。横から見た人の姿な
んでしょうが、ちょっと類人猿にも見えます。
(後略)
.
さて、以上のテクニックを駆使すれば、文字鏡フォントやUnicode文字がブラウザで踊る、普通のページとは一味違ったホームページができるはずです。
文字鏡フォントは、文字を研究する人々の情熱によって作られたものですから、『元気な太郎君のうきうき日記』のようなホームページを作るのに使われることはきわめてまれでしょうし(甲骨文字や梵字を駆使した「うきうき日記」があれば、見てみたい気もしますが)、知的探求心に溢れたホームページが生まれてくるのではないかと期待しています。
『今昔文字鏡』のバナーは張りましたか? それが済んだら、いざ公開!
.
1
正確には、ISO/IEC 10646という国際規格の番号なのだが、現時点ではUnicodeと同じ。
.
『今昔文字鏡』のユーザにはいろいろな方がいると思いますが、その中でもかなりの割合を占めると思われるのが、「漢字をたくさん使いたい!」ということで苦労をされてきた方だと思います。かつてしばしばたとえに出されていたのは、「?好」や「ケ小平」など、中国ではごくごく当たり前の漢字が日本のコンピュータでは使えない、といったことでしたが、実際少し前まで日本語OS上で中国語をまともに扱えるものといえば、MacintoshのChinese Language KitやUnixのMuleなどであり、それに比べて日本語版Windowsで中国語を扱うのはかなり難儀していました。
しかし最近では、そういった苦労もだんだんなくなっていくようです。「加盟」「双橋」「ロボタイプ」と言ったIMEを購入したり、Microsoftが無料で公開している「Global IME」や「微軟新注音・新蒼頡IME」「微軟ピンイン輸入法」をダウンロードすることもできます(コラム「
Internet ExplorerとUnicode
」参照)。【図1】は、日本語版Windows98のOutlook Express上で、「Global IME」を使ってピンインで中国語を入力している画面です(右下のアイコンが、Global IMEです)。これで書かれたメールは、中国の友人のコンピュータでもきちんと表示されることでしょう。このあたりの事情については、漢字文献情報処理研究会編『電脳中国学』に詳しく書かれていますので、そちらを参照してください。
【図1】
どうしてこんなことが可能になっているかというと、特別なことをしているわけではなく、Windows98やNT4.0がそもそもUnicodeという多言語コードをベースにして作られているからです。Unicodeには、20,000字を超える漢字をはじめとする各国語が、完全にとはいえないまでも、ある程度実用的な範囲で収録されており、もちろんその中には簡体字や繁体字といった漢字も含まれています。Unicodeは国際規格であるISOにも取り入れられていますから、中国の友達にメールを送りたい場合は、『今昔文字鏡』よりも先に、上にあげたようなUnicodeベースの多言語システムを使うのが理にかなったやり方だろうと思われます。
でも、それでも漢字が足りない!出ない文字がある!という場合は必ずあります。中国人自身が「文字が足りない」と言っているのですから、仕方がありません。そういう場合は、文字鏡フォントでHTMLメールを作って送る(【図2】、HTML編集については
第5章
参照)、という切り札を使うわけですが、その場合もなるべく、ビットマップフォントを添付して送った方が、相手にメッセージが伝る可能性が高いようです。しかし、HTMLメールを見られない環境の人もいるわけですし、文字鏡メールは本当に「最後の切り札」とした方が無難でしょう。
【図2】
.
コラム Internet ExplorerとUnicode
1. Internet Explorerの多言語環境
まず、【図1】のホームページを見てください。
【図1】
一見してわかるように、日本語と中国語と韓国語が表示されています。これはどうやって作ったと思いますか? 文字鏡フォントを使ったのでしょうか?
――たしかに文字鏡フォントを使えば、簡体字を含む中国の漢字を表示することはできますが、韓国語のハングル文字までは無理です(将来的に収録されるかもしれません。期待しましょう)。では、どうやって?
Microsoft Internet ExplorerでUnicodeがサポートされており、Unicodeの範囲の文字ならば、Windows上で簡単に編集したり閲覧したりすることができるのです。
Unicodeの文字を見るためには、それに対応したフォントが必要ですが、中国語(簡体字・繁体字)とハングルに関しては、Microsoftが無償で公開しています。Internet Explorerのバージョンが4以降の場合、メニューの[ヘルプ]→[製品更新]とポイントすると、アップデートに関するページ(OSによって異なるようです)が表示されます。そこにある「複数の言語のサポート」あるいは「多国語サポート」から、中国語や韓国語のオプションを選択、インストールすることができます【図2】。
【図2】
また、中国語や韓国語の知識がある人ならば、Microsoftが無償で公開している「Global IME」や「微軟新注音・新蒼頡IME」「微軟ピンイン輸入法」(「微軟」とは中国語でMicro-soft)などを使って、日本語Windows上で中国語・韓国語等を普通に入力することが可能です(ただし、Global IMEは、Internet ExplorerまたはOutlookにしか入力することができません。また、OSやアプリケーションによっては、これらのIMEが正しく動作しない場合がありますのでご注意を)。詳しい使い方については、漢字文献情報処理研究会編『電脳中国学』を参照してください。
Internet Explorerのほかにも、WindowsアプリケーションのさまざまなところでUnicode化が進んでいます。有名どころでは、Microsoft Wordの97以降でUnicodeがサポートされていますし、一太郎のOffice 8エディション以降とATOKのバージョン11.1.1以降もまた、Unicodeを使った多くの漢字を入力することが可能です。
表面的にはJISコードで動いているようにみえても、内部の処理(WindowsのCOMオブジェクト間の通信など)ではUnicodeがデフォルト・コードになっていたり、また、次世代言語として注目を集めるJavaも、Unicodeがネイティブ言語となっていたりと、Unicodeは隠れたところですでにメジャーになりつつあります。ただ、JISなどの既存のコードで書かれたデータやファイルの膨大な蓄積があるために、わざわざUnicodeがJISのようにふるまって動作している、というわけです。
これからは、XMLやJavaなどのUnicodeをメインとしたシステムが、インターネットを介してどんどんと広まっていくでしょうから、いずれ、当たり前になっているかもしれません。
.
『今昔文字鏡』には、仏教に興味のある人にとってうれしい、さまざまな漢字以外のフォントがそろっています。
SAT1
など、あちこちで公開されている『妙法蓮華経』のテキストと、蓮華台のフォントを組み合わせて、『
一字蓮台妙法蓮華経2
』をワープロ上で再現してしまうというのもオツなものですが【図1】、これは1種類のフォントしか使っていないので、「遊ぶ」というには物足りないかもしれません。
【図1】
何かおもしろい文字はないかと、『今昔文字鏡』を探していれば、すぐに気づくのが「梵字表」の存在です。メイン画面のメニューを、[コード表]→[梵字表]とポイントしていけば、流麗な書体の梵字悉曇が整然と並んだ画面が登場します【図2】。左上の[部首]のところでは、「第一章」「第二章」から始まって「第十八章」までと、それに加えて「摩多」という項目を選ぶことができますが、これは、伝統的な梵字悉曇の配列によるものです。
【図2】
「第一章」から「第十八章」は、中国唐代の智広が著した『悉曇字記』に説かれる「悉曇十八章」のことで、比叡山の五大院安然が重視して以来、現代に至るまで悉曇学の基礎・入門とされてきたものです。それぞれ梵語(サンスクリット語)の音韻別になっており、第一章は「迦迦引
章」(「か・かー章」と読む。小さい「引」は、伸ばし記号「ー」に相当する)という具合に、最初の2文字をとって別名としています。「摩多」は母音のことで、十二摩多などと言われています。『今昔文字鏡』の梵字表では、異字体も収録しているため、それより多くなっているようです。
梵字と言うと、お札や卒都婆に書かれたものが一般的ですね。また最近では、若者向けの洋服にプリントされているのも見かけますので、現代的なデザインとしても優れているということなのでしょうか。筆者が梵字と聞いて思い浮かべるのは、「種子曼荼羅」(しゅじまんだら)です。みなさんも曼荼羅はご存じでしょうが、梵字で書かれた曼荼羅を見たことはあるでしょうか? 密教には梵字の一字一字を諸仏・菩薩のシンボルと見なしてそれを「種子」とする思想があるのですが、曼荼羅で諸尊の図絵を描く代わりに、それぞれに相当する種子、すなわち梵字を配置したのが「種子曼荼羅」です。
【図3】は、筆者が試みにMicrosoft Wordのドロー機能で作り始めた、胎蔵界曼荼羅の中心、中台八葉院とよばれる箇所の作業中の画面です。どうです、うつくしいでしょう? 曼荼羅の何百という種子を埋め尽くすには、途方もない時間がかかってしまいそうですが、やりがいがあります。
【図3】
また、将来的には、HTMLやXMLで曼荼羅を描ける日が来るかもしれません。特に、次世代のXMLやHTMLではドロー図形を描画できるようになるといいますから、それが実現したらドローソフトに全く頼らなくても、曼荼羅が完成できそうです。曼荼羅はそもそも大日如来のさとりの境地、すなわちこの宇宙全体を表現したものですから、それがインターネットという小宇宙に遍在する(つまり、どこからでもアクセスできる)ということを考えると、ちょっとわくわくしてしまいます。これこそまさに、遊戲=遊びの境地?!
ここでは、日常の仕事や研究で漢字を多用したい場合の実例をご紹介いたします。具体的な例の中から、やりたいことを実現するテクニックを汲み取っていただければ幸いです。
<このような方に>
漢字の多い論文や原稿を活字化したい
DTPで活用したい
文字鏡の活用事例が知りたい
漢字処理に便利なプログラムを知りたい
3. Unicodeにしかない文字を「〓」に変換する
1. Windows DTPと文字鏡TTF Windows版
2. Macintoshと文字鏡TTF Macintosh版
5. 外字の作成
([標準の外字]としてコード位置F040に登録する場合)
■第11章 パーソナル環境での漢字文献情報処理の実際
3. 最強の漢字エディタ Aprotool TM Editor
5. Aprotool TM Editorの外字サロゲート
6. Aprotool TM Editorで文字鏡を使ってみる
■第12章 データベースの未来へ
―SATと文字鏡とXML
3. XMLと『今昔文字鏡』―データベースの未来に向けて
■第14章 文字鏡番号を扱うための汎用JPerlスクリプト
.
■谷本 玲大
(たにもと・さちひろ)1971年・長野県生まれ
- ●現所属:
東洋大学大学院文学研究科国文学専攻博士後期課程
- 略 歴:
二松学舎大学文学部国文学科卒。東洋大学大学院文学研究科国文学専攻博士前期課程修了。修士(文学)。文字鏡研究会参事。東京外国語大学アジア・アフリカ言語文化研究所教務補助員(1999年3月まで)として新JIS規格制定に関わる基礎資料整理作業に携わる。
- ●主要論著
* 『新撰萬葉集』本文校訂に於ける避板概念の導入について」(『東洋大学大学院紀要』第35集、1999年2月)
* 「無窮會本『新撰萬葉集』の価値再考」(『東洋文化』復刊第82號(通巻316號)、1999年3月)
* 『電脳中国学』 漢字文献情報処理研究会編(共著)、好文出版、1998年
■師 茂樹
(もろ・しげき)1972年・大阪府生まれ
- ●現所属:
東洋大学大学院文学研究科仏教学専攻博士後期課程
- 略 歴:
早稲田大学第一文学部東洋哲学専修卒。東洋大学大学院文学研究科仏教学専攻博士前期課程修了。日本印度学仏教学会データベースセンター主事、大蔵経テキストデータベース研究会事務局として、仏教学におけるコンピュータ利用に携わる。
- ●主要論著
* 「法相宗の「一乗方便」説再考―諸乗義林を中心に―」(『印度学仏教学研究』47-1(93)、1998年12月)
* 「慈蘊『法相髄脳』の復原と解釈」(『東洋大学大学院紀要』 第35集、1999年2月)
* 『電脳中国学』 漢字文献情報処理研究会編(共著)、好文出版、1998年
■野村 英登
(のむら・ひでと) 1973年・山口県生まれ
- ●現所属:
東洋大学大学院文学研究科中国哲学専攻博士後期課程
- 略 歴:
東洋大学文学部中国哲学文学科卒。同大学院文学研究科中国哲学専攻博士前期課程修了。道教研究におけるコンピュータ活用について研究中。
- ●主要論著
* 「『春秋繁露』註釋稿(十一)」春秋繁露研究会(共著)(『東洋大学文学部中国哲学文学科学科紀要』第6号、1998年2月)
* 「煉丹術としての仏教解釈−『悟真篇』解釈をめぐって−」(『東洋大学大学院紀要』第35集、1999年2月)
* 『電脳中国学』 漢字文献情報処理研究会編(共著)、好文出版、1998年
■横山 詔一
(よこやま・しょういち)1959年・愛媛県生まれ
- ●現所属:
国立国語研究所主任研究官
- 略 歴:
1981年横浜国立大学教育学部心理学科卒、1985年筑波大学大学院心理学研究科博士課程退学、博士(心理学)。日本教育工学会1997年度論文賞を野崎浩成氏らと受賞。専門は認知心理学と文字メディア学。
- ●主要論著
* 『表記と記憶(心理学モノグラフNo.26)』日本心理学会、1997年
* 『新聞電子メディアの漢字:朝日新聞CD-ROMによる漢字頻度表』国立国語研究所プロジェクト選書No.1(共編著)、三省堂、1998年
* "Development of a Japanese Kanji Character Frequency List."(共著) Twelfth International Unicode / ISO 10646 Conference : Conference Pro-ceedings, Part 1.,1998
■笹原 宏之
(ささはら・ひろゆき)1965年・東京都生まれ
- ●現所属:
国立国語研究所研究員
- ●略 歴:
1993年早稲田大学大学院文学研究科日本文学専攻博士後期課程単位取得、修士(文学)。文化女子大学専任講師を経て、現在、国立国語研究所言語体系研究部研究員。JCS委員会(JIS漢字改正・制定)等の委員を務める。専門は国語学(文字・表記)。
- ●主要論著
* 『新聞電子メディアの漢字:朝日新聞CD-ROMによる漢字頻度表』国立国語研究所プロジェクト選書No.1(共編著)、三省堂、1998年
* 「国字と位相」国語学会『国語学』163号、1990年
* 「「佚存文字」に関する考察」『国文学研究』105号 1991年
■谷田貝 常夫
(やたがい・つねお) 1932年・東京生まれ
- ●現所属:
普連土学園講師
- ●略 歴:
東京大学美術史科卒、元普連土学園教頭。
- ●主要論著:
* 『現代文要約法』三省堂、1989年
* 『日本への遺言−福田恆存語録−』(共著)、文藝春秋、1995年
* 『漢字の「字形」「字体」「書体」について』『普連土学園研究紀要』第4号、1997
.
奥付
パソコン悠悠漢字術 今昔文字鏡徹底活用
--------------------------------------------
1999年4月30日 第1刷 発行
1999年5月25日 第2刷 発行
■編 集:
文字鏡研究会
〒220-0073 神奈川県横浜市西区岡野1-17-3
志乃田ビル2F
■発 行:
株式会社 紀伊國屋書店
〒163-8636 東京都新宿区新宿3-17-7
電話 03-3354-0131(大代表)
----------------------------------------
〒156-8691東京都世田谷区桜丘5-38-1
出版部(編集) 電話 03-3439-0172
ホールセール部(営業)電話 03-3439-0128
■今昔文字鏡 開発・製作
株式会社 エーアイ・ネット
〒220-0073 神奈川県横浜市西区岡野1-17-3
電話 045-311-0124
--------------------------------------------
■装幀:天野 誠
■カバーCG:荒木 慎司
c1999 Mojikyo Institute
印刷 : 株式会社デンショク
|