用語の解説


  • 区点コード

    JIS(日本工業規格)では、定文字群を94の区に分け、更に区の中を94の点に分けて管理しています。この句と点を10進数で表現して組み合わせたコードを、区点コードといいます。JISでは94区までですが、各メーカによっては120区(またはそれ以上)まで拡張して使用しているものもあります。
  • JISコード

    区点コードの区と点それぞれを16進数に置き換え、更に 0x20を加えたものを組み合わせて4桁の16進数にしたものがJISコードです。
  • シフトJISコード

    パソコンにて最も一般的に採用されているコード体系。JISコードを、ある計算式によって別のコードエリアに シフトさせたものです。つまり、区点コードとJIS コード、シフトJISコードは、それぞれ容易に変換可能な関係にあります。
  • Unicode

    1993年に国際標準化機構(ISO)でISO/IEC 10646の一部(UCS-2)として標準化された文字コード体系です。JIS X 0221がこれにあたります。Windows NT/2000/XP にて採用されている2バイトコードです。
    一般的な シフトJISコードとは全く異なるコード体系であり、コードそのものに互換性はありません。私用領域(外字領域PUA)6,400文字分を有します。含まれる漢字は、マイクロソフト標準キャラクターセットの漢字と補助漢字です。このコード体系は Windows NT/2000/XP 上で使用可能ですが、Unicode に対応したアプリケーションやIMEが必要です。既にマイクロソフトの製品を始め多くの製品がUnicodeに対応しています。
    Unicode(JIS X 0221)=マイクロソフト標準キャラクターセット漢字(JIS X 0208+α) + 補助漢字(JIS X 0212)
    しかし、2バイト表記では最大65,536文字しか収録できないため、最初の規格が策定された後にハングル文字の追加や異体字表現方式の策定が行われ、部分的に3バイト以上を使用する体系に変化しています。このため、現在はUnicode全体は4バイトで定義(UCS-4)されています。
  • UCS(Universal multi-octet coded Character Set)

    ISO/IEC 10646-1として定められた国際文字集合。世界の主要な言語で使われる文字のほとんどを収録しています。31ビット(4バイト)のUCS-4と、その部分集合である16ビット(2バイト)のUCS-2があります。現在、Unicodeの主要部分を収録しているUCS-2が最も広く使われています。
  • ASCII コード

    いわゆる「1バイトコード」とか「半角文字」といった文字(英数字や記号類)を表わす16進数で2桁のコード体系。
  • 第1水準漢字、第2水準漢字(JIS X 0208)

    JIS X 0208 により定められた漢字。第1水準漢字は2,965文字、第2水準漢字は 3,390文字で、合計6,355文字です。但し、これは1990年の改訂後の数で、1978年 の制定時には、第2水準漢字は3,384文字でした。その後1983年に4文字、1990年に 2文字追加されました。また、1983年の改訂時に第1水準と第2水準の漢字の入れ替えが 22組(44字)あり、それを区別するために、1978年制定時のものを「旧JIS」または「78JIS」、 それ以降のものを「新JIS」、あるいは「83JIS」や「90JIS」と呼んだりします。最新の規格は 「JIS X 0208:1997」で、1997年に見直されていますが、文字の入替えや字体の変更は 一切行なわれませんでした。各メーカによって採用している規格(つまり「新JIS」か「旧JIS」か)が違っています。同じ第1水準の文字といってもメーカ間では異なった文字になることがあるので注意が必要です。
  • 補助漢字(JIS X 0212)

    JIS X 0212 により定められた漢字。第1水準と第2水準に含まれていない漢字5,801 文字が規定されています。規格上のコード体系としては、区点またはJISコードになっており、 第1、2水準の漢字コードと重なっています。従って、シフトJISコードを用いているOS上では、 フォントを切り替えて使用したりしない限り、第1、2水準の漢字と混在して使えません。 前記4.に記述されているとおり、Unicode には補助漢字が含まれています。従って、WindowsNT/2000/XP 上でUnicodeに対応した専用のアプリケーションを使用し、Unicodeにて入出力できれば、 第1、2水準の漢字とともに補助漢字を使用することができます。
  • 第3水準漢字、第4水準漢字(JIS X 0213)

    2000年はじめに制定された、新しい文字セット。前記7.の第1、2水準では足りないとされる人名漢字を中心に文字が選定されました。第3水準が1,249文字、第4水準が2,436文字の合計3,685文字の漢字が採用されました。ただし、これらの中には補助漢字と重複している文字が多数あり、全く新しく加えられた文字としては1000字足らずです。
    2004年2月に改正されました。改正後の規格名は「JIS X 0213:2005」となります。
    改正内容の主な点は例示字体168字の変更と「表外漢字UCS互換」として10文字の追加、すべての面区点位置が正規のUCS符号位置に対応付けられたことです。結合文字、アイヌ文字、発音記号などを表すのに2つのUCS符号位置を使っているので現在のWindowsXPなどでは表示できません。
    10文字追加はUCSにおける「CJK互換漢字」と対応させていますが、これは「CJK統合漢字]の統合化された文字の形として含まれているものもあります。 マイクロソフトの次期クライアント用Windows(Longhorn)にバンドルされる「MS 明 朝」や「MS ゴシック」で実装されるらしいですが2006年以降になりそうです。
  • メーカ固有文字

    各メーカは、それぞれ独自の漢字セットを保有しています。ここでいう「基本漢字セット」である第1、2水準の漢字については、旧JISか新JISかといった違いがありますが、それ以外の拡張部分は各社各様です。例えば、富士通のJEF拡張文字セットや日本電気のG1セットといわれる拡張文字部分がこれにあたります。これらは補助漢字とも異なりますが、一部重複しています。
    KanjiLink では「メーカ固有漢字セット」として扱います。
  • マイクロソフト標準キャラクターセット

    マイクロソフトが定めた文字セット。JIS X 0208-1990(新JIS)に加えて、以下の非 JIS文字を 含みます。

    • NEC特殊文字(シフトJIS 0x873F~0x879F 83文字)
    • NEC選定IBM拡張文字(シフトJIS 0xED40~0xEEFC 374文字)
    • IBM拡張文字(シフトJIS 0xFA40~0xFC4B 388文字)

    Windows 上では、シフトJISコードを使う限り、このマイクロソフト標準キャラクターセットに よって文字が割付けられている部分のコードしか使用できません。
  • TrueTypeフォント

    Windowsでの標準アウトラインフォント。内部コードとしてはUnicodeで記述されています。しかし、Windows側でシフトJIS変換を行なったりしているので、UnicodeでもシフトJISでも同じTrueTypeフォントが使用できます。つまり、フォント側からみれば、シフトJISとUnicodeというのは使用できる文字数が違うという意味になります。

資料請求・お問い合わせはこちらから

イースト株式会社 FE外字製品サポート

資料請求・お問い合わせ