JIS_X_0213 - 暇つぶしWikipedia

JIS_X_0213

JIS X 0213は、JIS X 0208:1997を拡張した日本語用の符号化文字集合を規定する日本産業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である [1]。

2000年1月20日に制定、2004年2月20日、2012年2月20日に改正された [1]。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。

JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。
特徴

JIS X 0212（補助漢字）が頻度調査を中心に追加文字を選定し、典拠用例などは諸橋大漢和への参照情報を付加した程度だったのに対し、JIS X 0213ではJIS X 0208:1997 (JIS97) においてJIS X 0208の収載字体の用例・典拠を徹底して調べ上げ、同定したのと同様の手法で一般に使われる字（狭義の字体。以後「字」は狭義の「字体」を指す）でJIS X 0208に収録されていないものを追加した。そのため、JIS X 0212と同じ字が含まれていることもあるが、JIS X 0212では収録されていてもJIS X 0213では包摂規準を使って特に増やさなかった字がある。

拡張にあたっては、JIS X 0208の1997年改正で保留領域とされた部分に字を増やす方針で行われ、非漢字659字、第三水準として1249字、第四水準として2436字を追加した。実装では、JIS X 0208:1997で保留領域とされた部分に非漢字及び第三水準の文字を入れて第一面とし、その後ろに第四水準の文字を第二面として加えた。さらに2004年の改正で、第三水準に10字が追加され、168字の例示字形が変更された。

第二面は第一面と同じく94区94点で構成されているが、そのうち文字の存在する符号領域は1, 3?5, 8, 12?15, 78?94区に限られる。この奇妙な配置はJIS X 0212補助漢字の存在する場所を避けた結果である。これによりEUCエンコードされた文章でJIS X 0212補助漢字を用いたものとJIS X 0213第二面を用いたものの判別が可能である。さらに両方を用いることも原理的には可能である（ただし、その規格は存在しない）。

しかし、JIS X 0208:1997で保留領域とされた部分は、過去のJIS X 0208で自由領域とされ、実装各社によって外字領域として使用されていた部分であり、実態としては既に使われている領域であった。ここに新たに文字を配置した規格案に対し実装各社側より意見があり、最終審査において各種符号化方式が「参考」（規格本体ではない）とされることになった。その一方で、JIS X 0208の空き領域を規定通り未使用としていたUNIX系ソフトウェアでは対応が比較的容易であり、複数の実装が存在する。
JIS X 0208に対して追加された文字の概略

非漢字詳細は「JIS X 0213非漢字一覧」を参照

記述記号 - 逆疑問符、二分ダーシ、ダブルハイフン等

音声記号類 - セディーユ、マクロン、声調記号等（合成可能含む）

準仮名・漢字 - くの字点、ゆすり点、ます記号等

括弧記号 - ダブルミニュート、二重括弧、ギュメ等

学術記号 - 空集合、アレフ、エイチバー（プランク定数）等

単位記号 - ユーロ記号、リットル等

一般記号 - 著作権表示記号、トランプ記号、ビュレット、斜め矢印等

ローマ数字（大文字・小文字）

分数

拡張ラテン文字 - ダイアクリティカルマーク付きラテン文字各種

平仮名 - 半濁点付きのか行（鼻濁音）、「ヴ」「ヵ」「ヶ」に対応する平仮名

片仮名 - 半濁点付きのカ行（鼻濁音）、濁点付きのワ行、アイヌ語表記用片仮名

 ギリシア文字 - ファイナルシグマ（語末形）

丸付き数字、丸付き英小文字、丸付き片仮名

歯種記号左上、左下、右上、右下、正中過剰歯、上顎、下顎、（波付、波なし）

国内実装互換 - 組文字の「トン」、「ドル」等

ラテン1 (ISO/IEC 8859-1) 互換 - ソフトハイフン、上付き数字、ノーブレークスペース

漢字詳細は「JIS X 0213漢字一覧の1面」を参照詳細は「JIS X 0213漢字一覧の2面」を参照

第3水準漢字（以下の文字を含む）

JIS X 0208:1983で字体が大きく変更された29文字

人名用漢字許容字体（現在は人名用漢字に統合されている）・常用漢字表康熙字典体別掲字 [2]

地名

 部首

第4水準漢字

第3水準以外で頻繁に使用される漢字

 文字の表記方法

JIS X 0213ではJIS X 0208まで用いられていた「区点」に「面」を加え「面区点」となり、「面-区-点」でコード表記を行う。例えば1面3区33点の「A」は「1-3-33」とあらわす。
符号化方式
 JISベースの文字コード

符号化方式は、ISO/IEC 2022にそった形のみ「規定」としてあり、ISO-2022-JP-2004、Shift_JIS-2004、EUC-JIS-2004は「参考」として記述がある。これらのコード名は今のところIANAが登録していないので、MIME等では "X-" で始まる私用の名称として用いる必要があることになる。Shift_JIS-2004は、macOSやJava 7などでは既に実装しているが、Windowsでは従来のシフトJIS（コードページ932）と互換性がないことを理由に実装していないため、広く利用することができない。
Unicodeとの対応

JIS X 0213制定当時はいくつかの文字に対応する Unicode符号が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、符号化にあたり注意点がある。
サロゲートペア

漢字の内 CJK互換漢字領域に追加されたものを除くと基本多言語面 (BMP) 外のCJK統合漢字拡張Bに追加されることとなった。該当する文字は初版に302字、2004年追加分に1字の計303字ある。これらを使用する場合は、UTF-8では4バイト長コードに、UTF-16ではサロゲートペア（代用対）に対応する必要がある。UTF-32に対応している場合はそのまま使用可能である。

例えば1面14区2点の点の付いた「.mw-parser-output .jis2004font{font-family:"源ノ角ゴシック JP Normal","源ノ角ゴシック JP","Source Han Sans Normal","Source Han Sans","NotoSansJP-DemiLight","Noto Sans CJK JP DemiLight","ヒラギノ角ゴ ProN W3","ヒラギノ角ゴ ProN","Hiragino Kaku Gothic ProN","メイリオ",Meiryo,"新ゴ Pr6N R","A-OTF 新ゴ Pr6N R","小塚ゴシック Pr6N M","IPAexゴシック","Takaoゴシック","XANO明朝U32","XANO明朝","和田研中丸ゴシック2004絵文字","和田研中丸ゴシック2004ARIB","和田研中丸ゴシック2004P4","和田研細丸ゴシック2004絵文字","和田研細丸ゴシック2004ARIB","和田研細丸ゴシック2004P4","和田研細丸ゴシックProN",YOzFont04,"IPA Pゴシック","Yu Gothic UI","Meiryo UI","ＭＳＰゴシック";font-feature-settings:"jp04"1}𠀋」はU+2000Bに割り当てられた。

合成文字

非漢字の内半濁点付き仮名、アクセント付き国際音声記号で従来のUnicodeに単独の符号としてないもの、声調の上昇調、下降調を示す記号は二つのUnicode符号を組み合わせて表すこととなった。該当する文字は全部で25字ある。これらをOpenTypeで使用するには、オペレーティングシステムやアプリケーションが、OpenTypeのグリフ置換機能に対応する必要がある（この場合グリフ置換のうち、複数の隣り合うグリフをある一つのグリフに置換する機能を使用）。

例えば1面4区87点の半濁点付き「か?」は「か」のU+304Bの後に合成用半濁点のU+309Aを付けて表すこととなった。

1面11区69点の声調記号上昇調および1面11区70点声調記号下降調はU+02E5とU+02E9の組み合わせで表されるが、これはUnicode BookのChapter 7.8に基づくものである。これによると、U+02E5-U+02E9の5つの記号のうち複数が隣り合うと、上下の声調変化を示す記号ができるというものである。

Size:47 KB
出典: フリー百科事典『ウィキペディア（Wikipedia）』
担当:undef