JIS X 0213ではJIS X 0208まで用いられていた「区点」に「面」を加え「面区点」となり、「面-区-点」でコード表記を行う。例えば1面3区33点の「A」は「1-3-33」とあらわす。 符号化方式は、ISO/IEC 2022にそった形のみ「規定」としてあり、ISO-2022-JP-2004、Shift_JIS-2004、EUC-JIS-2004は「参考」として記述がある。これらのコード名は今のところIANAが登録していないので、MIME等では "X-" で始まる私用の名称として用いる必要があることになる。Shift_JIS-2004は、macOSやJava 7などでは既に実装しているが、Windowsでは従来のシフトJIS(コードページ932)と互換性がないことを理由に実装していないため、広く利用することができない。 JIS X 0213制定当時はいくつかの文字に対応するUnicode符号が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、符号化にあたり注意点がある。
符号化方式
JISベースの文字コード
Unicodeとの対応
サロゲートペア
漢字の内CJK互換漢字領域に追加されたものを除くと基本多言語面 (BMP) 外のCJK統合漢字拡張Bに追加されることとなった。該当する文字は初版に302字、2004年追加分に1字の計303字ある。これらを使用する場合は、UTF-8では4バイト長コードに、UTF-16ではサロゲートペア(代用対)に対応する必要がある。UTF-32に対応している場合はそのまま使用可能である。
例えば1面14区2点の点の付いた「.mw-parser-output .jis2004font{font-family:"源ノ角ゴシック JP Normal","源ノ角ゴシック JP","Source Han Sans Normal","Source Han Sans","NotoSansJP-DemiLight","Noto Sans CJK JP DemiLight","ヒラギノ角ゴ ProN W3","ヒラギノ角ゴ ProN","Hiragino Kaku Gothic ProN","メイリオ",Meiryo,"新ゴ Pr6N R","A-OTF 新ゴ Pr6N R","小塚ゴシック Pr6N M","IPAexゴシック","Takaoゴシック","XANO明朝U32","XANO明朝","和田研中丸ゴシック2004絵文字","和田研中丸ゴシック2004ARIB","和田研中丸ゴシック2004P4","和田研細丸ゴシック2004絵文字","和田研細丸ゴシック2004ARIB","和田研細丸ゴシック2004P4","和田研細丸ゴシックProN",YOzFont04,"IPA Pゴシック","Yu Gothic UI","Meiryo UI","MS Pゴシック";font-feature-settings:"jp04"1}𠀋」はU+2000Bに割り当てられた。
合成文字
非漢字の内半濁点付き仮名、アクセント付き国際音声記号で従来のUnicodeに単独の符号としてないもの、声調の上昇調、下降調を示す記号は二つのUnicode符号を組み合わせて表すこととなった。該当する文字は全部で25字ある。これらをOpenTypeで使用するには、オペレーティングシステムやアプリケーションが、OpenTypeのグリフ置換機能に対応する必要がある(この場合グリフ置換のうち、複数の隣り合うグリフをある一つのグリフに置換する機能を使用)。
例えば1面4区87点の半濁点付き「か?」は「か」のU+304Bの後に合成用半濁点のU+309Aを付けて表すこととなった。
1面11区69点の声調記号上昇調および1面11区70点声調記号下降調はU+02E5とU+02E9の組み合わせで表されるが、これはUnicode BookのChapter 7.8に基づくものである。これによると、U+02E5-U+02E9の5つの記号のうち複数が隣り合うと、上下の声調変化を示す記号ができるというものである。
˩˥(U+02E9 U+02E5)、˥˩(U+02E5 U+02E9)
CJK互換漢字の正規化「CJK互換漢字#日本語処理における問題点」も参照
JIS X 0213とUnicodeでは包摂規準が異なる。そこで JIS X 0213 での人名用漢字の字形(字体)を区別するために、一部の文字をUnicodeではCJK互換漢字として収録している。CJK互換漢字は、Unicode正規化によりCJK統合漢字に分解(変換)される。この対応として互換漢字用の異体字セレクタ(SVS)を使用して変換前の情報を維持する必要がある。また、CJK統合漢字と字形選択子
例えば、KS X 1001由来のCJK互換漢字が誤って入力された場合に、入力エラーとせずUnicode正規化処理で対処する方式(CJK統合漢字のみに変換)を採用すると、CJK互換漢字に収録されている人名用漢字が入力された場合に意図せず変換されてしまう。[3][4]
例えば、神(U+FA19)をUnicode正規化すると神(U+795E)となる。これをSVSを使って 神︀(U+795E U+FE00)とすることで元のCJK互換漢字(の情報、字形)を維持する(SVSの数値文字参照に対応しない閲覧環境では表示が異なることに注意が必要[3])。
CJK互換漢字のIVS対応
CJK互換漢字やCJK統合漢字+SVSを使用せず、CJK統合漢字と字形選択子補助(英語版
なお、Windows Vista以降やmacOSではこれらに対応している。Windows XPではサロゲートペア(代用対)に対応しており、Service Pack 2以上を適用することによってグリフ置換にも対応する。Windows 2000はサロゲートペアに対応しているものの初期設定では無効化されておりレジストリの設定が必要である(Help:特殊文字#古代文字と人工文字参照)。またグリフ置換には未対応である。
アプリケーション側の対応も必要である。Microsoft OfficeのXP以降のバージョンやWindows Vistaに付属するInternet Explorer 7.0、Windows XP以降に付属するメモ帳やワードパッドなどでは対応済みである。
ほかの実装方法
JIS X 0213が制定されてすぐのころは、UnicodeにはJIS X 0213が実装されていなかったため、外字領域に文字を定義して使用することが多く行われていた。いくつかのフリーフォントではそのような実装が行われている[※ 1]。
日本のデータ放送
JIS X 0213の第1面13区にはNEC特殊文字が、一部を除き同じ面区点番号で登録されている。NEC特殊文字はPC-9801やWindowsで幅広く使われていたにもかかわらず、機種依存文字であった。 表1: JIS X 0213:2004 により変更された文字変更のあった文字 JIS X 0213:2004は、JIS X 0213:2000の例示字形を変更している。変更があったのは表1の通りである。 全部で168字あり、おおむね、拡張新字体から、いわゆる康熙字典体型へ変更されている。「叉」や「釜」などは筆押さえを取っている。また、「蟹」(「解」と「虫」を離した)や「祟」(出を小さくした)などのように違いが分かりにくいものもある。 この変更は、国語審議会の答申「表外漢字字体表」に示されている字体に合わせるものである。
JIS X 0213:2004の改正
.mw-parser-output .jis90font{font-family:"Hiragino Kaku Gothic Pro","ヒラギノ角ゴ Pro","ヒラギノ角ゴ Pro W3","A-OTF 新ゴ Pro R","ヒラギノ角ゴ2","ヒラギノ角ゴ3","ヒラギノ角ゴ4","小塚ゴシック Pro R","小塚ゴシック Pro","SH G30-P","FC平成角ゴシック体","FA ゴシック","IPA モナー ゴシック","VL ゴシック","Droid Sans Japanese","MS PRゴシック","TGothic-GT01","東風ゴシック","さざなみゴシック","Komatuna","M+1P+IPAG","Mona","JSPゴシック","AR P丸ゴシック体M","EPSON 丸ゴシック体M","Osaka","CRPC&Gれいしっく","FGP平成明朝体W3","GT2000-01","和田研細丸ゴシック2000P","和田研細丸ゴシック2000P4",YOzFont90,YOzFontN90,"Yu Gothic UI","Meiryo UI";font-variant-east-asian:jis90}逢芦飴溢茨鰯淫迂厩噂餌襖迦牙廻恢晦蟹葛鞄釜翰翫徽
祇汲灸笈卿饗僅喰櫛屑粂祁隙倦捲牽鍵諺巷梗膏鵠甑叉
榊薩鯖錆鮫餐杓灼酋楯薯藷哨鞘杖蝕訊逗摺撰煎煽穿箭
詮噌遡揃遜腿蛸辿樽歎註瀦捗槌鎚辻挺鄭擢溺兎堵屠賭
瀞遁謎灘楢禰牌這秤駁箸叛挽誹樋稗逼謬豹廟瀕斧蔽瞥
蔑篇娩鞭庖蓬鱒迄儲餅籾爺鑓愈猷漣煉簾榔?冤叟咬嘲
囀徘扁棘橙狡甕甦疼祟竈筵篝腱艘芒虔蜃蠅訝靄靱騙鴉
字体の変更前後の比較(GIFアニメ)
例示字形の変更