JIS_X_0213
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

人名用漢字許容字体(現在は人名用漢字に統合されている)・常用漢字表康熙字典体別掲字 [2]

地名

部首


第4水準漢字

第3水準以外で頻繁に使用される漢字



文字の表記方法

JIS X 0213ではJIS X 0208まで用いられていた「区点」に「」を加え「面区点」となり、「面-区-点」でコード表記を行う。例えば1面3区33点の「A」は「1-3-33」とあらわす。
符号化方式
JISベースの文字コード

符号化方式は、ISO/IEC 2022にそった形のみ「規定」としてあり、ISO-2022-JP-2004Shift_JIS-2004EUC-JIS-2004は「参考」として記述がある。これらのコード名は今のところIANAが登録していないので、MIME等では "X-" で始まる私用の名称として用いる必要があることになる。Shift_JIS-2004は、macOSJava 7などでは既に実装しているが、Windowsでは従来のシフトJIS(コードページ932)と互換性がないことを理由に実装していないため、広く利用することができない。
Unicodeとの対応

JIS X 0213制定当時はいくつかの文字に対応するUnicode符号が存在しなかったが、Unicode 3.1およびUnicode 3.2で追加された。ただし、符号化にあたり注意点がある。
サロゲートペア

漢字の内
CJK互換漢字領域に追加されたものを除くと基本多言語面 (BMP) 外のCJK統合漢字拡張Bに追加されることとなった。該当する文字は初版に302字、2004年追加分に1字の計303字ある。これらを使用する場合は、UTF-8では4バイト長コードに、UTF-16ではサロゲートペア(代用対)に対応する必要がある。UTF-32に対応している場合はそのまま使用可能である。

例えば1面14区2点の点の付いた「.mw-parser-output .jis2004font{font-family:"源ノ角ゴシック JP Normal","源ノ角ゴシック JP","Source Han Sans Normal","Source Han Sans","NotoSansJP-DemiLight","Noto Sans CJK JP DemiLight","ヒラギノ角ゴ ProN W3","ヒラギノ角ゴ ProN","Hiragino Kaku Gothic ProN","メイリオ",Meiryo,"新ゴ Pr6N R","A-OTF 新ゴ Pr6N R","小塚ゴシック Pr6N M","IPAexゴシック","Takaoゴシック","XANO明朝U32","XANO明朝","和田研中丸ゴシック2004絵文字","和田研中丸ゴシック2004ARIB","和田研中丸ゴシック2004P4","和田研細丸ゴシック2004絵文字","和田研細丸ゴシック2004ARIB","和田研細丸ゴシック2004P4","和田研細丸ゴシックProN",YOzFont04,"IPA Pゴシック","Yu Gothic UI","Meiryo UI","MS Pゴシック";font-feature-settings:"jp04"1}𠀋」はU+2000Bに割り当てられた。


合成文字

非漢字の内半濁点付き仮名、アクセント付き
国際音声記号で従来のUnicodeに単独の符号としてないもの、声調の上昇調、下降調を示す記号は二つのUnicode符号を組み合わせて表すこととなった。該当する文字は全部で25字ある。これらをOpenTypeで使用するには、オペレーティングシステムやアプリケーションが、OpenTypeのグリフ置換機能に対応する必要がある(この場合グリフ置換のうち、複数の隣り合うグリフをある一つのグリフに置換する機能を使用)。

例えば1面4区87点の半濁点付き「か?」は「か」のU+304Bの後に合成用半濁点のU+309Aを付けて表すこととなった。

1面11区69点の声調記号上昇調および1面11区70点声調記号下降調はU+02E5とU+02E9の組み合わせで表されるが、これはUnicode BookのChapter 7.8に基づくものである。これによると、U+02E5-U+02E9の5つの記号のうち複数が隣り合うと、上下の声調変化を示す記号ができるというものである。

˩˥(U+02E9 U+02E5)、˥˩(U+02E5 U+02E9)
CJK互換漢字の正規化「CJK互換漢字#日本語処理における問題点」も参照

JIS X 0213とUnicodeでは包摂規準が異なる。そこで JIS X 0213 での人名用漢字の字形(字体)を区別するために、一部の文字をUnicodeではCJK互換漢字として収録している。CJK互換漢字は、Unicode正規化によりCJK統合漢字に分解(変換)される。この対応として互換漢字用の異体字セレクタ(SVS)を使用して変換前の情報を維持する必要がある。また、CJK統合漢字と字形選択子(英語版)の組み合わせを1文字として処理する必要もある。SVS対応フォントとしてはIPAexフォント、モリサワのAP版書体などがある。

例えば、KS X 1001由来のCJK互換漢字が誤って入力された場合に、入力エラーとせずUnicode正規化処理で対処する方式(CJK統合漢字のみに変換)を採用すると、CJK互換漢字に収録されている人名用漢字が入力された場合に意図せず変換されてしまう。[3][4]

例えば、神(U+FA19)をUnicode正規化すると神(U+795E)となる。これをSVSを使って 神︀(U+795E U+FE00)とすることで元のCJK互換漢字(の情報、字形)を維持する(SVSの数値文字参照に対応しない閲覧環境では表示が異なることに注意が必要[3])。


CJK互換漢字のIVS対応

CJK互換漢字やCJK統合漢字+SVSを使用せず、CJK統合漢字と字形選択子補助
(英語版)の組み合わせ(IVS/IVD対応)により異体字(Unicodeでは包摂されるが、JIS X 0213として別の字体)を表現する場合、JIS X 0213の文字をこの組み合わせに変換する方法(複数あるため1つの方法を選んで変換)と、組み合わせを処理および表現(IVS対応フォントの導入)する必要がある。異体字セレクタ#実装も参照。




例えば、IVSとしてAdobe-Japan1コレクションを使用すると神(U+FA19)は神󠄀(U+795E U+E0100)となる。(游書体ヒラギノ花園フォントなどのIVS対応フォントが必要である)

例えば、IVSとして文字情報基盤整備事業のMoji_Johoコレクションを使用すると神(U+FA19)は神󠄃(U+795E U+E0103)となる。(IPAmj明朝花園フォントなどのIVS対応フォントが必要である)


各OSでの対応状況

なお、Windows Vista以降やmacOSではこれらに対応している。Windows XPではサロゲートペア(代用対)に対応しており、Service Pack 2以上を適用することによってグリフ置換にも対応する。Windows 2000はサロゲートペアに対応しているものの初期設定では無効化されておりレジストリの設定が必要である(Help:特殊文字#古代文字と人工文字参照)。またグリフ置換には未対応である。

アプリケーション側の対応も必要である。Microsoft OfficeのXP以降のバージョンやWindows Vistaに付属するInternet Explorer 7.0、Windows XP以降に付属するメモ帳やワードパッドなどでは対応済みである。
ほかの実装方法

JIS X 0213が制定されてすぐのころは、UnicodeにはJIS X 0213が実装されていなかったため、
外字領域に文字を定義して使用することが多く行われていた。いくつかのフリーフォントではそのような実装が行われている[※ 1]

日本のデータ放送などで使用されるARIB STD-B24では、ARIBの文字符号化方法の文字セットとしてJIS X 0213が使用可能となっている。「JIS互換漢字1面集合」でJIS X 0213:2004の1面、「JIS互換漢字2面集合」でJIS X 0213:2004の2面が使用される。この符号化方式の中には「国際符号化文字集合」を使用する方法があり、通常のUnicodeのマッピングのほか、「BMPセット」としてUnicodeでの「基本多言語面」で全てを表現できるようにJIS X 0213での「追加漢字面」の文字を「基本多言語面」の外字領域にマッピングしなおした文字セットが別に使用可能とされている。

JAVA 7では通常のShift_JIS-2004形式の実装(x-SJIS_0213)のほかShift_JIS-2004にMicrosoftコードページ932を上書きした符号化方式(x-MS932_0213)に対応している。

先行実装との互換性

JIS X 0213の第1面13区にはNEC特殊文字が、一部を除き同じ面区点番号で登録されている。NEC特殊文字はPC-9801やWindowsで幅広く使われていたにもかかわらず、機種依存文字であった。
JIS X 0213:2004の改正

表1: JIS X 0213:2004 により変更された文字変更のあった文字
.mw-parser-output .jis90font{font-family:"Hiragino Kaku Gothic Pro","ヒラギノ角ゴ Pro","ヒラギノ角ゴ Pro W3","A-OTF 新ゴ Pro R","ヒラギノ角ゴ2","ヒラギノ角ゴ3","ヒラギノ角ゴ4","小塚ゴシック Pro R","小塚ゴシック Pro","SH G30-P","FC平成角ゴシック体","FA ゴシック","IPA モナー ゴシック","VL ゴシック","Droid Sans Japanese","MS PRゴシック","TGothic-GT01","東風ゴシック","さざなみゴシック","Komatuna","M+1P+IPAG","Mona","JSPゴシック","AR P丸ゴシック体M","EPSON 丸ゴシック体M","Osaka","CRPC&Gれいしっく","FGP平成明朝体W3","GT2000-01","和田研細丸ゴシック2000P","和田研細丸ゴシック2000P4",YOzFont90,YOzFontN90,"Yu Gothic UI","Meiryo UI";font-variant-east-asian:jis90}逢芦飴溢茨鰯淫迂厩噂餌襖迦牙廻恢晦蟹葛鞄釜翰翫徽
祇汲灸笈卿饗僅喰櫛屑粂祁隙倦捲牽鍵諺巷梗膏鵠甑叉
榊薩鯖錆鮫餐杓灼酋楯薯藷哨鞘杖蝕訊逗摺撰煎煽穿箭
詮噌遡揃遜腿蛸辿樽歎註瀦捗槌鎚辻挺鄭擢溺兎堵屠賭
瀞遁謎灘楢禰牌這秤駁箸叛挽誹樋稗逼謬豹廟瀕斧蔽瞥
蔑篇娩鞭庖蓬鱒迄儲餅籾爺鑓愈猷漣煉簾榔?冤叟咬嘲
囀徘扁棘橙狡甕甦疼祟竈筵篝腱艘芒虔蜃蠅訝靄靱騙鴉
字体の変更前後の比較(
GIFアニメ


例示字形の変更

JIS X 0213:2004は、JIS X 0213:2000の例示字形を変更している。変更があったのは表1の通りである。

全部で168字あり、おおむね、拡張新字体から、いわゆる康熙字典体型へ変更されている。「叉」や「釜」などは筆押さえを取っている。また、「蟹」(「解」と「虫」を離した)や「祟」(出を小さくした)などのように違いが分かりにくいものもある。

この変更は、国語審議会の答申「表外漢字字体表」に示されている字体に合わせるものである。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:47 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef