JIS_X_0208
[Wikipedia|▼Menu]
1-38‘LEFT SINGLE QUOTATION MARK
1-39’RIGHT SINGLE QUOTATION MARK
1-76′PRIME
2/13-HYPHEN-MINUS1-30‐HYPHEN
1-61?MINUS SIGN
7/14~TILDE対応する文字はない
対応する文字はない1-33?WAVE DASH

これは、漢字集合が世界で最も普及している符号化文字集合の上位互換でないことを意味し、この規格の欠点の1つに数えられる。

漢字集合およびIRVの集合に共通する特殊文字、数字およびラテン文字90文字についても、この規格では、ISO/IEC 646の配列を踏襲していない。90文字は漢字集合の1区から4区までに分かれて収録されている。

「漢字集合の数字、ラテン文字などは『全角英数字』であって、IRVの文字とは異なる」との解釈に基づく実装が発生・普及した原因は、これらの非互換性のためだと考えられる。

第1次規格以来、丸付き数字や「キロ」「メートル」などの合字およびローマ数字は、文字の合成によって表現できるとされ[注釈 4]、独立した区点位置を与えられなかった。情報機器を製造する各社は、顧客が必要とするこれらの文字を、文字の合成により表現できるようにするのでも、規格に追加するよう求めるのでもなく、外字として独自に提供する道を選んだ。

1997年の第4次規格では、すべての文字が現在位置の前進動作を伴う文字すなわちスペーシング文字 (spacing character) であることが明確にされたうえ、文字の合成をおこなってはならないと規定された。このため、ダイアクリティカルマークつきのラテン文字は、2区82点のオングストローム (A) を唯一の例外として、表現できないことになった。
平仮名および片仮名

JIS X 0208の平仮名および片仮名においては、JIS X 0201の片仮名に含まれない濁点つきの仮名および半濁点つきの仮名が含まれる。JIS X 0201の片仮名に含まれない「ヰ」「ヱ」および「ヮ」も含まれる。

JIS X 0208の仮名の配列は、JIS X 0201の片仮名の配列と異なっている。JIS X 0201では、小文字(小書きの仮名)は小文字で、大文字(清音の文字)は大文字で、それぞれ五十音順に配列されている(ヲァィゥェォャュョッーアイウエオ……ラリルレロワン)。一方、JIS X 0208では、小文字、大文字、濁点つきの文字および半濁点つきの文字を一括して五十音順で、五十音順で同順位の場合は小文字、大文字、濁点つきの文字、半濁点つきの文字の順序で、配列されている(ぁあぃいぅうぇえぉお……っつづ……はばぱひびぴふぶぷへべぺほぼぽ……ゎわゐゑをん)。この配列は、仮名文字列の簡易的な辞書順ソートを容易にするために採用された(安岡ほか 2006)[注釈 5]

この規格には、先に制定されたJIS X 0201の片仮名の配列が踏襲されなかった。JIS X 0201の片仮名を「半角仮名」(「半角カタカナ」とも呼ばれる)として、この規格の片仮名と区別する実装が発生した原因は、この非互換性にあると考えられる。その点もこの規格の欠点の一つである。
漢字

この規格の漢字が、何を典拠としてどのように選ばれ、何に基づいて第1水準および第2水準に振り分けられ、どのように配列されたかは、1997年の第4次規格の規格票の解説に詳しい。それによると、つぎの4つの漢字表に含まれる漢字が、1978年の第1次規格の6,349文字に採用された。
標準コード用漢字表(試案)
情報処理学会漢字コード委員会が1971年に編纂したものである。下記の『対応分析結果』には6,086文字が見える。
行政情報処理用基本漢字
行政管理庁が1975年に選定したもので、2,817文字からなる。選定のための資料として、行政管理庁は、『標準コード用漢字表 (試案)』をはじめとする複数の漢字表を対照した資料『行政情報処理用標準漢字選定のための漢字の使用頻度および対応分析結果』(『対応分析結果』)を作成した[3]
日本生命収容人名漢字
『対応分析結果』を構成する漢字表の一つで、3,044文字からなる。日本生命が契約者の氏名から抽出した漢字とされるが、第1次規格の原案作成委員会の時点で原典が存在せず、『対応分析結果』に転記されていた[3]
国土行政区画総覧使用漢字
『対応分析結果』を構成する漢字表の一つで、3,251文字からなる。国土地理協会が編集している日本全国の字までの行政地名の一覧表『国土行政区画総覧』に使用されていた漢字である。原案作成委員会は『国土行政区画総覧』そのものを調査せず、それに使用された漢字は『対応分析結果』を通じて規格に反映された。

第2次規格および第3次規格で、それぞれ4文字および2文字の第2水準漢字が追加され、漢字は6,355文字になった。第2次規格では字形の変更および水準間の漢字の入れ替えが行われ、第3次規格でも字形の変更が行われた。これについては後述する。
水準分け

第1水準は、当用漢字字体表、当用漢字補正案および人名用漢字別表を基本として、多種の漢字表に共通して出現する文字が選ばれた。JIS C 6260(都道府県コード、現在のJIS X 0401)およびJIS C 6261(市区町村コード、現在のJIS X 0402)を参照して、都道府県名および市区町村名に使用される漢字がすべて第1水準に含まれるように意図された。さらに専門家による調整が加えられた。

しかし安岡 (2001a) によれば作業漏れがあったようで、安岡は印旛郡印旛村の「旛」(58-57) および泗水町の「泗」(61-89) が第1水準に含まれていないことを指摘している。

第2水準には、上記の主要4漢字表に出現して第1水準から漏れた漢字が収められた。次に記すように、第1水準は漢字の音訓に基づいて並べられたので、音訓がわかりにくい漢字の中には第1水準から第2水準にまわされたものもある(西村 1978)。

一般的に第1水準は使用頻度の高い漢字、第2水準は使用頻度の低い漢字とされるが、水準分けはもちろんJIS漢字制定当時の基準であるので、時代の流れによって今日では「翔」や「煌」といった第2水準だがよく使われるようになった漢字、逆に「糎」や「粍」といった第1水準だがあまり使われなくなった漢字も多数存在する。人名用漢字別表にはJIS漢字制定後に追加されたものの中には第2水準のものもいくつか存在する。

実際の人名が収録されたと思われた『日本生命収容人名漢字』は選定に寄与したとされるが、秋田県に多い苗字である草gの「g」が含まれていないなど網羅性に不備があったとされる[3]。参照時点で原典が存在せず転記となっているなど正確性も不明であった。

1990年代以降はほとんどのシステムで第2水準漢字まで使えるようになり、文字コードもUnicodeへ移行しつつあるため、使用したい漢字が第1水準か第2水準か気にする必要はほとんどなくなった。しかし、数千字もある漢字フォントを作るには、相当の手間と時間がかかるため、フリーのフォントなどでは一部の漢字しか収録しないことがある。その際、水準を基準にして収録するかしないかを決めることもある(第1水準しか収録していないフォントもある)。
配列

第1水準漢字は、この規格独自の代表音訓、すなわち各漢字についてそれぞれ一つずつ定めた音または訓、の順に配列された[注釈 6]。原則として、音が代表音訓とされ、音が複数ある(異表記の漢音呉音唐音など)漢字については「使用度が優勢」と判断された音が代表音訓として採用された(JIS C 6226-1978規格票解説3.4)。音が存在しないか一般的でない漢字については、訓が代表音訓とされた。動詞の訓を代表音訓とするときは、終止形ではなく連用形が代表音訓とされた。

例えば、16区1点から41点までに代表音訓が「あ」で始まる41文字が配列されている。このうち、「葵」(キ、あおい、16-10)、「粟」(ゾク、ショク、あわ、16-32) など22文字は訓を代表音訓としている。「逢」(ホウ、あい、16-09)、「扱」(ソウ、キュウ、あつかい、16-23)などは動詞の連用形が代表音訓とされた例である。

代表音訓を同じくする漢字の中では、音を代表音訓とする漢字が先に、訓を代表音訓とする漢字が後に並べられ、音または訓を同じくする漢字の中では、部首および画数の順に並べられた。

第1水準にあっても第2水準にあっても、異体字は基本的に親字の直後にまとめて配列された。例えば、第2水準において、49区88点の「劍」の直後には、原則である画数順を乱して「劔」、「劒」および「剱」が配列されている[注釈 7]

第2水準漢字集合は、部首および画数の順に配列された。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:79 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef