全角
[Wikipedia|▼Menu]
印刷物の組版では、文字の実際の字取りは全角と半角に区分できるものではない。約物の字取りは前後の文脈によって変わりうるし、欧文の文字は幅が不定である。ある文字がどれだけの幅を占めるかは組版規則によって決まる。そのため、印刷所への電子入稿やDTPソフトウェアへの入力などの際には、原稿データ中で同じ文字は同じ符号で表されているほうが都合がよい。ところが2つの符号で表しうる文字があり、両者が混在するために、正規化の前処理が必要になるといった問題も起きている[注釈 1]
携帯電話

日本の携帯電話端末のうち、多くのフィーチャーフォンの画面における文字表示は、ほとんど等幅で、「全角=正方形の幅」か「半角=正方形を半分に割った幅」での表示となる。記号(一部を除く)、カタカナラテン文字アラビア数字は全角、半角両方の表示が可能である。ギリシャ文字キリル文字は全角しかなく、ウェブブラウザ上でもこれらの文字はすべて全角(2バイト文字)で表示される。
文字コード規格における全角と半角
JISの代替名称

図1 JIS X 0201とJIS X 0213に規定される文字と代替名称の文字との関係。

1978年、東アジアの文字集合に関する初の公的規格として、JIS C 6226(後にJIS X 0208と改称)が制定された。これは1文字を2バイトで表すマルチバイト文字集合で、現代日本語の文書で用いられる漢字仮名記号類などを収録したものである。これに先立ち、ISO/IEC 646の日本での国内使用のための規格としてJIS C 6220(後にJIS X 0201と改称)も制定されていた。

JIS C 6226の制定作業の当初は、JIS C 6220に規定するラテン文字集合(ISO/IEC 646日本版)と仮名文字集合(片仮名)を符号表の初めに置き、前者を後者の拡張規格とすることが想定されていたが、この案は制定の過程で見送られた[注釈 2]。JIS C 6220の記号類の多くが1に、ラテン文字と数字は3区に、片仮名は5区に、あらためて収録された(ただし、濁点半濁点のある文字が、ない文字とは別に符号位置を与えられた)。この結果、同じ文字が2つのJIS規格で規定されることになった。

各ベンダはJIS X 0208に準じた文字コード体系を採用し、それに対応したフォントも製造されるようになったが、JIS X 0208に規定される文字のグリフはしばしば漢字などと同じ幅に、JIS X 0201のそれはその半分の幅に作られた。JIS X 0208を応用したベンダ標準の中には、EUC-JPのように文字の幅を定義したものもある[10]。このため、「JIS X 0208は全角、JIS X 0201は半角」との理解が広まることになり、さらに、両方の文字集合に収録された文字は重複して符号化され、「全角」と「半角」のふたつの字形を持つとみなされることになった。実際には、JIS X 0208では個々の文字の幅を規定してはいない。

JIS C 6226の第4次規格であるJIS X 0208:1997では、JIS X 0201とJIS X 0208で規定するすべての文字をUnicodeの文字と対応づけ、JIS X 0208で規定される文字のうちASCIIISO/IEC 646国際基準版)またはJIS X 0201のラテン文字集合に規定される文字と同じものは用いないとすることで、重複符号化を排した。ただし、全角形のラテン文字類および半角形の片仮名類については附属書5(規定)で「文字の代替名称」を定め、「これまでの慣用的な利用との互換を目的としてだけ〔…〕異なった図形文字として用いてもよい」として、「一時的に重複符号化を容認する」という方針をとった[11]。この規定はJIS X 0208の後を受けたJIS X 0213にも引き継がれることになった。#図1に、JISの2つの文字集合規格の文字と代替名称の関係を示す。
ARIB文字コード

日本のデータ放送文字放送などで用いられるARIBの文字コード規格においては厳密に全角文字と半角文字とプロポーショナル文字のコードが規定されている規格がある(JIS X 0201の文字集合は半角として、JIS X 0208の文字集合は全角として決められている)。これにより、文字により画面上のレイアウトを表現することが可能にしているほか、モザイクなどの表現も可能となる。したがって、ARIBに対応したフォントは厳密に全角、半角を実装する必要がある[12]。(ARIB外字も参照)
その他の東アジアの文字集合規格

JIS C 6226 (JIS X 0208) 制定の後、中国GB 2312台湾CNS 11643韓国のKS C 5601-1987(後にKS X 1001と改称)といった東アジアの漢字集合規格が、相次いで制定された。これらはいずれもJIS X 0208と同じ構造を持っている。つまり、マルチバイト文字集合であり、シングルバイト文字集合(ISO/IEC 646の各地域版またはASCII)と併用することができるが、自身にもシングルバイト文字集合と同一の字形の文字を収録している。そのため、やはり重複符号化の問題がつきまとう。

たとえば1981年に施行されたGB 2312-80では、GB 1988-80(ISO/IEC 646中国版)の文字集合と同じ字形の文字を、符号の配列順を変えずに3区に収録している。
UnicodeのEast_Asian_Width特性詳細は「東アジアの文字幅」を参照

Unicode標準では、文字のひとつひとつにさまざまな特性を定義して文字を区別しやすくすることで、テキストデータの処理に役立てようとしている。附属書11 (UAX#11) では参考 (informative) 特性として、東アジアの文字集合の文脈での文字幅を表すEast_Asian_Width特性を定義している[13]
その他の文字集合規格

アドビが定めているAdobe-Japan1文字コレクションでは、全角文字、半角文字、プロポーショナル文字にそれぞれ別のコードを与えている。また、超漢字などで使用されるTRONコードでは、文字幅の区別はしない。
文字コード規格以外における全角と半角

日本語のキーボードは、半角/全角キーが存在する種類が一般的である。このキーは、JIS X 4064「仮名漢字変換システムの基本機能」の付属書2ではAltキーと同時に押下することで仮名漢字変換機能の起動と終了を行う漢字キーになるとされている。仮名漢字変換システムの種類により半角/全角キーの動作は異なるが、Microsoft Windowsでは多くの場合、半角/全角キーのみで漢字キーの機能を行える。
脚注[脚注の使い方]
注釈^ このような状況がうかがえる主張として例えば次の小文を参照[9]
^ JIS X 0208:1997『7ビット及び8ビットの2バイト情報交換用符号化漢字集合』日本規格協会、1997年、解説2.2.3(p.378)頁。"符号化文字集合規格としては, ISO 646との整合性を保つため, ISO 646で規定する図形文字については, 符号位置を変更してはならなかったはずである。〔中略〕この点では, この規格で規定する符号化文字集合の非漢字部分は, 第1次規格〔JIS C 6226-1978〕以来, 本来の意図とは異なっており, 国際規格と整合的ではない。"。 (句読点は原文のまま)

出典^ 藤森善貢『編集出版技術』 上巻 出版総論・編集・製作・校正・装幀編(第2版)、日本エディタースクール出版部、1978年、pp.192ff頁。.mw-parser-output cite.citation{font-style:inherit;word-wrap:break-word}.mw-parser-output .citation q{quotes:"\"""\"""'""'"}.mw-parser-output .citation.cs-ja1 q,.mw-parser-output .citation.cs-ja2 q{quotes:"「""」""『""』"}.mw-parser-output .citation:target{background-color:rgba(0,127,255,0.133)}.mw-parser-output .id-lock-free a,.mw-parser-output .citation .cs1-lock-free a{background:url("//upload.wikimedia.org/wikipedia/commons/6/65/Lock-green.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-limited a,.mw-parser-output .id-lock-registration a,.mw-parser-output .citation .cs1-lock-limited a,.mw-parser-output .citation .cs1-lock-registration a{background:url("//upload.wikimedia.org/wikipedia/commons/d/d6/Lock-gray-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-subscription a,.mw-parser-output .citation .cs1-lock-subscription a{background:url("//upload.wikimedia.org/wikipedia/commons/a/aa/Lock-red-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .cs1-ws-icon a{background:url("//upload.wikimedia.org/wikipedia/commons/4/4c/Wikisource-logo.svg")right 0.1em center/12px no-repeat}.mw-parser-output .cs1-code{color:inherit;background:inherit;border:none;padding:inherit}.mw-parser-output .cs1-hidden-error{display:none;color:#d33}.mw-parser-output .cs1-visible-error{color:#d33}.mw-parser-output .cs1-maint{display:none;color:#3a3;margin-left:0.3em}.mw-parser-output .cs1-format{font-size:95%}.mw-parser-output .cs1-kern-left{padding-left:0.2em}.mw-parser-output .cs1-kern-right{padding-right:0.2em}.mw-parser-output .citation .mw-selflink{font-weight:inherit}ISBN 978-4-88888-000-8。 
^ たとえば次を参照。

富士通 (2000年). “OASYS LX-C700 機能仕様/機器仕様”. 2008年9月7日閲覧。

日本電気(NEC) (2001年). “文豪カラー JX5500BCの主な仕様”. 2010年8月20日時点の ⇒オリジナルよりアーカイブ。2008年9月7日閲覧。

^ JIS Z 8208『印刷校正記号』日本規格協会、2007年、4.3 修正の指示及び組版指定に用いる記号 表2頁。 
^ JIS X 4051:2004『日本語文書の組版方法』日本規格協会、2004年、3. 定義 (b) この規格で定義する用語 (pp.6, 8)頁。 なおこの定義は第1次規格のJIS X 4051-1995『日本語文書の行組版方法』でも同様。
^ JIS X 0191-1986『日本語ワードプロセッサ用語』日本規格協会、1986年、3. 意味 (1) 一般 (p.2)頁。 
^ 竹村真一『明朝体の歴史』思文閣出版、1986年7月、p.77頁。ISBN 4-7842-0447-4


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:42 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef