符号点(ふごうてん)は、符号化文字集合内の、文字を割り当てうる個々の点。コードポイント (code point)。Unicodeでは符号位置(ふごういち)と訳す。文脈によっては単に点(てん、point)ともいう。
符号点は文字を割り当て「うる」点であり、規格によっては、実際に文字を割り当てる以外に、エスケープなどの目的の文字以外の何かが割り当てられることもある。 符号空間は、1次元のこともあれば、多次元のこともある。その中の符号点は、座標に相当する整数列で特定される。Unicodeのように符号空間が1次元の場合は、長さ1の整数列、つまり、1つの整数となる。Unicodeの用語では「Unicodeスカラー値」と言う。 整数列は、文字符号化方式によりバイト列に変換される。最も単純なスキームでは整数列がそのままバイト列になるが、一般には、直に整数として見たものとは異なる値に変換されたり、長さも変わったりする。 符号点(この節では、以下、単に点と呼ぶ)とは、整数列(バイト列ではない)を最後まで使って指定される点状の部分集合である。それに対し、最後から2番目の整数までを使って指定される、多数の点からなる線状の部分集合を区という。同様に、最後から3番目の整数までを使って指定される、多数の区からなる面状の部分集合を面といい、最後から4番目の整数までを使って指定される、多数の面からなる部分集合を群という。 上位から並べなおすと、群・面・区・点であり、群は多数の面からなり、面は多数の区からなり、区は多数の点からなる。それぞれを特定する最後の整数を(つまり、最後から4番目の整数から順に)、群番号・面番号・区番号・点番号、あるいは単に、群・面・区・点という。このような、上位から群・面・区・点とする階層構造は以前のISO/IEC 10646のものである(群は2011年の改訂で廃止された)。 当然ながら、符号空間の次元が低く整数列が短い場合には、上位の整数は使わない。群・面は大規模文字セットに伴い使われるようになったものであるが、区・点はJIS X 0208など以前から使われていた。 特にJISなどで、区番号と点番号からなる2つの整数の組を区点番号、あるいは単に区点という。 点(位置)について、ASCIIなどでは、特にこれといった表現方法はなく、オクテットの値を十六進法などで「'A'は4116である」といったように表現する。JIS X 0208などでは「x区y点」あるいは「x-y」(xとyは普通十進法)と表現する。JIS X 0213では「面」がその前に加わる。UnicodeやISO/IEC 10646では、"U+" の後にUnicodeスカラ値を十六進で続けて「U+3042」のようにして表す。 Unicodeに関する用語の日本語表記は次にならった。“ ⇒Unicode Terminology English - Japanese”. Unicode, inc. 2010年1月1日閲覧。 符号化文字集合 符号化文字集合 Unicode 面
符号点のバイト列化
群・面・区・点
表現
参考資料
表
話
編
歴
文字コード
日本語用の
文字コード
JIS X 0201
JIS X 0208
JIS X 0212
JIS X 0213
JIS X 0221(日本文字部分レパートリ)
文字符号化方式
ISO-2022-JP
EUC-JP
Shift_JIS
Shift_JISX0213
Shift_JIS-2004
EUC-JISX0213
EUC-JIS-2004
ISO-2022-JP-3
ISO-2022-JP-2004
漢字シフトコード
文字一覧
JIS X 0213非漢字一覧
JIS X 0213漢字一覧の1面
JIS X 0213漢字一覧の2面
JIS以外の公規格
MJ文字
入管正字
ARIB外字
ARIB外字の追加記号一覧
メーカーの規格
IBM拡張文字
マイクロソフト標準キャラクタセット
Adobe-Japan1
iモード絵文字
EZweb絵文字
SoftBank絵文字
今昔文字鏡
JIPS
EBCDIC
GT書体
KEIS
IBM漢字システム
レコード用文字符号
ビブロス外字
文字符号化方式
Microsoftコードページ932
MacJapanese
JEF漢字コード
U-PRESS
日本語を含む
多言語文字集合
ISO/IEC 10646
JIS X 0221
基本多言語面
追加面
追加多言語面
追加漢字面
第三漢字面
追加特殊用途面
私用面
文字符号化方式
UTF-8
UTF-16/UCS-2
UTF-32/UCS-4
UTF-7
UTF-EBCDIC
GB 18030
SCSU
BOCU-1
初期の文字コード
ASCII
Baudot Code
ISO/IEC 646
ISO/IEC 6937
T.61
ISO/IEC 8859
-1
-2
-3
-4
-5
-6
-7
-8
-9
-10
-11
-13
-14
-15
-16
書誌用
ISO 5426
ISO 5426-2
ISO 5427
ISO 5428
ISO 6438
ISO 6861
ISO 6862
ISO 9036
ISO 10585
ISO 10586
ISO 10754
ISO 11822
ANSEL
MARC-8
国家標準
ArmSCII
CNS 11643
GOST 10859
GB 2312
HKSCS
ISCII
KPS 9566
KS X 1001