コードポイント
[Wikipedia|▼Menu]

符号点(ふごうてん)は、符号化文字集合内の、文字を割り当てうる個々の。コードポイント (code point)。Unicodeでは符号位置(ふごういち)と訳す。文脈によっては単に点(てん、point)ともいう。

符号点は文字を割り当て「うる」点であり、規格によっては、実際に文字を割り当てる以外に、エスケープなどの目的の文字以外の何かが割り当てられることもある。
符号点のバイト列化

符号空間は、1次元のこともあれば、多次元のこともある。その中の符号点は、座標に相当する整数列で特定される。Unicodeのように符号空間が1次元の場合は、長さ1の整数列、つまり、1つの整数となる。Unicodeの用語では「Unicodeスカラー値」と言う。

整数列は、文字符号化方式によりバイト列に変換される。最も単純なスキームでは整数列がそのままバイト列になるが、一般には、直に整数として見たものとは異なる値に変換されたり、長さも変わったりする。
群・面・区・点

符号点(この節では、以下、単に点と呼ぶ)とは、整数列(バイト列ではない)を最後まで使って指定される点状の部分集合である。それに対し、最後から2番目の整数までを使って指定される、多数の点からなる状の部分集合を区という。同様に、最後から3番目の整数までを使って指定される、多数の区からなる状の部分集合をといい、最後から4番目の整数までを使って指定される、多数の面からなる部分集合を群という。

上位から並べなおすと、群・面・区・点であり、群は多数の面からなり、面は多数の区からなり、区は多数の点からなる。それぞれを特定する最後の整数を(つまり、最後から4番目の整数から順に)、群番号・面番号・区番号・点番号、あるいは単に、群・面・区・点という。このような、上位から群・面・区・点とする階層構造は以前のISO/IEC 10646のものである(群は2011年の改訂で廃止された)。

当然ながら、符号空間の次元が低く整数列が短い場合には、上位の整数は使わない。群・面は大規模文字セットに伴い使われるようになったものであるが、区・点はJIS X 0208など以前から使われていた。

特にJISなどで、区番号と点番号からなる2つの整数の組を区点番号、あるいは単に区点という。
表現

点(位置)について、ASCIIなどでは、特にこれといった表現方法はなく、オクテットの値を十六進法などで「'A'は4116である」といったように表現する。JIS X 0208などでは「x区y点」あるいは「x-y」(xとyは普通十進法)と表現する。JIS X 0213では「面」がその前に加わる。UnicodeやISO/IEC 10646では、"U+" の後にUnicodeスカラ値を十六進で続けて「U+3042」のようにして表す。
参考資料

Unicodeに関する用語の日本語表記は次にならった。“ ⇒Unicode Terminology English - Japanese”. Unicode, inc. 2010年1月1日閲覧。










文字コード
日本語用の
文字コード

JIS規格

符号化文字集合

JIS X 0201

JIS X 0208

JIS X 0212

JIS X 0213

JIS X 0221日本文字部分レパートリ

文字符号化方式

ISO-2022-JP

EUC-JP

Shift_JIS

Shift_JISX0213

Shift_JIS-2004

EUC-JISX0213

EUC-JIS-2004

ISO-2022-JP-3

ISO-2022-JP-2004

漢字シフトコード

文字一覧

JIS X 0213非漢字一覧

JIS X 0213漢字一覧の1面

JIS X 0213漢字一覧の2面


JIS以外の公規格

MJ文字

入管正字

ARIB外字

ARIB外字の追加記号一覧


メーカーの規格

符号化文字集合

IBM拡張文字

マイクロソフト標準キャラクタセット

Adobe-Japan1

iモード絵文字

EZweb絵文字

SoftBank絵文字

今昔文字鏡

JIPS

EBCDIC

GT書体

KEIS

IBM漢字システム

レコード用文字符号

ビブロス外字

文字符号化方式

Microsoftコードページ932

MacJapanese

JEF漢字コード

U-PRESS



日本語を含む
多言語文字集合

Unicode
ISO/IEC 10646
JIS X 0221



基本多言語面

追加面

追加多言語面

追加漢字面

第三漢字面

追加特殊用途面

私用面


文字符号化方式

UTF-8

UTF-16/UCS-2

UTF-32/UCS-4

UTF-7

UTF-EBCDIC

GB 18030

SCSU

BOCU-1

文字一覧

Unicode一覧

Unicode一覧表

Unicode6.0の携帯電話の絵文字の一覧

UnicodeのEmojiの一覧


TRONコード

TRONコード


日本語以外用の
文字集合

初期の文字コード

ASCII

Baudot Code

ISO/IEC 646

ISO/IEC 6937

T.61

ISO/IEC 8859

-1

-2

-3

-4

-5

-6

-7

-8

-9

-10

-11

-13

-14

-15

-16

書誌用

ISO 5426

ISO 5426-2

ISO 5427

ISO 5428

ISO 6438

ISO 6861

ISO 6862

ISO 9036

ISO 10585

ISO 10586

ISO 10754

ISO 11822

ANSEL

MARC-8

国家標準

ArmSCII

CNS 11643

GOST 10859

GB 2312

HKSCS

ISCII

KPS 9566

KS X 1001


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:18 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef