文字符号化方式
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

Unicodeで定められたCEFとCESは、表のものがある(ただし、Unicode技術標準[3]SCSU (UTS 6) が、Unicode技術報告[3]UTF-EBCDIC (UTR 16) とCESU-8 (UTR 26) が、Unicode技術ノート[4]でBOCU-1 (UTN 6) が、その他、ISO/IEC標準やRFCで、Unicode文字集合を使ったCEFやCESを規格化している)。同じ名称のCEFとCESがあり、これらを区別するときは、「UTF-16符号化形式」「UTF-16符号化スキーム」のように呼ぶ。一般にUTF-16と呼ばれるものは、UTF-16符号化形式に対応する3つのCESの総称である。なお、UTF-8符号化形式とUTF-8符号化スキームは実質的に同じものだが、便宜上、分けている。

Unicode以外でも、原理的にはCEFとCESを区別して論ずることができる。しかし、ほとんどの場合8ビット整数を符号単位とするため、UTF-8の場合と同様に区別する意味は少ない。たとえば、Shift_JISの文字データを扱うプログラムは、8ビット整数を符号単位とするマルチバイト文字の文字データの処理を行っているため、ファイルの読み書きや通信などでバイト直列化処理をあらためて行うことはない。
キャラクタセット「文字コード#コードセット」を参照
脚注[脚注の使い方]^ 本節の用語の日本語表記は次に従った。“ ⇒Unicode Terminology English - Japanese”. Unicode, inc. 2009年12月31日閲覧。
^ ここでの「符号」とは正負のことである。
^ a b 詳細は次を参照。 ⇒About Unicode Technical Reports - Types of Unicode Technical Reports: UTR, UTS, UAX, Unicode, Inc.
^ 詳細は次を参照。 ⇒About Unicode Technical Notes, Unicode, Inc.

参考資料

JIS X 0202:1998『情報技術 - 文字符号の構造及び拡張法』(ISO/IEC 2022:1994 Information technology - Character code structure and extension techniques 第4版の国際一致規格) 1998年、日本規格協会。

The Unicode Standard, Version 5.0、2006年11月、Addison-Wesley。ISBN 0321480910

.mw-parser-output cite.citation{font-style:inherit;word-wrap:break-word}.mw-parser-output .citation q{quotes:"\"""\"""'""'"}.mw-parser-output .citation.cs-ja1 q,.mw-parser-output .citation.cs-ja2 q{quotes:"「""」""『""』"}.mw-parser-output .citation:target{background-color:rgba(0,127,255,0.133)}.mw-parser-output .id-lock-free a,.mw-parser-output .citation .cs1-lock-free a{background:url("//upload.wikimedia.org/wikipedia/commons/6/65/Lock-green.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-limited a,.mw-parser-output .id-lock-registration a,.mw-parser-output .citation .cs1-lock-limited a,.mw-parser-output .citation .cs1-lock-registration a{background:url("//upload.wikimedia.org/wikipedia/commons/d/d6/Lock-gray-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-subscription a,.mw-parser-output .citation .cs1-lock-subscription a{background:url("//upload.wikimedia.org/wikipedia/commons/a/aa/Lock-red-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .cs1-ws-icon a{background:url("//upload.wikimedia.org/wikipedia/commons/4/4c/Wikisource-logo.svg")right 0.1em center/12px no-repeat}.mw-parser-output .cs1-code{color:inherit;background:inherit;border:none;padding:inherit}.mw-parser-output .cs1-hidden-error{display:none;color:#d33}.mw-parser-output .cs1-visible-error{color:#d33}.mw-parser-output .cs1-maint{display:none;color:#3a3;margin-left:0.3em}.mw-parser-output .cs1-format{font-size:95%}.mw-parser-output .cs1-kern-left{padding-left:0.2em}.mw-parser-output .cs1-kern-right{padding-right:0.2em}.mw-parser-output .citation .mw-selflink{font-weight:inherit}RFC 2978 IANA Charset Registration Procedures (『IANA キャラクタセット登録手続き』) N. Freed 他著、2000年10月。

関連項目

文字集合

文字コード

符号化方式

コードページ

バイト順マーク (BOM)

外部リンク

IANA 文字集合レジストリ (IANA Character Set Registry)
(IANA が登録しているキャラクタセットの情報一覧)

UTR#17: Character Encoding ModelUnicodeの文字符号化モデル)

RFC2130: The Report of the IAB Character Set Workshop held 29 February 1 March(IABの文字符号化モデルについて記述がある)

Character Data Representation Architecture Reference(IBMの文字データ表現体系 (CDRA) リファレンス)

IBM Coded Character Set Identifier (CCSID)(IBMのコード化文字セット識別コード (CCSID) の管理簿)










文字コード
日本語用の
文字コード

JIS規格

符号化文字集合

JIS X 0201

JIS X 0208

JIS X 0212

JIS X 0213

JIS X 0221日本文字部分レパートリ

文字符号化方式

ISO-2022-JP

EUC-JP

Shift_JIS

Shift_JISX0213

Shift_JIS-2004

EUC-JISX0213

EUC-JIS-2004

ISO-2022-JP-3

ISO-2022-JP-2004

漢字シフトコード

文字一覧

JIS X 0213非漢字一覧

JIS X 0213漢字一覧の1面

JIS X 0213漢字一覧の2面


JIS以外の公規格

MJ文字

入管正字

ARIB外字

ARIB外字の追加記号一覧


メーカーの規格

符号化文字集合

IBM拡張文字

マイクロソフト標準キャラクタセット

Adobe-Japan1

iモード絵文字

EZweb絵文字

SoftBank絵文字

今昔文字鏡

JIPS

EBCDIC

GT書体

KEIS

IBM漢字システム

レコード用文字符号

ビブロス外字

文字符号化方式

Microsoftコードページ932

MacJapanese

JEF漢字コード

U-PRESS



日本語を含む
多言語文字集合

Unicode
ISO/IEC 10646
JIS X 0221



基本多言語面

追加面

追加多言語面

追加漢字面

第三漢字面

追加特殊用途面

私用面


文字符号化方式

UTF-8

UTF-16/UCS-2

UTF-32/UCS-4

UTF-7

UTF-EBCDIC

GB 18030

SCSU

BOCU-1

文字一覧

Unicode一覧

Unicode一覧表

Unicode6.0の携帯電話の絵文字の一覧

UnicodeのEmojiの一覧


TRONコード

TRONコード


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:26 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef