ISO/IEC_10646
[Wikipedia|▼Menu]
2000/09/15ISO/IEC 10646-1:2000UCS -- Part 1: Architecture and basic Multilingual Plane
2001/11/01ISO/IEC 10646-2:2001UCS -- Part 2: Supplementary Planes
2002/07/16ISO/IEC 10646-1:2000/Amd.1Mathematical symbols and other characters
2003/12/15ISO/IEC 10646:2003Universal Multiple-Octet Coded Character Set (UCS)
2005/11/15ISO/IEC 10646:2003/Amd.1Glagolitic, Coptic, Georgian and other characters
2006/07/01ISO/IEC 10646:2003/Amd.2N'Ko, Phags-pa, Phoenician and other characters
2008/02/15ISO/IEC 10646:2003/Amd.3Lepcha, Ol Chiki, Saurashtra, Vai and other characters
2008/07/01ISO/IEC 10646:2003/Amd.4Cham, Game Tiles, and other characters
2008/12/01ISO/IEC 10646:2003/Amd.5Tai Tham, Tai Viet, Avestan, Egyptian Hieroglyphs, CJK Unified Ideographs Extension C, and other characters
2009/10/15ISO/IEC 10646:2003/Amd.6Bamum, Javanese, Lisu, Meetei Mayek, Samaritan, and other characters
2010/7/15ISO/IEC 10646:2003/Amd.7Mandaic, Batak, Brahmi, and other characters
2011/5/2ISO/IEC 10646:2011Universal Coded Character Set (UCS)
2012/05/21ISO/IEC 10646:2012Information technology -- Universal Coded Character Set (UCS)
2013/04/09ISO/IEC 10646:2012/Amd 1:2013Linear A, Palmyrene, Manichaean, Khojki, Khudawadi, Bassa Vah, Duployan, and other characters
2014/08/29ISO/IEC 10646:2014Information technology -- Universal Coded Character Set (UCS)
2015ISO/IEC 10646:2014/Amd 1:2015Cherokee supplement and other characters
2016ISO/IEC 10646:2014/Amd 2:2016Bhaiksuki, Marchen, Tangut and other characters
2017/12/22ISO/IEC 10646:2017Information technology -- Universal Coded Character Set (UCS)

文字符号化方式

Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対し、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する。
UTF-1
初期に提案されていた、8ビットコードによる方式。ほとんど利用されることなくUTF-8にとって代わられた。
UCS-2
2オクテット固定のUCS (Universal Coded-Character Set) である。BMP(基本多言語面)以外の文字を使うことはできず、すべての文字を符号化できるUTF-16にとって代わられた。2011年の改訂ではdeprecated(廃止予定)とされた。
UTF-8
UnicodeのUTF-8と同じ[3]
UTF-16
UnicodeのUTF-16と同じ[4]
UTF-32 (UCS-4)
UnicodeのUTF-32と同じ。
実装レベル

古い規格では実装レベルというものが考えられていたが2011年の改訂で廃止され、Level3の実装のみを扱う事となった。
Level 1
合成列などを扱わない
Level 2
必要な合成列を扱える
Level 3
全て扱える

Unicodeは、Level 3の実装である。
脚注^ “The Unicode Standard Version 11.0” (PDF) (English). The Unicode Consortium. p. 1 (2018年6月5日). 2019年1月21日閲覧。 “The Unicode Standard is code-for-code identical with International Standard ISO/IEC 10646.”
^ “The Unicode Standard Version 11.0” (PDF) (English). The Unicode Consortium. p. 88 (2018年6月5日). 2019年1月21日閲覧。 “The character names in the Unicode Standard match those of the English edition of ISO/IEC 10646.”
^ a b “The Unicode Standard Version 11.0” (PDF) (English). The Unicode Consortium. p. 930 (2018年6月5日). 2019年1月21日閲覧。 “The ISO/IEC 10646 definition of UTF-8 is identical to UTF-8 as described under Definition D92 in Section 3.9, Unicode Encoding Forms.”
^ a b “The Unicode Standard Version 11.0” (PDF) (English). The Unicode Consortium. p. 930 (2018年6月5日). 2019年1月21日閲覧。 “The ISO/IEC 10646 definition of UTF-16 is identical to UTF-16 as described under Definition D91 in Section 3.9, Unicode Encoding Forms.”

参考文献

ISO/IEC 10646:2003 Information technology -- Universal Multiple-Octet Coded Character Set (UCS)


ISO/IEC 10646:2003/Amd 1:2005 Glagolitic, Coptic, Georgian and other characters

ISO/IEC 10646:2003/Amd 2:2006 N'Ko, Phags-pa, Phoenician and other characters

ISO/IEC 10646:2011(E) Universal Coded Character Set (UCS)

ISO/IEC 10646:2017 Universal Coded Character Set (UCS)










文字コード
日本語用の
文字コード

JIS規格

符号化文字集合

JIS X 0201

JIS X 0208

JIS X 0212

JIS X 0213

JIS X 0221日本文字部分レパートリ

文字符号化方式

ISO-2022-JP

EUC-JP

Shift_JIS

Shift_JISX0213

Shift_JIS-2004

EUC-JISX0213

EUC-JIS-2004

ISO-2022-JP-3

ISO-2022-JP-2004

漢字シフトコード

文字一覧

JIS X 0213非漢字一覧

JIS X 0213漢字一覧の1面

JIS X 0213漢字一覧の2面


JIS以外の公規格

MJ文字

入管正字

ARIB外字

ARIB外字の追加記号一覧


メーカーの規格

符号化文字集合

IBM拡張文字

マイクロソフト標準キャラクタセット

Adobe-Japan1

iモード絵文字

EZweb絵文字

SoftBank絵文字

今昔文字鏡

JIPS

EBCDIC

GT書体

KEIS

IBM漢字システム

レコード用文字符号

ビブロス外字

文字符号化方式

Microsoftコードページ932

MacJapanese

JEF漢字コード

U-PRESS



日本語を含む
多言語文字集合

Unicode
ISO/IEC 10646
JIS X 0221



基本多言語面

追加面

追加多言語面

追加漢字面

第三漢字面

追加特殊用途面

私用面


文字符号化方式

UTF-8

UTF-16/UCS-2

UTF-32/UCS-4

UTF-7

UTF-EBCDIC

GB 18030

SCSU

BOCU-1

文字一覧

Unicode一覧

Unicode一覧表

Unicode6.0の携帯電話の絵文字の一覧

UnicodeのEmojiの一覧


TRONコード

TRONコード


日本語以外用の
文字集合

初期の文字コード

ASCII

Baudot Code

ISO/IEC 646

ISO/IEC 6937

T.61

ISO/IEC 8859

-1

-2

-3

-4

-5

-6

-7

-8

-9

-10


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:51 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef