UTF-8
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

^ ISO/IEC 10646:2003 Information technology -- Universal Multiple-Octet Coded Character Set (UCS)
^ RFC 2279 UTF-8, a transformation format of ISO 10646
^The Unicode Standard, Version 5.2
^ RFC 3629 UTF-8, a transformation format of ISO 10646
^ ただし、バイト順マーク (BOM) が付加されている場合や、テキストを7ビットで処理するソフトウェア、内部的に最上位ビットを使用しているソフトウェアなど、使えないものも存在する
^ RFC 3629, pp.9f.
^ “10.1.10.6 The utf8mb4 Character Set (4-Byte UTF-8 Unicode Encoding)”. dev.mysql.com. MySQL 5.5 Reference Manual. Oracle. 2015年12月1日02:10:55時点のオリジナルよりアーカイブ。2015年12月11日閲覧。
^ Windowsにおける有名なワームであるNimdaウイルスは、IISにおけるUTF-8の脆弱性をもちいたものである。(はせがわようすけ 2009)
^ Mark Davis. “Forms of Unicode” (英語). IBM. 2005年5月6日時点の ⇒オリジナルよりアーカイブ。2013年9月18日閲覧。
^ このため、UTF-8という呼び名を使っていれば情報交換の相手が文書先頭にこのシーケンスがあると見なすと期待すべきではないし、また、UTF-8Nという呼び名は情報交換の際に用いるべきではない。
^ TeraPadEmEditorMIFESのようにBOMを付加するかどうかを選択できるものもある。
^ マイクロソフト・サポート https://support.microsoft.com/en-us/office/opening-csv-utf-8-files-correctly-in-excel-8a935af5-3416-4edd-ba7e-3dfd2bc4a032
^ /source-charset (Set Source Character Set) 。Microsoft Docs
^ “「メモ帳」に多数の改善、BOMなしUTF-8がデフォルト保存形式に ?「Windows 10 19H1」”. Impress. 2023年1月26日閲覧。
^ RFC 3629 6. Byte order mark (BOM)

参考資料.mw-parser-output .refbegin{margin-bottom:0.5em}.mw-parser-output .refbegin-hanging-indents>ul{margin-left:0}.mw-parser-output .refbegin-hanging-indents>ul>li{margin-left:0;padding-left:3.2em;text-indent:-3.2em}.mw-parser-output .refbegin-hanging-indents ul,.mw-parser-output .refbegin-hanging-indents ul li{list-style:none}@media(max-width:720px){.mw-parser-output .refbegin-hanging-indents>ul>li{padding-left:1.6em;text-indent:-1.6em}}.mw-parser-output .refbegin-100{font-size:100%}.mw-parser-output .refbegin-columns{margin-top:0.3em}.mw-parser-output .refbegin-columns ul{margin-top:0}.mw-parser-output .refbegin-columns li{page-break-inside:avoid;break-inside:avoid-column}

用語の日本語表記は原則として「“Unicode Terminology English - Japanese
”. Unicode, Inc. 2010年1月1日閲覧。」にならった。

はせがわようすけ (2009年5月8日). “本当は怖い文字コードの話: 第4回 UTF-8の冗長なエンコード”. 技術評論社. 2014年9月10日閲覧。

関連項目

文字コード










文字コード
日本語用の
文字コード

JIS規格

符号化文字集合

JIS X 0201

JIS X 0208

JIS X 0212

JIS X 0213

JIS X 0221日本文字部分レパートリ

文字符号化方式

ISO-2022-JP

EUC-JP

Shift_JIS

Shift_JISX0213

Shift_JIS-2004

EUC-JISX0213

EUC-JIS-2004

ISO-2022-JP-3

ISO-2022-JP-2004

漢字シフトコード

文字一覧

JIS X 0213非漢字一覧

JIS X 0213漢字一覧の1面

JIS X 0213漢字一覧の2面


JIS以外の公規格

MJ文字

入管正字

ARIB外字

ARIB外字の追加記号一覧


メーカーの規格

符号化文字集合

IBM拡張文字

マイクロソフト標準キャラクタセット

Adobe-Japan1

iモード絵文字

EZweb絵文字

SoftBank絵文字

今昔文字鏡

JIPS

EBCDIC

GT書体

KEIS

IBM漢字システム

レコード用文字符号

ビブロス外字

文字符号化方式

Microsoftコードページ932

MacJapanese

JEF漢字コード

U-PRESS



日本語を含む
多言語文字集合

Unicode
ISO/IEC 10646
JIS X 0221



基本多言語面

追加面

追加多言語面

追加漢字面

第三漢字面

追加特殊用途面

私用面


文字符号化方式

UTF-8

UTF-16/UCS-2

UTF-32/UCS-4

UTF-7

UTF-EBCDIC

GB 18030

SCSU

BOCU-1

文字一覧

Unicode一覧

Unicode一覧表

Unicode6.0の携帯電話の絵文字の一覧

UnicodeのEmojiの一覧


TRONコード

TRONコード


日本語以外用の
文字集合

初期の文字コード

ASCII

Baudot Code

ISO/IEC 646

ISO/IEC 6937

T.61

ISO/IEC 8859

-1

-2

-3

-4

-5

-6

-7

-8

-9

-10

-11

-13

-14

-15

-16

書誌用

ISO 5426

ISO 5426-2

ISO 5427

ISO 5428

ISO 6438

ISO 6861

ISO 6862

ISO 9036

ISO 10585

ISO 10586

ISO 10754

ISO 11822

ANSEL

MARC-8

国家標準

ArmSCII

CNS 11643


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:50 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef