UTF-8
□記事を途中から表示しています
[最初から表示]
^ ISO/IEC 10646:2003 Information technology -- Universal Multiple-Octet Coded Character Set (UCS)
^ RFC 2279 UTF-8, a transformation format of ISO 10646
^ ⇒The Unicode Standard, Version 5.2
^ RFC 3629 UTF-8, a transformation format of ISO 10646
^ ただし、バイト順マーク (BOM) が付加されている場合や、テキストを7ビットで処理するソフトウェア、内部的に最上位ビットを使用しているソフトウェアなど、使えないものも存在する
^ RFC 3629, pp.9f.
^ “10.1.10.6 The utf8mb4 Character Set (4-Byte UTF-8 Unicode Encoding)”. dev.mysql.com. MySQL 5.5 Reference Manual. Oracle. 2015年12月1日02:10:55時点のオリジナルよりアーカイブ。2015年12月11日閲覧。
^ Windowsにおける有名なワームであるNimdaウイルスは、IISにおけるUTF-8の脆弱性をもちいたものである。(はせがわようすけ 2009)
^ Mark Davis. “Forms of Unicode” (英語). IBM. 2005年5月6日時点の ⇒オリジナルよりアーカイブ。2013年9月18日閲覧。
^ このため、UTF-8という呼び名を使っていれば情報交換の相手が文書先頭にこのシーケンスがあると見なすと期待すべきではないし、また、UTF-8Nという呼び名は情報交換の際に用いるべきではない。
^ TeraPad、EmEditor、MIFESのようにBOMを付加するかどうかを選択できるものもある。
^ マイクロソフト・サポート https://support.microsoft.com/en-us/office/opening-csv-utf-8-files-correctly-in-excel-8a935af5-3416-4edd-ba7e-3dfd2bc4a032
^ /source-charset (Set Source Character Set) 。Microsoft Docs
^ “「メモ帳」に多数の改善、BOMなしUTF-8がデフォルト保存形式に ?「Windows 10 19H1」”. Impress. 2023年1月26日閲覧。
^ RFC 3629 6. Byte order mark (BOM)
参考資料.mw-parser-output .refbegin{margin-bottom:0.5em}.mw-parser-output .refbegin-hanging-indents>ul{margin-left:0}.mw-parser-output .refbegin-hanging-indents>ul>li{margin-left:0;padding-left:3.2em;text-indent:-3.2em}.mw-parser-output .refbegin-hanging-indents ul,.mw-parser-output .refbegin-hanging-indents ul li{list-style:none}@media(max-width:720px){.mw-parser-output .refbegin-hanging-indents>ul>li{padding-left:1.6em;text-indent:-1.6em}}.mw-parser-output .refbegin-100{font-size:100%}.mw-parser-output .refbegin-columns{margin-top:0.3em}.mw-parser-output .refbegin-columns ul{margin-top:0}.mw-parser-output .refbegin-columns li{page-break-inside:avoid;break-inside:avoid-column}
用語の日本語表記は原則として「“Unicode Terminology English - Japanese”. Unicode, Inc. 2010年1月1日閲覧。」にならった。
はせがわようすけ (2009年5月8日). “本当は怖い文字コードの話: 第4回 UTF-8の冗長なエンコード”. 技術評論社. 2014年9月10日閲覧。
関連項目
文字コード
表
話
編
歴
文字コード
日本語用の
文字コード
JIS規格
符号化文字集合
JIS X 0201
JIS X 0208
JIS X 0212
JIS X 0213
JIS X 0221(日本文字部分レパートリ)
文字符号化方式
ISO-2022-JP
EUC-JP
Shift_JIS
Shift_JISX0213
Shift_JIS-2004
EUC-JISX0213
EUC-JIS-2004
ISO-2022-JP-3
ISO-2022-JP-2004
漢字シフトコード
文字一覧
JIS X 0213非漢字一覧
JIS X 0213漢字一覧の1面
JIS X 0213漢字一覧の2面
JIS以外の公規格
MJ文字
入管正字
ARIB外字
ARIB外字の追加記号一覧
メーカーの規格
符号化文字集合
IBM拡張文字
マイクロソフト標準キャラクタセット
Adobe-Japan1
iモード絵文字
EZweb絵文字
SoftBank絵文字
今昔文字鏡
JIPS
EBCDIC
GT書体
KEIS
IBM漢字システム
レコード用文字符号
ビブロス外字
文字符号化方式
Microsoftコードページ932
MacJapanese
JEF漢字コード
U-PRESS
日本語を含む
多言語文字集合
Unicode
ISO/IEC 10646
JIS X 0221
面
基本多言語面
追加面
追加多言語面
追加漢字面
第三漢字面
追加特殊用途面
私用面
文字符号化方式
UTF-8
UTF-16/UCS-2
UTF-32/UCS-4
UTF-7
UTF-EBCDIC
GB 18030
SCSU
BOCU-1
文字一覧
Unicode一覧
Unicode一覧表
Unicode6.0の携帯電話の絵文字の一覧
UnicodeのEmojiの一覧
TRONコード
TRONコード
日本語以外用の
文字集合
初期の文字コード
ASCII
Baudot Code
ISO/IEC 646
ISO/IEC 6937
T.61
ISO/IEC 8859
-1
-2
-3
-4
-5
-6
-7
-8
-9
-10
-11
-13
-14
-15
-16
書誌用
ISO 5426
ISO 5426-2
ISO 5427
ISO 5428
ISO 6438
ISO 6861
ISO 6862
ISO 9036
ISO 10585
ISO 10586
ISO 10754
ISO 11822
ANSEL
MARC-8
国家標準
ArmSCII
CNS 11643
次ページ記事の検索おまかせリスト▼オプションを表示暇つぶしWikipedia
Size:50 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)』
担当:undef