ISO/IEC_8859-1
[Wikipedia|▼Menu]
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{|}~
8x未使用
9x
AxNBSP!¢£?\|§¨ca¬SHYR
Bx°±23´μ1o????
CxAAAAAAACEEEEIIII
DxDNOOOOO×OUUUUYTs
Exaaaaaaaceeeeiiii
Fxdnooooo÷ouuuuyty

符号値00?1F, 7F?9FはISO/IEC 8859-1では文字を割り当てていない。

下位領域の20から7E(G0部分集合)はISO 646 US版(通称ASCII)のG0部分集合と正確に同じマッピングである。ISO 2022の指示シーケンスは"ESC ( B"。上位領域のA0からFF(G1部分集合)はISO 2022のシーケンス"ESC . A"で指示される部分集合と正確に同じマッピングである。
関連する文字マッピング

ISO/IEC 8859-1標準は、長い間多数の 文字マッピング(別名キャラクタセット、charsets、もしくはコードページ)の基盤となってきた。キャラクタセットのうちもっとも有名なものは ISO-8859-1とWindows-1252である。これらのマッピングはどちらもISO/IEC 8859-1の上位集合である。すなわち、これらは00?1F, 7F, および 80?9F範囲にある符号値の少なくとも一部に追加の文字をマッピングすることにより、標準の191文字に割り当てを追加する。
ISO-8859-1

1992年Internet Assigned Numbers Authorityは文字マッピングISO_8859-1:1987をインターネットで使うために登録した。ISO_8859-1:1987はISO 8859-1の上位集合であり、その推奨MIME名ISO-8859-1(ISO 8859-1に余分なハイフンが付いていることに注意)でより広く知られている。この写像はC0およびC1制御文字を符号値00?1F, 7F, および80?9Fに割り当てている。8ビットで可能なあらゆる値に割り当てをしているため、256文字を提供していることになる。

ISO-8859-1は(少なくとも規格によると)HTTP経由で配信され、"text/"で始まるMIMEタイプの文書における既定のエンコーディングである。ISO-8859-1はある種の記述的なHTTPヘッダの値の既定のエンコーディングであり、この文字集合を使うロケールのほとんどのUNIXマシン上でX Window Systemによって使われる標準エンコーディングである。ISO-8859-1はさらにHTML 3.2文書で許される文字レパートリの基になっている(しかしながら、HTML 4.0はUnicodeに基づく)。

エスケープシーケンス(ISO/IEC 6429やISO/IEC 2022に由来する)はISO-8859-1で符号化されているとラベル付けされた文書では解釈されない。上述の正式名称や推奨MIME名ばかりでなく、以下のような別名がISO-8859-1のために登録されている: ISO_8859-1, ISO-8859-1, iso-ir-100, csISOLatin1, latin1, l1, IBM819, CP819. ISO-8859-1はISO/IEC 10646Unicodeの最初の256個の符号位置にも組み込まれた。

符号値制御文字省略形
00空文字 Null characterNUL
01ヘッダ開始 Start of HeadingSOH
02テキスト開始 Start of TextSTX
03テキスト終了 End of TextETX
04伝送終了 End of TransmissionEOT
05問い合わせ EnquiryENQ
06肯定応答 Acknowledge character|AcknowledgeACK
07ベル Bell characterBEL
081文字後退 BackspaceBS
09水平タブ TabTAB
0A改行 Line FeedLF
0B垂直タブ Vertical TabVT
0C書式送り Form FeedFF
0D復帰 Carriage ReturnCR
0Eシフトアウト Shift OutSO
0Fシフトイン Shift InSI
10データリンク拡張 Data Link EscapeDLE
11装置制御1 Device Control 1DC1
12装置制御2 Device Control 2DC2
13装置制御3 Device Control 3DC3
14装置制御4 Device Control 4DC4
15否定応答 Negative-acknowledge characterNAK
16同期信号 Synchronous IdleSYN
17伝送ブロック終了 End of Transmission BlockETB:
18キャンセル Cancel characterCAN
19媒体終端 End of MediumEM
1A置換 Substitute (character)SUB
1Bエスケープ Escape characterESC
1Cファイルセパレータ File SeparatorFS
1Dグループセパレータ Group SeparatorGS
1Eレコードセパレータ Record SeparatorRS
1Fユニットセパレータ Unit SeparatorUS
7F削除 DeleteDEL
 

符号値制御文字省略形
80Padding CharacterPAD
81High Octet PresetHOP
82Break Permitted HereBPH
83No Break HereNBH
84IndexIND
85Next LineNEL
86Start of Selected AreaSSA
87End of Selected AreaESA
88Character Tabulation SetHTS
89Character Tabulation with JustificationHTJ
8ALine Tabulation SetVTS
8BPartial Line ForwardPLD
8CPartial Line BackwardPLU
8DReverse Line FeedRI
8ESingle Shift 2SS2
8FSingle Shift 3SS3
90Device Control StringDCS
91Private Use 1PU1
92Private Use 2PU2
93Set Transmit StateSTS
94Cancel CharacterCCH
95Message WaitingMW
96Start of Guarded AreaSPA
97End of Guarded AreaEPA
98Start of StringSOS
99Single Graphic Character IntroducerSGCI
9ASingle Character IntroducerSCI
9BControl Sequence IntroducerCSI
9CString TerminatorST
9DOperating System CommandOSC
9EPrivacy MessagePM
9FApplication Program CommandAPC

注: これらの制御文字のほとんどは、移植可能なISO-8859-1で符号化されたプレーンテキスト文書で使うために設計されたわけではなく、動作が標準化されている数個の文字を例外として、特定のプロトコルや機器でのみ使われる。例外は次の通り。TAB (09), LF (0A), CR (0D), NEL (85)。TAB以外は行の終わりや段落の区切りを符号化するために使われ、TABはしばしばホワイトスペースと等価であるとみなされる。


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:46 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef