TIS-620
[Wikipedia|▼Menu]

Thai Industrial Standard 620-2533 (タイ工業規格、通称TIS-620) はタイ語でもっともよく使われる文字集合および文字符号化方式である。この規格はタイ王国政府工業省の機関タイ工業規格協会 (Thai Industrial Standards Institute; TISI) によって発行され、タイ王国においてタイ語を符号化するための唯一の公的規格である。規格の記述的な名称は "Standard for Thai Character Codes for Computers" (タイ語: ???????????????????????????????????????) である。"2533" は現在の規格が発行されたタイ暦2533年 (1990年) を指す。以前の版である TIS 620-2529 (1986年) は、廃止された。
構造

TIS-620(???.620-2533)は7ビットASCIIとの完全な互換性を保ち、8ビットの範囲の16進数A1からFBまでをタイ文字の符号化に使うという、拡張ASCIIの伝統的な構造を持つ。タイ語母音とダイアクリティカルマークの複雑に結合する性質のため、TIS-620は情報交換のみを意図しており、文字を正しく合成するには追加の表示エンジンが必要であることに注意。
変種

TIS-620とほとんど同じバージョンがISO/IEC 8859-11として1999年に採用された。唯一の違いは、ISO 8859-11が16進数A0をノーブレークスペースと定義しているのに対して、TIS-620は未定義のまま予約している点である (現実には、この小さな違いは無視されるのが普通である)。

ISO 8859-11集合はEcma InternationalによってISO-IR-166としても登録された。しかしこの変種はタイ文字シーケンスの開始と終了を知らせるために明示的なエスケープコードを追加している。

TIS-620文字集合の順序は本質的にUnicode (ISO/IEC 10646) にあるものと同じである。Unicodeのタイ語領域はU+0E01からU+0E7Fであり、TIS-620のタイ文字は単純に各バイトに0Eを付加してその値からA0を引くことで、UTF-16に変換できる。

TIS-620x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0x未使用
1x
2xSP!"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{|}~
8x未使用
9x
Ax ???????????????
Bx????????????????
Cx????????????????
Dx???????????????????    ?
Ex????????????????????????
Fx????????????    

すべての文字を見るには文字サイズをおよそ200%に設定する必要があるかもしれない

上記の表では、20は通常のSPACE文字である。符号値 00-1F, 7F, 80-9F, A0, DB-DE および FC-FF には、TIS-620では文字が割り当てられていない。

符号値 D1, D4-DA, E7-EE は結合文字である。
外部リンク

公式リファレンス(タイ語)

TIS-620からISO/IEC 10646へのマッピング [非公式]


記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:7318 Bytes
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef