EUC-JISX0213
[Wikipedia|▼Menu]

EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合に利用されてきた文字コード符号化方式)のひとつである。UNIX以外のOS上で使われることもある[要出典]。

1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、EUC(Extended UNIX Codeの略)として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR(韓国語)、EUC-CN(簡体中国語)等がある。

EUCのエンコード方式上にASCIIJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。

日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、半角カナはISO-2022-JPShift_JISと異なり制御文字SS2(シングルシフトツー、0x8E)に続けて現れるので都合2バイト、補助漢字は制御文字SS3(シングルシフトスリー、0x8F)に続けて現れるので都合3バイトを要する。

JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004(2000年初版時はEUC-JISX0213)。

UNIX系OSの標準的な文字エンコードとして使用されてきた。日本語の8万字の文字鏡フォントを含む今昔文字鏡が出た1997年以降は、より多くの日本語を扱うことができるようUTF-8, UTF-16を使用したシステムも普及している。
EUC-JPの亜種

EUC-JPには亜種が存在する。二種類を以下に解説する。

eucJP-msは、オープン・グループ及び日本ベンダ協議会が策定した文字符号化方式。実装例はMySQL v5.0以降等。

CP51932はマイクロソフトWindowsで使用しているWindows-31JのEUC-JP互換表現。実装例はInternet Explorer4.0以降、EmEditor秀丸エディタ等。このコードはNECPC-9800シリーズの漢字コード(9区から12区の特殊文字を除外したもの)をGR表現したような体裁を持つ。ただし、PC-9800シリーズの漢字コードはJIS C 6226-1978をベースにするのに対して、CP51932はJIS X 0208-1990をベースとする点が異なる。

 CP51932eucJP-ms
面&区番号1バイト目2バイト目面&区番号1バイト目2バイト目3バイト目
JIS X 0208-1990
(ひらがな・カタカナ等)1面1区 - 8区0xA1 - 0xA80xA1 - 0xFE1面1区 - 8区0xA1 - 0xA80xA1 - 0xFE―
NEC特殊文字1面13区0xAD1面13区0xAD
JIS X 0208-1990
(第一・第二水準漢字)1面14区 - 84区0xB0 - 0xF41面14区 - 84区0xB0 - 0xF4
NEC選定IBM拡張文字1面89区 - 92区0xF9 - 0xFC―――
ユーザ定義文字
(前半)―――1面85区 - 94区0xF5 - 0xFE0xA1 - 0xFE
JIS X 0212-1990
(前半)2面1区 - 11区0x8F0xA1 - 0xAB0xA1 - 0xFE
JIS X 0212-1990
(後半)2面16区 - 77区0xB0 - 0xED
IBM拡張文字
(JIS X 0212 以外)2面83区 - 84区0xF3 - 0xF4
ユーザ定義文字
(後半)2面85区 - 94区0xF5 - 0xFE

参考文献

中原康: 日本語処理技術, 電気学会雑誌, 第106巻, 第12号 (1986年12月), pp.1198-1202.

小野芳彦: UNIXの日本語化の実現方法, 情報処理, Vol.27, No.12 (1986年12月), pp.1393-1400.

中原康: 日本語EUCの定義と解説, Revision 1.7, UI-OSF-USLP共同技術資料 (1991年12月10日).










文字コード
Category:文字コード
日本語用の
文字コード

JIS規格

符号化文字集合

JIS X 0201

JIS X 0208

JIS X 0212

JIS X 0213

JIS X 0221日本文字部分レパートリ

文字符号化方式
ISO-2022-JP

EUC-JP

Shift_JIS

Shift_JISX0213

Shift_JIS-2004

EUC-JISX0213

EUC-JIS-2004

ISO-2022-JP-3

ISO-2022-JP-2004

漢字シフトコード

文字一覧
JIS X 0213非漢字一覧

JIS X 0213漢字一覧の1面

JIS X 0213漢字一覧の2面


JIS以外の公規格
MJ文字

入管正字

ARIB外字

ARIB外字の追加記号一覧


メーカーの規格

符号化文字集合

IBM拡張文字

マイクロソフト標準キャラクタセット

Adobe-Japan1

iモード絵文字

EZweb絵文字

SoftBank絵文字

今昔文字鏡

JIPS

EBCDIC

GT書体

KEIS

IBM漢字システム

レコード用文字符号

ビブロス外字

文字符号化方式
Microsoftコードページ932

MacJapanese

JEF漢字コード

U-PRESS



日本語を含む
多言語文字集合

Unicode
ISO/IEC 10646
JIS X 0221



基本多言語面

追加面

追加多言語面

追加漢字面

第三漢字面

追加特殊用途面

私用面


文字符号化方式
UTF-8

UTF-16/UCS-2

UTF-32/UCS-4

UTF-7

UTF-EBCDIC

GB 18030

SCSU

BOCU-1

文字一覧
Unicode一覧

Unicode一覧表

Unicode6.0の携帯電話の絵文字の一覧

UnicodeのEmojiの一覧


TRONコード
TRONコード


日本語以外用の
文字集合

初期の文字コード

ASCII

Baudot Code

ISO/IEC 646

ISO/IEC 6937

T.61

ISO/IEC 8859
-1

-2

-3

-4

-5

-6

-7

-8

-9

-10

-11

-13


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:22 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef