U-PRESS (ゆーぷれす) とは共同通信社が独自に策定した文字コード(文字符号化方式および文字セット)。Unicode2.1をベースに基本多言語面 (BMP) の私用領域に新聞独特の外字を配置したもので、総収録文字数は15,269文字である[1]。 1990年代、ワープロ、パソコンなどの情報機器用に「K-JIS」など新聞社用の独自文字コードが案出されたが、運用の不統一、啓蒙・周知が不十分であったことなどから広く普及はしなかった。そこで共同通信社ではUnicodeを16ビット固定長として(→UTF-16)その外字領域に新聞独自の外字を配置したものを規格化し、2002年より社内運用、2003年からは新聞各社への配信も同文字コードを運用して行っている。
概要
各種文字コードとの対応
JIS X 0201[2]…全文字を収録している。
JIS X 0208[2]…全文字を収録している。ただし字体は印刷標準字体に準じる。
JIS X 0212[2]…全文字を収録している。
JIS X 0213[2]…BMPに収録されているものはそのまま収録。それ以外のものは私用領域に収録。
ラテ欄記号や縦書き専用文字、連数字
上記にないUCSの一部非漢字[2]
U-PRESSは一般的に使われているIBM拡張文字、古い新聞社用文字コードのK-JIS、ラテ欄(特にBSデジタル)に使われているARIB外字などの一部の文字が含まれておらず[3]、イワタはU-PRESSにそれらとの互換性を持たせるめの独自の拡張文字セット(848文字)を規定している[3]。
またAdobe-Japan1-6ではU-PRESSの独自文字が追加されているが、例えばモリサワのフォントではU-PRESSとAdobe-Japan1-6との間に字体の違いが存在する[4]。 入力用のIMEとしてジャストシステムよりATOKの「for U-PRESS」バージョンが開発・販売されている。 U-PRESS対応フォントには例えば以下が存在する: JIS X 0213:2004制定前に策定されたあくまで私的な規格であり、サロゲートペア(代用対)に対応していないなどUnicodeとの互換性も不完全であるため、今後、既存コードとの衝突を起こす可能性も危惧される。
対応システム・フォント
イワタの各種新聞書体 (イワタ U-PRESS 拡張文字セット対応)[5]
モリサワの各種OTF Uprフォント[6]
SCREENのヒラギノフォントのUpr版[7]
問題点
関連項目
共同通信社
K-JIS
Adobe-Japan1
JIS X 4051
外字
脚注^ 株式会社イワタ 製品情報 - イワタU-PRESS
^ a b c d e 今さら聞けない文字コードのはなし
符号化文字集合
JIS X 0201
JIS X 0208
JIS X 0212
JIS X 0213
JIS X 0221(日本文字部分レパートリ)
文字符号化方式
ISO-2022-JP
EUC-JP
Shift_JIS
Shift_JISX0213
Shift_JIS-2004
EUC-JISX0213
EUC-JIS-2004
ISO-2022-JP-3
ISO-2022-JP-2004
漢字シフトコード
文字一覧
JIS X 0213非漢字一覧
JIS X 0213漢字一覧の1面
JIS X 0213漢字一覧の2面
JIS以外の公規格
MJ文字
入管正字
ARIB外字
ARIB外字の追加記号一覧
メーカーの規格
符号化文字集合
IBM拡張文字
マイクロソフト標準キャラクタセット
Adobe-Japan1
iモード絵文字
EZweb絵文字
SoftBank絵文字
今昔文字鏡
JIPS
EBCDIC
GT書体
KEIS
IBM漢字システム
レコード用文字符号
ビブロス外字
文字符号化方式
Microsoftコードページ932
MacJapanese
JEF漢字コード
U-PRESS
日本語を含む
多言語文字集合
Unicode
ISO/IEC 10646
JIS X 0221
面
基本多言語面
追加面
追加多言語面
追加漢字面
第三漢字面
追加特殊用途面
私用面
文字符号化方式
UTF-8
UTF-16/UCS-2
UTF-32/UCS-4
UTF-7
UTF-EBCDIC
GB 18030
SCSU
BOCU-1
文字一覧
Unicode一覧
Unicode一覧表
Unicode6.0の携帯電話の絵文字の一覧