KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。ブルガリア語も扱える。ここから派生したKOI8-Uには、ウクライナ語の文字が追加されている。最初のKOI-8符号はソビエト当局により1974年に設計された。
KOI8はISO 8859-5よりもはるかに広く使われ続けている。ISO 8859-5が人気だったことはない。他のよく知られたキリル語文字コードはWindows-1251
である。キリル語を他の非ラテン言語と一緒に表現する方法としてUnicodeがある。KOI8はロシア語でKod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略であり、「情報交換用符号、8ビット」という意味である。
KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、主に発音の対応するASCIIのラテン文字の符号位置の順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは一見して不自然に見えるが、8ビット目が欠落する文字化けに対処できるという利点がある。たとえば、KOI8-Rで表現した"Русский Текст" (ラテン文字転写例: Russkij Tjekst)は8ビット目を落とすと"rUSSKIJ tEKST"になる。大文字と小文字が逆になることで文字化けが発生したことが分かり、文字の発音も近いため、そのまま読めるか、少なくとも復元することはできる。また、これは正しいKOI-7として解釈できる。ASCII文字列"rUSSKIJ tEKST"をKOI-7(КОИ-7 Н1)として解釈すれば"Русский Текст"である。一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。
KOI8-Rx0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0x制御文字
1x
2xSP!"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{|}~
8x─│┌┐└┘├┤┬┴┼?????
9x????■?√???NBSP?°2・÷
Ax???ё????????????
Bx???Ё???????????c
Cxюабцдефгхийклмно
Dxпярстужвьызшэщчъ
ExЮАБЦДЕФГХИЙКЛМНО
FxПЯРСТУЖВЬЫЗШЭЩЧЪ
外部リンク
.mw-parser-output cite.citation{font-style:inherit;word-wrap:break-word}.mw-parser-output .citation q{quotes:"\"""\"""'""'"}.mw-parser-output .citation.cs-ja1 q,.mw-parser-output .citation.cs-ja2 q{quotes:"「""」""『""』"}.mw-parser-output .citation:target{background-color:rgba(0,127,255,0.133)}.mw-parser-output .id-lock-free a,.mw-parser-output .citation .cs1-lock-free a{background:url("//upload.wikimedia.org/wikipedia/commons/6/65/Lock-green.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-limited a,.mw-parser-output .id-lock-registration a,.mw-parser-output .citation .cs1-lock-limited a,.mw-parser-output .citation .cs1-lock-registration a{background:url("//upload.wikimedia.org/wikipedia/commons/d/d6/Lock-gray-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .id-lock-subscription a,.mw-parser-output .citation .cs1-lock-subscription a{background:url("//upload.wikimedia.org/wikipedia/commons/a/aa/Lock-red-alt-2.svg")right 0.1em center/9px no-repeat}.mw-parser-output .cs1-ws-icon a{background:url("//upload.wikimedia.org/wikipedia/commons/4/4c/Wikisource-logo.svg")right 0.1em center/12px no-repeat}.mw-parser-output .cs1-code{color:inherit;background:inherit;border:none;padding:inherit}.mw-parser-output .cs1-hidden-error{display:none;color:#d33}.mw-parser-output .cs1-visible-error{color:#d33}.mw-parser-output .cs1-maint{display:none;color:#3a3;margin-left:0.3em}.mw-parser-output .cs1-format{font-size:95%}.mw-parser-output .cs1-kern-left{padding-left:0.2em}.mw-parser-output .cs1-kern-right{padding-right:0.2em}.mw-parser-output .citation .mw-selflink{font-weight:inherit}RFC 1489
⇒All about KOI8-R (英語)
⇒Universal Cyrillic decoder (英語) 壊れたKOI8-Rや他の文字コードで書かれたキリル文字の文章の修復を手助けするオンラインのプログラム。
⇒キリル文字符号化の小史 (英語)
符号化文字集合
JIS X 0201
JIS X 0208
JIS X 0212
JIS X 0213
JIS X 0221(日本文字部分レパートリ)
文字符号化方式
ISO-2022-JP
EUC-JP
Shift_JIS
Shift_JISX0213
Shift_JIS-2004
EUC-JISX0213
EUC-JIS-2004
ISO-2022-JP-3
ISO-2022-JP-2004
漢字シフトコード
文字一覧
JIS X 0213非漢字一覧
JIS X 0213漢字一覧の1面
JIS X 0213漢字一覧の2面
JIS以外の公規格
MJ文字
入管正字
ARIB外字
ARIB外字の追加記号一覧
メーカーの規格
符号化文字集合
IBM拡張文字
マイクロソフト標準キャラクタセット
Adobe-Japan1
iモード絵文字
EZweb絵文字
SoftBank絵文字
今昔文字鏡
JIPS
EBCDIC
GT書体