Unicode
文字符号化スキーム
UTF-7
UTF-8
CESU-8
UTF-16
UTF-32
UTF-EBCDIC
SCSU
Punycode (IDN/IDNA)
GB 18030
その他
UCS
マッピング
書字方向
BOM
漢字統合
UnicodeとHTML
Unicodeと電子メール
Unicodeフォント
.mw-parser-output .hlist ul,.mw-parser-output .hlist ol{padding-left:0}.mw-parser-output .hlist li,.mw-parser-output .hlist dd,.mw-parser-output .hlist dt{margin-right:0;display:inline-block;white-space:nowrap}.mw-parser-output .hlist dt:after,.mw-parser-output .hlist dd:after,.mw-parser-output .hlist li:after{white-space:normal}.mw-parser-output .hlist li:after,.mw-parser-output .hlist dd:after{content:" ・\a0 ";font-weight:bold}.mw-parser-output .hlist dt:after{content:": "}.mw-parser-output .hlist-pipe dd:after,.mw-parser-output .hlist-pipe li:after{content:" |\a0 ";font-weight:normal}.mw-parser-output .hlist-hyphen dd:after,.mw-parser-output .hlist-hyphen li:after{content:" -\a0 ";font-weight:normal}.mw-parser-output .hlist-comma dd:after,.mw-parser-output .hlist-comma li:after{content:"、";font-weight:normal}.mw-parser-output .hlist-slash dd:after,.mw-parser-output .hlist-slash li:after{content:" /\a0 ";font-weight:normal}.mw-parser-output .hlist dd:last-child:after,.mw-parser-output .hlist dt:last-child:after,.mw-parser-output .hlist li:last-child:after{content:none}.mw-parser-output .hlist dd dd:first-child:before,.mw-parser-output .hlist dd dt:first-child:before,.mw-parser-output .hlist dd li:first-child:before,.mw-parser-output .hlist dt dd:first-child:before,.mw-parser-output .hlist dt dt:first-child:before,.mw-parser-output .hlist dt li:first-child:before,.mw-parser-output .hlist li dd:first-child:before,.mw-parser-output .hlist li dt:first-child:before,.mw-parser-output .hlist li li:first-child:before{content:" (";font-weight:normal}.mw-parser-output .hlist dd dd:last-child:after,.mw-parser-output .hlist dd dt:last-child:after,.mw-parser-output .hlist dd li:last-child:after,.mw-parser-output .hlist dt dd:last-child:after,.mw-parser-output .hlist dt dt:last-child:after,.mw-parser-output .hlist dt li:last-child:after,.mw-parser-output .hlist li dd:last-child:after,.mw-parser-output .hlist li dt:last-child:after,.mw-parser-output .hlist li li:last-child:after{content:")\a0 ";font-weight:normal}.mw-parser-output .hlist ol{counter-reset:listitem}.mw-parser-output .hlist ol>li{counter-increment:listitem}.mw-parser-output .hlist ol>li:before{content:" "counter(listitem)" ";white-space:nowrap}.mw-parser-output .hlist dd ol>li:first-child:before,.mw-parser-output .hlist dt ol>li:first-child:before,.mw-parser-output .hlist li ol>li:first-child:before{content:" ("counter(listitem)" "}.mw-parser-output .navbar{display:inline;font-size:75%;font-weight:normal}.mw-parser-output .navbar-collapse{float:left;text-align:left}.mw-parser-output .navbar-boxtext{word-spacing:0}.mw-parser-output .navbar ul{display:inline-block;white-space:nowrap;line-height:inherit}.mw-parser-output .navbar-brackets::before{margin-right:-0.125em;content:"[ "}.mw-parser-output .navbar-brackets::after{margin-left:-0.125em;content:" ]"}.mw-parser-output .navbar li{word-spacing:-0.125em}.mw-parser-output .navbar-mini abbr{font-variant:small-caps;border-bottom:none;text-decoration:none;cursor:inherit}.mw-parser-output .navbar-ct-full{font-size:114%;margin:0 7em}.mw-parser-output .navbar-ct-mini{font-size:114%;margin:0 4em}.mw-parser-output .infobox .navbar{font-size:88%}.mw-parser-output .navbox .navbar{display:block;font-size:88%}.mw-parser-output .navbox-title .navbar{float:left;text-align:left;margin-right:0.5em}
表
話
編
歴
Unicodeにおいて、ブロック(英語: block)とは、符号位置 (code points) の連続する範囲を意味する。ブロックには一意に名前が付けられ、重なりはない。各ブロックは hhh0 形式の開始符号位置と hhhF 形式の終了符号位置を持つ。ブロックは、未割当 (unassigned) または非文字 (non-character) である符号位置 (en) を、明示的に含むことができる[1]。名前付きのブロックのいずれにも属さない符号位置、例えば未割当の面である第4面-第13面に属する符号位置は、ブロックとして「No_block」という値を持つ。
逆に言えば、割当済 (assigned) の符号位置はすべて「ブロック名」(Block name) という特性(英語版) (property) を持つ。これはその文字 (character) があるブロックの名前である。これは符号位置のみによって決定されるが、ブロック名には説明的な性質がある。例えば「チベット文字」(Tibetan) や「補助矢印A」(Supplemental Arrows-A) が典型である。すべての割当済の符号位置は、それぞれ単一のブロック名を持つ。
その他の記号 (Miscellaneous symbols) ブロック中の「チェスシンボル(英語版)」(Chess symbols) のような下位区分は、「ブロック」ではない。下位グループの名前は有益な編集上の追加でしかない。
一個のブロックに含まれる符号位置の数は16の倍数になる。ブロックの範囲の大きさは、最小で16個から、最大で65,536個の符号位置までである。
Unicode 9.0 では273個のブロックが定義されている[2] 。 ブロックについてはUnicodeコンソーシアムに資料※があり、本一覧表との相違を本一覧表の次に示す。相違はおおむね本一覧表が古いことによる。※出元:15.1:<https://www.unicode.org/Public/15.1.0/ucd/Blocks.txt
第0面の基本多言語面 (Basic Multilingual Plane; BMP) に、161個。
第1面の追加多言語面 (Supplementary Multilingual Plane; SMP) に、103個。
第2面の追加漢字面 (Supplementary Ideographic Plane; SIP) に、5個。
第14面(十六進数表記でE)の追加特殊用途面 (Supplementary Special-purpose Plane; SSP) に、2個 。
第15面 (Fhex) と第16面 (10hex) の私用面に、それぞれ補助私用領域A (Supplementary Private Use Area-A)、補助私用領域B (Supplementary Private Use Area-B) という名前のブロックが1個ずつ。
ブロックの一覧
表
話
編
歴
Unicodeのブロックと含まれる用字
面ブロックの範囲[一覧 1]ブロック名[一覧 2]日本語名称[一覧 3]符号位置の数[一覧 4]割当済の文字の数用字[一覧 5][一覧 6][一覧 7][一覧 8]
0 BMPU+0000..U+007FBasic Latin[一覧 9]基本ラテン文字
Basic Latin128128ラテン文字 (52文字), Common (76文字)
U+0080..U+00FFLatin-1 Supplement[一覧 10]ラテン1補助
Latin-1 Supplement128128ラテン文字 (64文字), Common (64文字)
U+0100..U+017FLatin Extended-Aラテン文字拡張A
en:Latin Extended-A128128ラテン文字
U+0180..U+024FLatin Extended-Bラテン文字拡張B
en:Latin Extended-B208208ラテン文字
U+0250..U+02AFIPA ExtensionsIPA拡張
en:IPA Extensions9696ラテン文字
U+02B0..U+02FFSpacing Modifier Letters前進を伴う修飾文字
en:Spacing Modifier Letters8080注音符号 (2文字), ラテン文字 (14文字), Common (64文字)
U+0300..U+036FCombining Diacritical Marks合成可能なダイアクリティカルマーク