アラビア文字 (Unicodeのブロック)
Arabic
範囲U+0600..U+06FF
(256 個の符号位置)
面基本多言語面
用字アラビア文字
ペルシャ文字
主な言語・文字体系
アラビア語
ペルシャ語
ウルドゥー語
パシュトー語
クルド語
ウイグル語
オスマン語
南アゼルバイジャン語
シンド語
バローチー語
西パンジャーブ語
カシミール語
マレー語
割当済256 個の符号位置
未使用0 個の保留
Unicodeのバージョン履歴
1.0.0169 (+169)
1.1194 (+25)
3.0206 (+12)
3.2208 (+2)
4.0227 (+19)
4.1235 (+8)
5.1250 (+15)
6.0252 (+2)
6.1253 (+1)
6.3254 (+1)
7.0255 (+1)
14.0256 (+1)
テンプレートを表示
アラビア文字(アラビアもじ、英語: Arabic)は、Unicodeの13個目のブロック。 中東及び北アフリカ地域に広がるアラブ圏で広く話されている、イスラム教の聖典言語であるアラビア語に加え、イランの公用語であるペルシャ語、パキスタンの公用語であるウルドゥー語、アフガニスタンの公用語であるパシュトー語、中華人民共和国・新疆ウイグル自治区に居住するテュルク系少数民族であるウイグル人に話されているウイグル語、イラク・イラン・トルコ等のクルディスタン地域に居住するクルド人に話されているクルド語(特にソラニー方言)などの、ムスリムの多く居住するイスラム圏で用いられる他の言語の表記にも用いられるアラビア文字を収録している。 現在はアラビア文字での表記が一般的ではなくなっているものの、かつては正書法がアラビア文字であったトルコ語、アゼルバイジャン語(ただしイランなどに居住するアゼルバイジャン人の話す南アゼルバイジャン語では現在もアラビア文字を用いる)、マレー語、カザフ語などのための文字や、現在は死語となっているオスマン語、古典アラビア語などのための文字も本ブロックに含まれている。 アラビア文字は音素文字のうち、子音のみを記述するアブジャドであり、「アブジャド」の名称もアラビア文字の古典的な並び順(アブジャド順)における最初の4文字(アリフ、バー、ジーム、ダール)に由来している。一般的な文書では母音を記述しないが、イスラム教の聖典であるクルアーン(コーラン)や、初学者及び初等教育用の教材など正しい単語の読みを明示する必要がある文書ではシャクルと呼ばれる母音記号が用いられるため、これらの記号も本ブロックに収録されている。 書字方向はヘブライ文字などと同様に右から左へと横書きされ(右横書き)、一部の例外となる文字を除いてラテン文字の筆記体のように同じ単語の文字同士は繋げて綴られる。また、各文字はその単語内の位置によって独立形、語頭形、語中形、語末形の4種類の形状を取るが、本ブロック内においては単語内の位置による字形差は符号位置上は統一されており、フォント内でその挙動を制御する仕様になっている。但し、一部の文字についてはアラビア文字表示形A
解説
なお、アラビア文字から派生した、ペルシャ語を表記するためのペルシャ文字や、ウルドゥー語の表記に用いられるウルドゥー文字、パンジャーブ語やラフンダー語などの表記に用いられるシャームキー文字、かつてマレー語の表記に用いられていたジャウィ文字(ただしタイに居住するマレー系民族の話すジャウィ語では現在でも使われ、マレーシアにおいても看板などの地名表記には現在でも使われている)、インドネシアでかつてジャワ語やスンダ語、マドゥラ語などの表記に用いられていたぺゴン文字(英語版)、ナイジェリアやニジェールなどで話されるハウサ語及び、ブルキナファソやマリで話されるフラニ語の表記に用いられるアジャミ(英語版)、かつてマダガスカル語の表記に用いられていたソラベ文字(英語版)などは文献によっては別の文字体系として扱われていることがあるが、Unicode上はアラビア文字の変種として扱われ、同じ文字体系として扱われている。また、ウルドゥー語やカシミール語の表記に用いられるアラビア文字はナスタアリーク体と呼ばれる一般的なアラビア文字とは大きく字形の異なる書体が使われているが、こちらもUnicode上はアラビア文字と同じ表記体系として扱われているため、これらの文字も本ブロックに含まれている。
Unicodeのバージョン1.0においても「アラビア文字(Arabic)」というブロック名で制定されていた。[1] 「ラテン文字転写」の列はアラビア文字のラテン翻字方式の一つであるISO 233に従う。なお、言語名の後に括弧書きで年号や年号の範囲が書かれているものについては、その期間でのみ使われたことがあり、現在では廃字となってその言語では用いられなくなっているか、あるいは一般的な表記ではなくなっていることを表す。 コード文字文字名(英語)用例・説明ラテン文字転写 U+0604 とは異なり主にグレゴリオ暦やイスラム暦(ヒジュラ暦)で用いられ、グレゴリオ暦の場合は年号とこの記号の後に「キリスト教の」を意味するアラビア語????? ??saw?の略である字母ain(U+0639 ?)の語頭形を、イスラム暦の場合はムハンマドの聖遷(ヒジュラ)を表すアラビア語 ???? hijr?の略である字母heh doachashmee(U+06BE ?)を記す。[4]
収録文字
ベースライン下方のマーカー
U+0600?ARABIC NUMBER SIGNアラビア文字における番号記号。ラテン文字などの"#"にあたる。アラビア・インド数字で書かれた数値の下に書かれる。[2][3]
U+0601?ARABIC SIGN SANAHアラビア文字において年号の数値の下に書かれる記号。[2][3]
U+0602?ARABIC FOOTNOTE MARKERアラビア文字において脚註を示す際に用いられる記号で、註釈が必要な個所に脚註番号を表すアラビア・インド数字の下に書かれて、ページの下部などに再度同じ数字とこの記号の組み合わせが使われて註釈の情報が記される。[2][3][5]