「ホモグラフ」とは異なります。
ホモグリフであるラテン文字の小文字のA(Unicode 0061)とキリル文字の小文字のA(Unicode 0430)を重ねて表示したもの。どちらの文字もHelvetica LT Stdが使用されている。
正書法やタイポグラフィにおいて、ホモグリフ(英語: homoglyph)とは、同一または非常によく似た形をした2つ以上の書記素、文字、字体(グリフ)のことである。この呼称は、このような特性を持つ複数の文字の列についても適用される。
シノグリフ(英語: Synoglyphs)とは、見た目は違うが同じ意味を持つ字体のことである。シノグリフは、非公式には「表示変化形」(display variants)ともいう。
「ホモグラフ」(homograph)という用語がホモグリフの同義語として使われることもある(ホモグラフ攻撃など)が、通常の言語学的な意味では、ホモグラフとは、綴りは同じだが意味が異なる単語のことであり、文字ではなく単語の性質である。日本語では同綴異義語という。
2008年、Unicodeコンソーシアムは、単一の用字内の文字の視覚的な類似性や、異なる用字内の文字間の類似性に由来する様々な問題について、技術報告書#36[1]を発表した。
歴史的な観点から見たホモグリフの混乱の例としては、"t"(ソーン)の文字を含まない書体で古い英文を表記する際に、"t"を表すために"y"(ワイ)を使用したことが挙げられる。これは現代では、"Ye olde
(英語版) shoppe"のような古い英文により、「"the"という単語が以前は"ye" [ji?]と書かれていた」と誤って暗示してしまう現象につながっている。詳細については、Tを参照のこと。ホモグリフ記号の例としては、(a) トレマとウムラウト(両方とも一対のドットで、意味は異なるが、同じコードポイントでコード化されている)、(b) ハイフンとマイナス記号 (両方とも短い横向きの線で、意味は異なるが、しばしば同じコードポイントでコード化されている)などが挙げられる。数字と文字の間では、数字の1(いち)と小文字のl(エル)、数字0(ゼロ)と大文字のO(オー)は、それぞれ常に別のコードポイントでコード化されているが、多くのフォントでは非常に類似した字体が与えられている。事実上、文字の全てのホモグリフ対は、明確に区別可能な字体と別々のコードポイントにより表示上で区別できる可能性があるが、必ずしもそうなっているとは限らない。1(いち)とl(エル)、0(ゼロ)とO(オー)のホモグリフを強調的に区別しない書体は、数式やURL、ソースコード、IDなど、文脈から判断しなければどちらの文字か判別できないようなテキストを書くのには適していないと考えられている。そのような用途には、例えば斜線付きゼロによって字体を区別するフォントが好ましい。
また、例えば6bを66だと誤認するなど、0とoや6とb、9とqなどはしばしば数学教育の場面において手書きが使用されるために間違えられることがあり、対策として学生らの間では文字を筆記体で書いたり、一段上げたり下げたり、時には大文字を使うなどが行われている。 機械式タイプライターの時代には、ウムラウトとトレマは同じキーでタイプされていたが、二重反転カンマにも使用されていた。しかし、ウムラウトは、元々は2つの短い縦線(点ではなく)として生まれたものである(ジュッターリーン体を参照)。ちなみに、アルバニア語のEの上にある2つの点はトレマとして記述されているが、トレマの機能を果たしていない。 今日使用されている2組の一般的で重要なホモグリフは、数字の0(ゼロ)・大文字のO(オー)、および、数字の1(いち)・小文字のl(エル)・大文字のI(アイ)である。初期の機械式タイプライターの時代には、これらの字体の間にはほとんど、あるいは全く視覚的な違いがなく、タイピストはキーボードショートカットとしてそれらを互換的に扱っていた。実際、ほとんどのキーボードには数字の1のためのキー自体がなく、ユーザーはその代わりに小文字のl(エル)を入力していた。また、いくつかの機種では数字の0のキーもなく、O(オー)で代用していた。1970年代にタイピストだった人たちが、1980年代にコンピュータのキーボードオペレータに移行したため、タイプライターでの習慣がそのままコンピュータにも持ち込まれ、これが混乱の原因となっていた。 体積の単位のリットルの記号は、単位名称が人名由来ではないため本来は小文字の l (エル)となるが、数字の 1 と似ていて紛らわしいことから大文字の L とすることが推奨されている。 現在のほとんどの書体デザインでは、これらのホモグリフを慎重に区別しており、通常は数字のゼロを文字のオーよりも幅を狭くし、数字の1には上部に(フォントによっては下部にも)セリフをつけている。初期のコンピュータのプリントアウトでは、数字のゼロに斜線やドットをつけて明確に区別していた(斜線付きゼロを参照)。しかしこれは、北ゲルマン語群の文字"O"やギリシャ文字のΦ(ファイ)との新たなホモグリフを生んだ。これらの、文字を区別するための字体の再設計は混乱を少なくする。2つの異なる文字が同じように見える程度の度合いを、「視覚的類似性」(visual similarity)という[2]。
ウムラウトとトレマ
0とO、1とlとI