Unicodeでは多くのラテン文字が含まれている。Unicodeのバージョン9.0時点では1,350字のラテン文字が下記のブロックに含まれている。
基本ラテン文字、0000?007F。ASCIIと同一。
ラテン1補助、0080?00FF。ISO/IEC 8859-1と同一。
ラテン文字拡張A、0100?017F
ラテン文字拡張B、0180?024F
IPA拡張、0250?02AF
前進を伴う修飾文字、02B0?02FF
音声記号拡張、1D00?1D7F
音声記号拡張補助
ラテン文字に似た記号はUnicodeでは他にも定義されているが、コモン(英語版)という条件(特定の言語のものではなく、複数の言語で共有されている)に合致するため「Unicodeにおけるラテン文字」に含まれない。
ラテン文字拡張は主にダイアクリティカルマークがつけられているラテン文字が定義され、アフリカ諸語(拡張B)、ベトナム語(拡張追加)、ウイグル語(拡張C)、中世の言語(拡張D)、ドイツ方言(拡張E)などで使われている。 下記の表はUnicodeにおけるラテン文字の配置を記すが、背景色はその文字が追加されたUnicodeのバージョンを表す。灰色は未使用、白背景はラテン文字以外を表す。 Unicodeのバージョン U+0123456789ABCDEFブロック文字数
Unicodeにおけるラテン文字の一覧
Unicode 1.0Unicode 4.1
Unicode 1.1Unicode 5.0
Unicode 2.0Unicode 5.1
Unicode 2.1Unicode 5.2
Unicode 3.0Unicode 6.0
Unicode 3.1Unicode 6.1
Unicode 3.2Unicode 7.0
Unicode 4.0Unicode 9.0
未使用ラテン文字以外
0040@ABCDEFGHIJKLMNO基本ラテン文字
0000?007F
(ASCIIと同一)52
0050PQRSTUVWXYZ[\]^_
0060`abcdefghijklmno
0070pqrstuvwxyz{|}~DEL
00A0 !¢£?\|§¨ca≪¬R ̄ラテン1補助
0080?00FF
(ISO/IEC 8859-1と同一)64
00B0°±23´μ¶・,1o≫????
00C0AAAAAAACEEEEIIII
00D0DNOOOOO×OUUUUYTs
00E0aaaaaaaceeeeiiii
00F0dnooooo÷ouuuuyty
0100????????????????ラテン文字拡張A
0100?017F128
0110????????????????
0120????????????????
0130????????????????
0140????????????????
0150????????????????
0160????????????????
0170????????????????
0180????????????????ラテン文字拡張B
0180?024F208
0190????????????????
01A0????????????????
01B0????????????????
01C0????????????????
01D0????????????????