当用漢字で採用された新しい字体、すなわち新字体に対して、それ以前に慣用されていた字体を指す。おおまかには康熙字典体と一致するが、そもそも当用漢字の制定以前は、教科書でも複数の字体が併用されているなど、字体について厳密な統一がなされていなかった。ゆえに個々の文字について、旧字体と見なされる字体は必ずしも一定ではない。
1950年代に中国で新たに制定された中国語の正字体系が簡体字である。簡化字とも呼ぶ。中国およびシンガポールで使用されている。多くは、画数を減らしたり、別の部品を用いるなどの方法で、字体が変更された。また、簡体字の系統でも、施行後に廃止された第二次漢字簡化方案の字などは、現在俗字として扱われる。
台湾、香港、マカオなどで使用されている、特別な簡略化を受けていない字体が繁体字である。正体字、老字とも呼ぶ。地域によって異体字の扱いが異なったり、字体に細かい異同が見られる。
韓国で使用されている、特別な簡略化を受けていない字体を韓文漢字とも呼ぶ。
1960年代の中国で、康熙字典体に代わる標準印刷字体として制定されたものが新字形である。より筆記体に近い字体が採用され、減画や異体字の整理がなされている。簡体字と混同されることがあるが、簡体字だけでなく繁体字も含めた字体体系である。なお、中国の漢字学においては、字形と字体を一般に区別しない。
同一の文字観念を有する複数の字体であり、実際の使用される文章においては、異体字は相互に置換が可能である。正字体に対して異なる字体を異体字というのと同様に、正字体も別の字体にとっては異体字であり、その関係は相互的である。漢字はその字形のゆれが大きく、また、書体の変遷により、異なる字体を持つことが多い。複数の字体が同一の文字について許容されることもあるが、結果として、別の意味が割り当てられ、その用法が区別されるようになるともはや別字となる(「吊」と「弔」、「著」と「着」、「句」と「勾」、「笑」と「咲」など)。「協」と「叶」は本来、同字の別体であったが、意味が分化し、日本では「かなう」、中国の簡体字では「葉」の意になるなど、国ごとの分化さえ見られる。日本では、壬申戸籍(1872年)の作成の際にあった誤字や書き癖が、戸籍にある字形を尊重した結果、当用漢字・常用漢字に対しての異体字として認知されるにいたる場合も多い。
古字(古文)は、秦の始皇帝による小篆普及以前の大篆(籀文)など、古い字体に基づく字を指す。「一」に対する「弌」、「協」に対する「叶」など。
俗字・通字とは、正字として認められた字体以外で通用されている文字を指す。正字規範の高まりと共に認知されるにいたった。俗字には別の部品を当てるもの、同じ音をもつ部品を当てるもの、画数を減らすもの、別の部品を付け足すもの、異なる発想で会意字を作るものなどがある。「卒」に対する「卆」、「崎」に対する「ア」(あるいは「嵜」「?」)、「吉」に対する「?」、「高」に対する「」、「橋」に対する「?」「?」、「魚」に対する「?」(「魚」の下の部分が「?」ではなく「大」)、「翠」に対する「翆」など。(機種依存文字も含まれているため、一部のパソコンや、携帯電話からは閲覧出来ない場合があります。)
異体字は次のようなものに分けられる。
字体の構成要素の位置が異なるもの。
例.隣・鄰、和・秩A飄・飃、峰・峯、群・羣、鵝・鵞、鑑・鑒、慚・慙、晰・ル、稿・稾、雜・襍、岸・?、松・枩…(機種依存文字あり)
異なる音符を使ったもの。
例.棲・栖、綫・線、麪・麺、卻・却、筍・笋、窯・窰…
異なる意符を用いたもの。
例..効・效、秘・祕、嘆・歎、睹・覩、暖・煖、器・噐、収・收、詠・咏、唇・脣、罰・罸、考・攷…
一方が形声で作られ、一方が会意で作られたもの。
例.涙・泪、巌・岩、渺・E、拏・拿、逃・迯…
会意や形声の仕方が異なり、字体上の共通項がないもの。
例.體・体、同・仝、…
略体や書き癖、運筆の連綿によって生じたもの(※竹冠と草冠、「口」と「ム」、「」と「」などは頻繁に相互置換される)。
例.著・着、吊・弔、亰・京、曾・曽、船・舩…
一般に字義・字音が同じであり、同じ文脈で交換して使用可能なものを異体字と認定できる。すべての字義において交換可能なものもあるが、一部の字義にのみ通用される異体字もある。
ただし、特に中国では字義・字音の歴史的な変化により、認定に難しい問題がある。第1には、古代の字音が同じでないもの。例えば、寔(ショク、shi2)と實(実)(ジツ、shi2)は「まこと」という意味、置(チ)とゥ(シ、zhi4)は「おく」という意味であり、同音同義語であるが、日本漢字音を見て分かるとおり、古代音においては異なっていた。第2に古代において本義を異にするもの。「修」と「脩」、「彫」と「雕」などは同音同義語であるが、古代において本義が異なる字であった。これらは現代語の観点から言えば、異体字と認定できるが、古語の観点から言えば、異体字と認めることができないものである。
逆に、古代において異体字であったものが、後には意味の棲み分けをして異体字関係でなくなったものがある。例えば、先秦・漢代の文献で「諭」と「喩」はともに「さとす・たとえる」の意味をもち、通用されているが、後には「さとす」は「諭」、「たとえる」には「喩」が使われるようになった。特に意符を異にする異体字間でこのような事例が多い。以前は異体字関係であったものとして、他に、脇・脅、弔・吊、著・着、果・菓、棋・碁などがある。
なお異体字関係にある文字がすべて正字・俗字に分けられるわけではない。時代の流行、個人の趣向などにより同様に広く使われてきたものが多い。また「椀」や「碗」、「槍」や「鎗」、「鉱」や「砿」など同音同義語であるにもかかわらず、材質という細かなニュアンスの違いなどでも次々に異体字が作られる。これらを一概に整理統一することは非常に困難である。
JIS X 0208などの文字集合では基本的に情報交換用の文字を示すのが目的であるため、異体字ごとにコードポイントを割り振ったりはしないことが原則である。(ただし固有名詞対応の必要性などから、複数の異体字に個別のコードが与えられているケースが多数見られる)。そのため、コンピュータ上で表示される文字は、フォントを作る場合にその一例として採用した文字にすぎない。符号上は正しい文字だがフォントの関係上意図していた字体と違う場合も多く、異体字を包摂(1つのコードポイントに異体字を統合)せずに別にできる方法が必要という声もある。例えば、いわゆる「=はしごだか」と「高=くちだか」では符号区点は1つしかないが、別のコードポイントを与えるべきだとの声もある。
Unicodeでも基本的に事情は同様であるが、その一方で、さまざまな既存の規格を取り込む際に「原規格分離 (source code separation) の原則」によって異体字に別のコードポイントが与えられたものもあり(「=はしごだか」と「高=くちだか」もこれに該当)、さらに混沌としている。
Unicodeでは、漢字の異体字の問題については、「異体字タグ」(variant tag) の導入により包括的な解決を企図するとしていた。実際に、Unicode 3.2 では異体字タグは「異体字セレクタ(異体字選択子、字形選択子、英: Variation Selector)」という名称で、16文字分 (U+FE00 - U+FE0F) が、Unicode 4.0では240文字分 (U+E0100 - U+E01EF) が追加された。規格書には「先行する1文字と組み合わせることによって、あらかじめ定義付けされた異なる字体を任意に選択できる」とあり、理屈の上では1文字につき256種類の異体字情報を持つことが出来るようになった。その後、2006年1月13日に漢字で異体字セレクタを使うための漢字字形データベース (Ideographic Variation Database) への登録手続きが定められ、2007年12月14日に最初の異体字コレクションとしてAdobe-Japan1が登録された。