中国語辞典に記された漢字の数[25][26]年辞書名漢字数
100説文解字9,353
543玉篇12,158
601切韻16,917
997龍龕手鑑26,430
1011広韻26,194
1039集韻53,525
1208五音篇海54,595
1615字彙33,179
1675正字通33,440
1716康熙字典47,035
1916中華大字典(英語版)48,000
1989漢語大字典(第一版)54,678
1994中華字海85,568
2001異體字字典(正式一版)105,982
2010漢語大字典(第二版)60,370
2014漢字海102,447
2024異體字字典(正式七版)106,303
コンピュータで処理するための文字集合では、Unicode 13.0が92,856字以上を[注釈 2]、日本の企業のソフトウェア『今昔文字鏡』が(漢字以外の文字も含むが)約16万字を[28]収録するなど、さらに多くの漢字を集めているものもある。一方、中華民国(台湾)行政院教育部の『異體字字典(正式七版)』によれば、漢字の正字数(異体字を含まない)は29,920字[29]であるが、こちらは国字を含んでいない(「付録」としてだけ収録してある[30])。 伝承によると、中国における文字の発祥は、黄帝の代に倉頡が砂浜を歩いた鳥の足跡を見て、足跡から鳥の種類が分かるように概念も同じようにして表現できることに気づいて作った文字とされる。また『易経』には聖人が漢字を作ったと記されている。 新石器時代の出土土器の表面に文字状の彫り込みが見られる。しかし記号・デザインの一種とも考えられており、殷中期まで続く。これらは漢字と系統を同じくするかは定かではなく、漢字の誕生と言えるかは不明である。 考古学的に現存する最古の漢字は、殷後期において占いの一種である卜(ぼく)の結果を書き込むために使用された文字である。これを現在甲骨文字(亀甲獣骨文)と呼ぶ。 漢字としての完成度が高いことが研究により明らかにされている。 当時の卜は亀の甲羅や牛の肩胛骨などの裏側に小さな窪みを穿ち、火に炙って熱した金属棒(青銅製と言われる)を差し込む。しばらく差し込んだままにすると熱せられた表側に亀裂が生じる。この亀裂の形で吉凶を見るのであるが、その卜をした甲骨に、卜の内容・結果を彫り込んだのである。 筆や木簡を表す甲骨文字が見られることから、それらを用いて記した文字もその時代にあったと推測されるが、考古学的出土はない。 現在存在する中での最古の漢字は、殷墟から発掘される甲骨などに刻まれた甲骨文字である[31]。その内容は殷王朝第22代武丁のころから書かれたものであるため、それ以前には新石器時代の遺跡等で発見される記号はあっても、文字として使用できる漢字ができあがったのは紀元前1300年ごろのことだと考えられる[32]。この甲骨文字は物の見たままを描く象形文字であり、当時の甲骨文字は絵に近い様相を持つものも多かった。その一方で、ある種の事態を表現する動詞や形容詞の文字も存在した。たとえば、「立」の原型である人が地面を表す横棒の上に書かれた字(指示文字)、女性が子供をあやす様から「好」や、人が木の袂(たもと)にいる様から「休」などの字(会意文字)も既に含まれていた[33]。さらに、同音の単語をすでにある別の字で表す代用字もあり、たとえば鳥の羽を示す「翼」の原型は、同音で次のことを示す単語に流用され、これがのちに「翌」となった[33]。このように、すでに現在の漢字の書体に似通っている部分が見受けられ、非常に発展したものであり、おそらくはこれ以前から発展の経路を辿ってきたものとみられる。最古の漢字には左右や上下が反転したものや、絵や記号に近い部品がつけられているものなど、現在の常識では考えられない(当然ながら現在では使用されていない)漢字が存在する[34]。その後、青銅器に鋳込まれた金文という文字が登場した。「NHKスペシャル 中国文明の謎第2集 漢字誕生」では、古代メソポタミアの文字が商取引の記録から始まっているのに対して、政治の方針を決めるための占いの用途で、骨(これまでに14,000体の殷の生贄の犠牲となった人骨が出土)に刻むために使われ始めた漢字は、文字としてはきわめて特殊なルーツであったとしている。たとえば、白は人間の頭蓋骨の白に由来する象形文字である。このように、鬼神と王を繋ぐための手段として、初期の漢字は始まった[35]。 周の時代になると、外交や商取引など多くの用途に漢字が使われるようになり、それまでの種類だけでは足りなくなった。そこで多くの新しい漢字が作られた[36]。
歴史