国民の意思疎通を容易にするため、中華人民共和国では、中央政府の標準語政策により、北方語の発音・語彙と近代口語小説の文法をもとに作られた「普通話」 (p?t?nghu?) が義務教育の中で取り入れられ、若い世代を中心に成果が上がっており(一般的に、全人口の7割程度が理解すると言われている)、標準語・共通語となりつつある。台湾においても、日本の敗戦後に施政権を握った中華民国政府が「國語」 (gu?y?) (「普通話」とほぼ同一で相互理解は可能だが音声と語彙に差異がある)による義務教育を行ってきたが、現在では台湾語、客家語、原住民諸語の学習時間も設けられている。
七大方言
北方語(官話方言)
華北東北方言(華北方言、華北官話) ? 華北・東北(北京など)
西北方言(西北官話) - 西北(陝西省西安など)、ドンガン語
西南方言(西南官話) ? 西南(四川省成都など)
江淮方言(下江官話) ? 江淮一帯(江蘇省南京など)
呉語(上海語など)
?語(南昌語など。客家語と近い)
湘語(長沙語など)
?語
?北語
?東語
?南語・台湾語
?中語
客家語(客家語)
粤語(広東語)
以下の方言は独立した大方言区とすべきとの議論がある。オーストラリア人文アカデミーと中国社会科学院がまとめた ⇒『中国言語アトラス (The Language Atlas of China)』はこの立場で編纂されている。
晋語 - 七大方言では北方語に属する
徽語 - 七大方言では呉語に属する
平話 - 七大方言では粤語に属する
ドンガン語は、音韻、基礎語彙、語法の面から北方語の一変種とする意見の他、キリル文字を用いて表記し、ロシア語やキルギス語などからの借用語が多く、使用国も異なるため、独立した言語とする意見もある。
中国語は声調言語である。音節の音の高低の違いが子音や母音と同じように意味を区別している。これを声調(トーン)という。例えば、「普通話」には {ma} という形態素は軽声も含めて 19 個もある(松岡、2001)。しかし陰平声、陽平声、上声、去声の四つの声調と軽声があるので、全てが同音にはならない。
例
陰平声(第一声) - 媽(m?; お母さん) ? 高く平ら
陽平声(第二声) - 麻(m?; 麻)? 上がり調子
上声(第三声) - 馬(m?; 馬) ? 低く抑える
去声(第四声) - 罵(m?; 罵る) ? 急激に下がる
軽声 - ?(ma; 疑問の助詞) ? 抑揚はなく、高さは前の声調により変わる
中国語の共通文字体系である漢字の歴史は古い。漢字は中国独自の文字で、ラテン文字などのアルファベットと異なり、音節文字であり表意文字である。漢字は大量かつ複雑な容姿をした部品を用い、かつ不規則な読み方をし、異体字や類義の字も多いため、習得に長期間を要し、経済的にも効率が悪いといった趣旨の否定的な評価からラテン文字などに移行すべきという意見があった。実際に朝鮮民主主義人民共和国やベトナムでは漢字を廃止した。
中国大陸では1956年に、字画が少なく、読みや構成にも統一性を高めた簡体字が導入された。簡体字は、中国全土で使用されることが中央政府によって義務化され、シンガポールも中国語(華語)の表記に用いる。これに対して、中華民国(台湾)、香港、マカオでは、基本的に簡体字以前の字体を維持した繁体字(台湾では正体字とも称する)が使われている。
繁体字・簡体字は、それぞれの文化圏での政治的・技術史的な経緯から、コンピュータ処理においては全く互換性のない別の文字コード・文字セット体系(簡体字圏=GB 2312、繁体字圏=Big5)が使用されてきた。簡体字には複数の繁体字を1字にまとめた形をとったものがあることから、逆に簡体字から繁体字に変換する場合、「??(頭髪)」を「頭發」、「干杯(乾杯)」を「幹杯」とする類の誤変換が中国大陸発のウェブサイトの繁体字版ページなどによく見られる。
また、中華人民共和国は1956年に漢語?音方案(ピンイン)というローマ字表記法を制定した。このピンインは、1977年に国連の第3回地名標準化会議で中国の地名のローマ字表記法として、1982年にはISOで中国語のローマ字表記法として採用された。また、ピンインは、外国人(特に欧米人)による中国語学習の助けにもなっている。中華民国(台湾)では、注音符号と呼ばれる発音記号を用いて漢字の読みを示すのが一般的である。台湾における中国語ローマ字表記法は、これまでさまざまな方式が考案・提案され、漢語?音を導入する動きもあるが、統一には至っていない。