逆に、中国においては北京語やそれを元に成立した普通話と、上海語や広東語といった遠隔地の言語とは差異が大きく会話が成立しないほどであるが、書き言葉は共通であり、またあくまでも中国語群には属していて対応関係が明確であるため、これら言語はすべて中国語内の方言として扱われている[19]。
同じ言語かどうかを判定する基準として、相互理解性を提唱する考えがある。話者が相手の言うことを理解できる場合には、同一言語、理解できない場合には別言語とする。相互理解性は言語間の距離を伝える重要な情報であるが、これによって一つの言語の範囲を確定しようとすると、技術的難しさにとどまらない困難に直面する。一つは、Aの言うことをBが聞き取れても、Bの言うことをAが聞き取れないような言語差があることである。もう一つは、同系列の言語が地理的な広がりの中で徐々に変化している場合に、どこで、いくつに分割すべきなのか、あるいはまったく分割すべきでないのかを決められないことである。
こうした困難に際しても、単一の基準を決めて分類していくことは、理屈の上では可能である。しかしあえて単一基準を押し通す言語学者は現実にはいない。ある集団を「言語話者」とするか「方言話者」とするかには、政治的・文化的アイデンティティの問題が深く関係している。どのような基準を設けようと、ある地域で多くの賛成を得られる分類基準は、別の地域で強い反発を受けることになる。そうした反発は誤りだと言うための論拠を言語学はもっていないので、結局は慣習に従って、地域ごとに異なる基準を用いて分類することになる。
言語と方言の区別について、現在なされる説明は二つである。第一は、言語と方言の区別にはなんら言語学的意味はないとする。第二のものはまず、どの方言もそれぞれ言語だとする。その上で、ある標準語に対して非標準語の関係にある同系言語を、方言とする。標準語の選定は政治によるから、これもまた「言語と方言の区別に言語学的意味はない」とする点で、第一と同じである。この定義では、言語を秤にかけて判定しているのではなく、人々がその言語をどう思っているかを秤にかけているのである。
ある言語同士が独立の言語同士なのか、同じ言語の方言同士なのかの判定は非常に恣意的であるが、その一方で、明確に系統関係が異なる言語同士は、たとえ共通の集団で話されていても、方言同士とはみなされないという事実も有る。たとえば、中国甘粛省に住む少数民族ユーグ族は西部に住むものはテュルク系の言語を母語とし、東部に住むものはモンゴル系の言語を母語としている。両者は同じ民族だという意識があるが、その言語は方言同士ではなく、西部ユーグ語、東部ユーグ語と別々の言語として扱われる。また海南島にすむ臨高人も民族籍上は漢民族であるが、その言語は漢語の方言としては扱われず、系統どおりタイ・カダイ語族の臨高語として扱われる。
使用する文字は同言語かどうかの判断基準としてはあまり用いられない。言語は基本的にどの文字でも表記可能なものであり、ある言語が使用する文字を変更することや二種以上の文字を併用することは珍しいことではなく、また文法などに文字はさほど影響を与えないためである。デーヴァナーガリー文字を用いるインドの公用語であるヒンディー語とウルドゥー文字を用いるパキスタンの公用語であるウルドゥー語は、ヒンドゥスターニー語として同一言語または方言連続体として扱われることがある。
話者数の統計順位
母語話者統計で見た話者数詳細は「母語話者の数が多い言語の一覧」を参照
下表の母語話者数および分類は、『エスノローグ第21版』に準拠する。同資料は2021年時点の推計で、中国語は13方言、アラビア語は20方言、ラフンダー語は4方言の合計である。
1位中国語13億人
中華人民共和国
中華民国
マレーシア
シンガポール
2位スペイン語5億7700万人
スペイン
メキシコ
アルゼンチンなど
3位ヒンディー語4億9000万人
インド
フィジー
4位英語3億3500万人
アメリカ合衆国
イギリス
オーストラリア
カナダなど
5位ポルトガル語2億5000万人
ポルトガル
ブラジルなど
6位ベンガル語2億4300万人
バングラデシュ
インド
7位アラビア語2億3500万人
エジプト
サウジアラビア
イラクなど
8位フランス語2億3000万人
フランス
ベルギーなど
9位ロシア語1億8000万人
ロシアなど
10位ドイツ語1億3000万人
ドイツ
オーストリア
スイスなど
11位日本語1億2700万人
日本
パラオ
12位トルコ語8800万人
トルコなど
13位朝鮮語8250万人
韓国
北朝鮮
中華人民共和国 (延辺)