語族(ごぞく、英: Language family)とは、比較言語学において、ある言語(祖語)とそこから派生した全ての言語を含む単系統群のうち、他の単系統群に包含されることが認められていないものを指す[1]。
なお、日本語圏では、語族の下位群を語派、語派の下位群を語群と呼ぶことがある。例えば、英語・ドイツ語・オランダ語といった西ゲルマン語群は、北ゲルマン語群や東ゲルマン語群と共にゲルマン語派を成すが、さらにゲルマン語派はイタリック語派やインド・イラン語派などと共にインド・ヨーロッパ語族に含まれる。
同系統と証明されていない言語群をまとめて呼ぶときは「?諸語」という(例:アルタイ諸語、アメリカ・インディアン諸語、カフカス諸語)。ただし、語族か語派か語群かを問題にしないときも単に「?諸語」と言うことがある。また、複数の語族をまとめた大語族も存在するが、仮説段階であり同系と証明されてはいない。したがって、比較言語学において語族とは同系統と証明されている最上位の言語グループと定義される。
語族は民族(共同体)を指すのではなく、言語を系統学的に分類する概念であるが、民族を分類する場合にも言語の分類(語族、語派)が基準にされることが多い。(例:テュルク系民族、ウラル系民族)
語族の一覧「語族の一覧」を参照世界の主要語族
詳細はDistribution of languages in the worldを参照
含まれる言語数からみた語族エスノローグ18版による:
ニジェール・コンゴ語族 (1,538言語) (20.6%)
オーストロネシア語族 (1,257言語) (16.8%)
トランス・ニューギニア語族 (480言語) (6.4%)
シナ・チベット語族 (457言語) (6.1%)
インド・ヨーロッパ語族 (444言語) (5.9%)
オーストラリア語族 (378言語) (5.1%)
アフロ・アジア語族 (375言語) (5.0%)
ナイル・サハラ語族 (205言語) (2.7%)
オト・マンゲ語族 (177言語) (2.4%)
オーストロアジア語族 (169言語) (2.3%)
タイ・カダイ語族 (95言語) (1.3%)
ドラヴィダ語族 (85言語) (1.1%)
トゥピ語族 (76言語) (1.0%)
語族の形成と認定方法「比較方法」を参照
いかなる言語であれ、次の世代へと継承されていくうちに、音韻論・形態論・統語論といった様々な領域において変化を被るものである[2]。祖語から娘言語への分岐は、例えば、地理的・政治的な分離によって全ての話者に変化が共有されなくなり、元の言語共同体が徐々に別個の言語単位へと分かれた結果として起こる。なお、元から他の言語共同体に属する個人も、言語交替を通じて異なる語族の言語を採用する可能性があるが[3]、その際、新しく採用された言語が基層言語の影響を受けることもある[4]。
こうしたプロセスを経て、単一の言語から分化・拡散した諸言語の間には、「系統関係」(遺伝的関係、genealogical relation ship) があると言われる。系統関係の認定は、比較方法を通して行われる[5]。
比較方法の基盤となるのは、言語の恣意性・音変化の規則性・自然の斉一性である[6]。
まず、恣意性とは、言語記号の表現形式である音形と、そこで表現される意味との間に、必然的な結びつきが無いことを指す[7]。例えば、「木」という記号は、tree・arbre・umthiであっても同じ意味を表せたはずである。 以上から明らかなように、記号の音形は (擬声語は例外として) 意味との関連が薄く、因果的な繋がりを持たないのが普通である。こうした音形と意味の任意性に鑑みれば、その可能な組み合わせは無限に存在すると言える。したがって、arbre・arbor・alberoのような、複数の言語間で見られる類似の記号は、共通の祖語に由来する同根語である可能性が高い[注釈 1]
もちろん、記号の類似をもたらす要因としては、これ以外にも、借用のほか、単なる偶然の一致が挙げられる。しかし、言語間に規則的な音韻対応があれば、偶然である可能性は低くなる[8]。例えば、英語のfather, foot, fearとフランス語のpere, pied, peurを比較すると、f-とp-の対応が認められ、forとpourのような新たな一致が予測できる。一方、英語のboyと日本語の「坊や」に見られる一致は、この種の規則性を伴わない。そして、以上のような音韻対応が、比較的借用されにくい基礎語彙や、活用語尾などの文法形式に数多く認められるのであれば、言語間の系統関係はより尤もらしくなる[9]。 系統関係のある言語は、共有特徴、すなわち、偶然や借用(伝播)では説明できない祖語の特徴(またはそのような特徴の反映)の保持を示す。そして、語族の下位分類となる語派・語群もまた系統群である点に鑑みれば、その認定は「共有革新」の認定を通じて行われる。(生物学でいうと共有派生形質に相当する。)つまり、語族の全構成言語の共通祖先には見られず、分枝先の言語のみに共通して存在する特徴があれば、これがまさに祖語からの分岐を定義付ける特質と言える。例えば、「ゲルマン語派」の諸言語は、インド・ヨーロッパ祖語には存在しないと考えられている語彙や文法の特徴を共有しており、これらの特徴は、すべてのゲルマン諸語の祖であったゲルマン祖語(インド・ヨーロッパ祖語の子孫の一)で起こった革新であると考えられる。 語族は、分化のその歴史が樹形図として表されることが多いため、語派(branch)というより小さな系統単位に分割可能である。語族は単系統群であり、全ての所属語は共通祖先(祖語)に由来し、全ての"証明"された子孫言語は語族に含まれる。(従って「語族」は、生物学的な「クレード」に類似する。) 一部の分類学者は、語族という用語の使用を特定の階級に制限しているが、その方法については殆どコンセンサスがない。このようなラベルを付ける人は、語派(branch)を語群(group)に、groupをcomplexに細分化する。最上位階級の語族は、しばしば phylum または stock と呼ばれる。枝が互いに近いほど、言語はより密接に関連している。つまり、祖語が4つに分岐し、4番目の分岐内に姉妹言語が存在する場合、2つの姉妹言語は、全体の祖語よりも相互に密接に関連している。 大語族(Macrofamily または Superfamily)という用語は、一般に受け入れられている歴史言語学的方法によって実証されていないが、系統関係が提案された、語族より上位の言語グループに適用されることがある。 いくつかの緊密な語族群、およびより大きな語族の多くの分枝は、方言連続体の形をとり、語族内の個々の言語の明確な識別、定義、カウントを可能にする明確な境界が無い。ただしアラビア語のように、連続体の両端に存在する方言の差異が非常に大きく、相互理解性がない場合、連続体を単一の言語として意味のあるものとはみなせない。 言語の多様性は、社会的または政治的な考慮事項に応じて、言語または方言のいずれとも見做され得る。したがって、情報源によって、(特に時間の経過とともに、)特定の語族内で全く異なる数の内包言語数が示される可能性がある。たとえば、日琉語族の分類は、内包言語が唯一日本語のみ(琉球の言葉を方言とみなす場合)とされることもあれば、20近くの言語が含まれるとされる場合もある。
下位分類の認定
語族の構造
方言連続体「方言連続体」を参照