日本が近代ネーションステート(国民/民族国家)として朝鮮半島、台湾島、南樺太などを領有していた時代には、日本人という語は公式には朝鮮人、台湾人などの日本国籍を付与された植民地の先住民族を含む国籍的概念であった。大日本帝国が多民族国家であることは強く意識され、現在の日本国民に相当する人々は内地人と呼ばれた。但し当該の先住民族の間では日本人が内地人と同義として使われることが多かった。
南樺太に住んでいたロシア人、ポーランド人、ウクライナ人、ドイツ人、朝鮮人、ウィルタやニヴフのなかには、日本国籍をもっていたものもいた。そのため、終戦後ソ連によって「日本人」として北海道に強制送還された朝鮮人、ウィルタ、ニヴフがいた。また反ソ分子として抑留された者もいた。ポーランド系日本国民の多くはポーランド国籍を取得しポーランドに移住した。
単一民族国家を参照
日本は見た目や言語に大差のない人々が多いため、単一民族国家と捉えられることが多い。むろん国内には少数民族も存在するため正確ではない。これは、民族と国籍を混同することにより生じる。とはいえ日本における登録上の外国人居住者の比率が2%以下であり(2006年発表の外国人居住者数約200万人)、日本国籍を保有している居住者が98%を越えることや、大和民族とされる人々が95%[要出典]以上を占めるという主張などは、航空機をはじめとする高度な移動手段が発達した現代日本における均質性を考えるとき、考慮する必要はある。
従来提唱された説として日本人の起源は南方系の縄文人と北方系の弥生人であるとする埴原和郎らの二重構造説があった。しかし近年の研究の発展により縄文人も弥生人も北方起源であるとする説や、長期にわたる地域間移動や複数回の大量移動などを示すデータが蓄積されるなか、すくなくとも従来の時代的概念としての縄文人/弥生人という単純な図式では説明できないとする説が台頭し、埴原の二重構造説には多くの批判がある。他方、日本人が重層構造であることは人類学者・考古学者の間では支持する意見が強く、また、分子人類学的なDNA解析(ハプログループによる地域的分布の解析)もあくまで生物学的データであり、文化的な交流や、実際の移動の実態および移動の理由などについては、今後も文化人類学、歴史学、考古学など周辺諸科学の総合的な調査が求められる[7]。
尾本恵市の系統図では、日本人は朝鮮人、チベット人と同じ枝に位置づけられ、アイヌ人とは異なるとしており、ある種の二重構造論となっている。しかし、研究の結果、埴原の『二重構造説』、すなわち原日本人(縄文人)の南方起源説には賛成しかねると述べている[8]。
篠田謙一は、現代日本人のハプログループ頻度は韓国や中国東北部に非常に近く(北東アジア集団)、これは縄文人も弥生人も大陸から渡来し広がったことを裏付けており、従来の縄文人を南方系とする説は否定している[9]。
また、日本人(大和、アイヌ、沖縄人)は、遺伝学的には大差はなく、比較的均一性が高いとする説がある。根井正利は「現代人の起源」に関するシンポジウム(1993 京都)にて日本人(アイヌ・沖縄人を含む)は約3万年前から北東アジアから渡来し、弥生時代以降の渡来人は現代日本人の遺伝子プールにはほんのわずかな影響しか与えていない、という研究結果を出した[10][11]。しかし宝来聰は、ミトコンドリアDNAだけでも65%は渡来系由来であると反論しており、またY染色体の研究とも両立せず、縄文人は弥生人より歯が小さいことから後者は前者の子孫ではあり得ないとするアメリカのブレイスらの研究とも両立しないと主張している[10]。松本秀雄もGm遺伝子の観点から根井とほぼ同じ研究結果を出している[12]。またヒト白血球型抗原の遺伝子分析により、現代日本人は均一性が高い民族であるとの報告もある[13]。
1980年代からのミトコンドリアDNA研究の進展により、ヒトの母系の先祖を推定できるようになった(ミトコンドリア・イブ参照)。これにより、アフリカ単一起源説がほぼ証明され、また民族集団の系統も推定できるようになった。ただし、ミトコンドリアDNAは形態の生成に関与しない遺伝子であり、DNAタイプ(ハプロタイプ)と形質的特徴(骨格、体格、顔、皮膚など)とは必ずしも対応しないとされている[14]。
母系をたどるミトコンドリアDNAに対して、父系をたどるY染色体は長期間の追跡に適しており、1990年代後半から研究が急速に進展した[15][16][17]。ヒトのY染色体のDNA型はAからRの18系統があり、これらはアフリカ限定のA系統とB系統、出アフリカのC系統、DE系統、FR系統に分けられる[18]。崎谷満の分析によれば、これら5系統のうち、世界の多くの地域ではせいぜい2系統しか見られないが、日本人にはC,DE,FRの出アフリカ3系統すべてが見られ、従来の予想に反して日本人の遺伝子は多様であることが分かった。以下にY染色体のDNA型の比率を示す[18]。複数の研究成果をまとめたものなので[18]、合計が100%にならない。