现代人起源的问题牵涉到两种学说:“出非洲”说和多地区起源说。两种假说都认为直立人起源于非洲的东非直立人,然后大致在100万年前走出非洲,迁移到欧亚大陆。多地区起源学说则认为不同大陆上的古人类独立、连续地进化成了现代人,即由各地的非洲直立人、海德堡人、尼安德特人、东亚直立人各自独立进化到现代人类的几大人种。例如亚洲蒙古人种是由亚洲的爪哇猿人和北京猿人等直立人,经过大荔人和马坝人等早期智人阶段,直系演化发展成柳江人和山顶洞人等晚期智人,再发展到现代的亚洲蒙古人种。还有一些中间学说,比如多地区起源附带杂交,既承认现代人的多地区起源,又认为不同大陆上的古人类有过基因交流。多地区起源说的最强有力的证据来自不同地区保存的从古人类各个阶段直到现代人的完整的化石记录,包括北京猿人和爪哇猿人。古人类学家们依据人类化石和旧石器的考古文化,认为各地区的直立人到早期智人再到晚期智人在人类骨骼和形态上均表现出了连续进化的特征,因此他们的进化应该是连续的。但“出非洲”说认为现代人类起源于10万年前非洲的第二次迁移,走出非洲以后完全取代了其它地区的古人种。支持非洲起源说的证据主要来自分子人类学的研究成果。1987年,艾伦-威尔逊等人组成的来自美国加州大学伯克利的研究小组提取了来自亚洲、欧洲、非洲、新几内亚以及澳洲土著群体的共147名妇女的胎盘细胞中的线粒体DNA进行研究,并绘制了线粒体DNA的系统树,这个系统树的根部出现在非洲,时间约距今20万年。威尔逊诙谐地说:“我们可以将这位幸运女性称为夏娃,她的世系一直延续至今”,这就是著名的“线粒体夏娃”学说。许多后续研究也支持了“线粒体夏娃”学说,比如复旦大学金力实验室用严格父系遗传的Y染色体证据分析包括中国人在内的东亚人群起源问题。
两种学说争论的焦点就在于其他古人种能否与解剖学上的现代人杂交及他们对现代人的基因库是否有贡献。尼安德特人(尼人,Neanderthal)为解决上述问题提供了线索。尼人是已经灭绝了的古人种,他们2.5万年前生活在欧洲以及中亚和西亚的部分地区。化石证据显示尼人与早期现代人极可能共存了2万年。如此长时间的共存,尼人与现代人的栖居地在中东和欧洲甚至还有重叠,这就极大增加了尼人和现代人基因交流的可能性。解决这问题的一条途径是直接将尼人和现代人的DNA序列进行比对。已有的众多尼人的线粒体DNA数据无一例外均证明尼人对现代人的基因库没有贡献。但也可能尼人可与现代人杂交,只不过他们的线粒体基因经漂变而逐渐丢失了。2010年,德国马普所P??bo领导的研究组对尼人全基因组分析就得到了稍有不同的结果,非洲现代人中依旧没有发现任何尼人的遗传成分,但是在非洲之外的现代人群中,都发现有1%-4%的尼人基因组成分。而且,这些基因交流是在大约7万年前现代人刚刚走出非洲的时候发生的,其后就再也没有发生过,虽然现代人与尼人在欧洲共存了数万年。所以走出非洲以后分化形成的世界各地的人群中都保存了相同的尼人基因比例。
4万年前生活在北亚的丹尼索瓦人(丹人,Denisovan)的全基因组也被成功解析,在亚洲大陆上的现代人群中没有发现任何丹人的遗传成分。反而,在大洋洲的新几内亚土著人群中发现了大约6%的遗传比例。很有可能新几内亚土著的祖先在迁徙途经中南半岛时接触到了丹人群体,发生了基因交流。所以可以确定,丹人的地理分布很广泛,至少从北亚到东南亚都存在,而且人口不少,有机会把可观的遗传基因流传到新几内亚现代人中。东亚现代人为何没有与丹人发生基因交流?这是一个不容易解释的事实。研究者曾经期待早期的东亚现代人会有更多的尼人或者丹人遗传成分。但是,2013年新发布的北京周口店地区4万多年前的田园洞人基因组,却与现代的中国人几乎没有差别,没有更多尼人或丹人的遗传成分,其线粒体也是“出非洲”的支系之一。由此看来,现代人与尼人和丹人之间的基因交流可能发生过,但是非常有限,对现代人的贡献很少。古基因组学的这些研究成果并不能推翻由线粒体和Y染色体得出的现代人起源于非洲的证据,更加不支持多地区起源说中认为现代人源于各地区的古人类的说法。图1:直立人和智人是真人属后期的两大分支(参考自:李辉(2013)遗传学对人科谱系的重构.从基因中重新认识人类进化历程.现代人类学通讯7:1-11);图示2:现代人起源、迁徙以及与尼安德特和丹尼索瓦等古人类的混合(参考自:Veeramah,K.R,& Hammer,M.F(2014)Nature Reviews Genetics,15(3),149-162)
2、展示较为完整的人类迁徙史和中国人祖先迁徙史,包括所有的重要节点(迁徙时间、路线、迁徙原因)。这是一个很宏大的命题,人类的迁徙较之于人类起源更复杂、更难以推断,因为人类的迁徙具有层次性、反复性,也就是多次迁徙与人群回流,对于特定人群、特定迁徙路线和事件的解释有很多,当然争议更多,来自考古学、语言学、民族历史学、遗传学等多学科不同学说纷繁复杂,我这里仅讨论遗传学方面得出最新成果。人群的迁徙和分布与气候的变迁有着密切的关系,为便于从不同角度探索和认识人群演变规律,这里先介绍一些近10 万年来的气象学的材料。在距今约11万-1万之间,也就是考古学上的旧石器时代到中石器时代,地球处于末次冰 期,那段时间的海平面远低于现在,许多现在的岛屿与大陆相连,成为了人 类迁徙的重要通道。距今2.65万年到1.9-2万年是末次冰盛期,是末次冰期中气 候最寒冷、冰川规模最大的时期,亚洲的绝大部分、北欧和北美都被冰雪覆盖, 人类的生存空间也随冰川蔓延而逐渐缩小。大约1.5万年前,气温开始转暖,冰川也开始退却,现代人才迎来了迁徙的黄金时期。图示3:从常染色体角度看人类的迁徙和混合(参考自:Lazaridis I,et al. Nature,014,513(7518): 409-413)
首先,从常染色上来看, 世界人群可分为两大类:一类是非洲人群,另一类是走出非洲后的欧亚人群。欧亚人群又分为遗传差异很大的欧亚西部人群和欧亚东部人群。欧亚西部人群主要包括欧洲、中东等,欧亚东部人群主要包括东亚、东南亚、大洋洲等,而中亚、南亚和部分西伯利亚人群基本可以看作是东西两方混合的结果。在欧亚西部,又分为3类人群:西欧的采集狩猎人群、西伯利亚采集狩猎人群(比如贝加尔湖两万多年前的古人MA1)以及近东的农业人群。近东的农业人群与采集狩猎人群的区别在于:他们有着一种来自欧亚人群底层的古老遗传成分,这一成分和欧亚人群是兄弟支系。而1万5千多年前到达的美洲的美洲土著是由西伯利亚采集狩猎人群和东亚人群混合而成的,东亚成分占到60%-70%。在欧亚东部,主要分为两类人群:一类是东亚人群(主要是中国人、日韩、部分中南半岛人群),另一类是南亚和东南亚、大洋洲岛屿上的土著,比如安达曼人、巴布亚人、澳大利亚人等。现在学界争论的焦点是这些岛屿上的土著是按“南方路线”先于欧亚人群到来的吗?还是仅仅由于适应当地环境才形成了独特的体质特征(身体矮小、肤色棕深等)?
其次,从父系Y染色体的角度来看,全世界的男性都可以追溯到20多万年前的一个东非晚期智人男子。进而,全世界又可以分为20种主干类型,称为单倍群,编号从A到T。最古老的A和B单倍群都没有走出非洲,C和D单倍群最早来到了澳洲和亚洲,E单倍群来到了亚洲又回到非洲 (图a),F单倍群衍生出G、H、I、J等单倍群在西方形成欧罗巴人种,衍生出K单倍群并形成N、O、P、Q等单倍群在东方形成蒙古人种(图b),其中O单倍群成为了中国人的主流,而Q单倍群成为美洲土著印第安人的主流。在DE/CF和C/F分支之间只发现了很少的SNP位点,这表明DE、C和F很可能是在一千年内相继产生的。自单倍群F和C分开之后,在1.8万年的时间内我们都没有看到F支系里有大的分支事件,表明F支系经历了强烈的瓶颈效应。值得注意的是全部的初级单倍群,也就是G、J、N、O、Q和R都是在末次冰期前(约2万年前)分支出来的,并且大部分现在已知的欧亚大陆东部支系是在旧石器时代晚期(1万年前)产生的。进化树上7千年前的分支都是二叉的,这表明在旧石器时代缓慢的群体增长率、瓶颈效应或遗传漂变淘汰了大部分曾经存在过的支系 (图c)。
末次冰期之后,尤其是进入新石器时代有了农业之后,人群开始了大量增长,表现在Y染色体上就是出现了大量的下游分支节点。最惊人是在O-M324下发现了三个星状扩张,既是在M117下游、M134xM117复合单倍群的下游以及002611下游,我们将其依次命名为Oα、Oβ和Oγ (图d),这些父系支系在很短的时间内(500年内)成功扩张。这3个支系在现在的大部分东亚族群里的频率都很高,总共占到了现今全部汉族的40%,其中Oα占到16%、Oβ占11%、Oγ能占到14%,也就是说现在大约有3亿男性是新石器时代晚期三个男人的父系后裔。这三个支系的扩张时间分别是5400、6500和6800年前,而中国北方全面转入农业阶段的时间也正好是6800年前,也与黄河中游的6900-4900年前的仰韶文化、黄河上游6000-4900年的马家窑文化以及黄河下游7400-6200年前的北辛-6200-4600年前的大汶口文化等的时间相契合。由此,我们认为这三个在新石器时代晚期快速扩张的支系奠定了东亚的父系遗传基础。与狩猎、采集相比,农业提供了更稳定的食物供给,足以养活更多的人口,而且使男性远离危险的狩猎活动,所以狩猎相关的男性死亡率的降低。
末次冰期之后,也就是万年左右的时间尺度内,这些支系(图d)就能很好地和语系族群对应了,比如说O-M119在中国东南沿海、侗傣族群、台湾原住民中集中分布。O-M95在华南、南方少数民族、中南半岛及印度Munda人群中分布较多。O-M176则最主要集中于朝鲜半岛、朝鲜族和日本人中。O-M7在苗瑶和孟高棉人群中高频出现,但在汉族中却不足5%。在历史时期,也就是距今千百年的时间尺度里,Y染色体还可以追溯家族的源流。Y染色体类型(C-star cluster 星簇)可能是成吉思汗或者其近亲宗族的父系类型,出现在了从太平洋一直延伸到里海广阔地域,占到了全世界男性的0.5%。爱新觉罗家族的类型可能属于C-M401这一类型。
最后,从母系线粒体DNA(mtDNA)来看,mtDNA的支系分布也是很有地域特异性的,例如非洲大陆特异地单倍群L比欧亚人群中发现的类型都要古老,L单倍群被分成L0、L1、L2、L3、L4、L5和L6这几支, 产生于13-20多万年前。其中L3是欧亚人群中的mtDNA的祖先类型,非洲以外的所有mtDNA分为由L3单倍群在大约6-7万年前衍生而来的M和N两大超级单倍群,其中N包括了所有欧亚西部特异的谱系H、I、J、K、T、U、V、W和X,东亚特异的A、B、R9、N9以及大洋州特异的P单倍群也属于N分枝;M单倍群的下游分支有分布在东亚C、D、G、M7、M8、M9等以及在南亚和东南亚常见的M根部支系。美洲土著人群的分析则表明他们大多只属于A、B、C、D这4种单倍群,很少的个体属于X单倍群。
我们前面提到父系Y染色体在新石器时代有了农业之后开始了大规模的扩张,而母系mtDNA则是在末次冰期刚结束,也就是1万5千多年前就已经开始了人口膨胀,各类型的地理分布差异也就愈发明显。在东亚北方和南方的mtDNA单倍群分布非常不同,东亚北方主要由A、C、D4、D5、G、M8、M9、N9、Z支系组成,而南方为B4、B5a、F、M7、R9等单倍群组成。北方谱系中的C、D、G、M8、M9都是M单倍群的下游分枝,M单倍群只存在于东非、南亚、大洋州、东亚和中亚群体中,而在欧亚西部地区几乎完全缺乏。北亚主要的mtDNA单倍群是C、D、A、B4、G及N9等一些在东亚也高频出现的单倍群,另外混有一些末次盛冰期之后从欧亚西部流入的以H、J、U为主的支系。东亚来源的北亚单倍群有M下的C、D、G、M3、M7-M11、M13和Z单倍群,N支系下的A、N9a和Y,以及R支系下的B、F、R9、R11。单倍群C和D在东北亚非常多,在某些群体中所占比例超过50%,甚至能达80%以上。通过对单倍群C和D的样本进行全测序,发现C和D的祖先支系早在3-5万年之前就已经在东亚诞生,并且随即进入南西伯利亚,而大多数的北亚C和D支系都是在末次冰盛期之后才扩张。虽然北亚的主流单倍群是C和D,而单倍群A也在某些群体中高频分布,比如占到了楚克其人的73%。北亚的单倍群B的支系主要是B4和B5,这两个支系分布在偏南的朝鲜和蒙古地区。mtDNA单倍群A在藏族中占到了相当高的比例,平均能达到10%-14%,同时在门巴族(23.5%)和珞巴族(15%)中的频率更高。单倍群D所占比例比A还要高,能达到10%-20%,在珞巴中甚至高达30%。单倍群C在西藏群体中也能占到5%左右。青藏高原藏族中的单倍群A、C、D极可能是由1-2万年前从东亚北方向南进入高原的人群带入的。
而在南方,壮侗和南岛语系同时具有高频率的M7,南亚语系的F单倍型频率也比其它语系高出许多。壮侗群体中,频率最高的单倍群是B4a、F1a、M7b1、B5a、M7b*、M*、R9a、R9b,这些单倍群的频率总和占到了约一半。苗瑶族群与壮侗族群相似,单倍群B5a、B4a、M*、M7b*、C、B4b1、M7b1、F1a、B4*、R9b也能占到一半;而南亚群体中,频率较高的有F1a、M*、D*、F1b、N*、C、M7b*、M7b1、F1a1a,前三种占到50.8%,与壮侗和苗瑶略有不同。单倍群B、M7、F、R的总频率在台湾原住民中能占到70%,在壮侗中也达到了66.4%,比苗瑶的58.9%和南亚的48.9%更高,而越往北的类群这一数值就越小,例如占汉族40.8%,占藏缅族群的37.5%,而仅占到阿尔泰族群的16.3%。由此可见,B、M7、F、R这四类单倍群是可以代表中国南方的特征单倍群。图示4:mtDNA揭示的人类起源和迁徙时间和路线。
4万年前,在东南亚的密林里,N、O演变为黄种人。黄种人逐渐发展壮大了起来,在与棕色人种的对比中,渐渐占据了优势,并最终将自己居住区域(华南-东南亚)的棕色人种不分男女全部予以种族灭绝,而不是同化融合。也就是说,此时华南南部和东南亚随着黄种人的到来,Y染色体发生了C、D被O的替换。
2.5-3万年前,O-M175后来又突变为沿海支黄种人O1-M119、中间支黄种人O2-P31、内陆支黄种人O3-M122。
沿海支黄种人O1称澳泰族群,线粒体单倍群B4a、B4b、M7b是其母系特征。O1后来又突变为O1a-M101、O1b-M50/103/110。O1在北部湾一带孕育了很长时间。1.4万年前,O1向东迁徙,散布到了整个广东和台湾的海岸线上,台湾的原住民就是此时始形成遗传基础,后来发展成为百越。稍后,O1又有部分沿着越南海岸南下,后来发展成马来族群。1万年前,广东西部的百越和东部的百越发生了差异,西部群体后来演化成仡佬族(又向西北迁徙到了贵州,建立了夜郎诸国,同化了当地的许多南亚语百濮族群),而东部演化为侗傣族群。
中间支黄种人O2又称南亚(百濮)/澳斯特罗-亚细亚,形成于柬埔寨-泰国,并散布于整个中南半岛(除缅甸北部)、中国云南省东部、广西省和海南岛,今中国的佤-德昂-布朗、缅甸-泰国的孟族、柬埔寨的高棉族、越南的京族、马六甲族、尼科巴族、印度的蒙达族、斯里兰卡的维达人都是其后代。另外,百越民族中,泰国泰族的65%、中国壮族的35.95%也是O2的后代。O2后来又突变为O2a-M95、O2b-SRY465,O2a又突变为O2a1-M88/111、O2b又突变为O2b1-47z。
内陆支黄种人O3-M122,最初聚集在缅甸、中国云南省西部,O3后来又突变为O3a-M324、O3b-M164、O3c-M159/Line1、O3d-M7、O3e-M134。O3a又突变为O3a1-M121、O3d又突变为O3d1-M113、O3e又突变为O3e1-M117/133。O3e1进一步突变为O3e1a-M162。
当时,第四纪晚更新世冰期(距今7万年)不仅仅造成了海平面下降、大陆边缘延伸;另一个效应是一些不高的山都是积雪冰封,使得南岭等山脉成了黄种人向北进入长江流域的天然障碍。1万年前,冰期结束,使得黄种人大量北上,开创了一个全新的新石器时代,农业文明的星星之火在各地的黄种人中燃烧了起来,社会发展的火车头被拉动了。黄种人的北上分3条路线进行:
中间支黄种人南亚(百濮)民族的一支南蛮(苗瑶),北上经过贵州、到达四川,接着沿着长江往下走,到了长江中游(以江汉平原为中心,南包洞庭湖平原、西尽三峡川东、北达豫南豫中、东抵鄱阳湖的广大地区),这就是历史上所谓的三苗,Y染色体是O2a*,后来汉藏部落O3d混入南蛮,而南蛮的O2a1则脱离南蛮混入南部百越。 南蛮先后创造了石门皂市下层文化(为前5000)→大溪文化(前4400--前3300)→屈家岭(湖北京山县)文化(前3000—前2000)→湖北龙山文化(青龙泉三期,前2400, 与中原龙山文化有较大区别)四种新石器文化。中间支的南亚(百濮)民族的其他支,没有随苗瑶支北上,而是继续留居中南半岛故乡。
内陆支黄种人O3沿着四川的几条大河(金沙江-雅砻江-大渡河)北上(另一种途径折返向西经喜马拉雅山南麓达阿富汗,然后经新疆天山、昆仑山、祁连山东进) ,来到了黄河上游地区,形成了所谓汉藏(羌华)民族。
沿海支黄种人的百越民族最早的扩散方向是空旷无人的东北和正东,原因是广西、云南、中南半岛、海南居已住着百濮、湖南北部居住着苗瑶。8000多年前,广东东部百越开始萌发新石器文化和农业文明,并分3支迅速扩张开来:第一支向东北迁徒进人江西,形成干越;部分干越后来东迁进人浙江,形成了於越,在太湖平原和宁绍平原创造了灿烂的新石器文化。於越先后创造了浙江余姚河姆渡文化(前5000~前4000年)、太湖流域马家浜文化(分为马家浜和崧泽两期,为前4300~前3300年)、良渚文化(前3300~前2200年,与山东龙山文化有更密切的联系)、南京北阴阳营文化、安徽潜山薛家岗第三期文化(前3200~前3000年)。於越民族继而又从江苏进入山东,与当地的苗瑶、通古斯融合创造了先东夷文化。第二支渡海迁徙到台湾岛,形成了台湾平埔族的一部分。第三支在广东和福建内部扩张,闽越向北分出了东瓯,南越向西分出了西瓯。西瓯和雒越融合形成了壮族,唐朝时壮族一部继续西迁到西双版纳、南迁到老挝、泰国,征服并同化当地的百濮土著,形成傣族/泰族。今壮族的17.9%、泰国泰族的10%、越南京族的7%、柬埔寨高棉族的8%、土家族的20%拥有M119。公元前,在汉族的扩张压力下,百越民族纷纷离开东南沿海。特别是闽越在强制移民政策下,几乎完全离开了福建。部分闽越群体逃亡到了广东,并渐渐向西迁徙到贵州,演化成了水族。广东的南越群体也大规模地向西北迁徙,形成了今天的侗族类群体。
同属黄种人东部沿海支的南岛民族,沿着越南海岸南下,来到马来半岛,征服当地的南亚百濮土著,接着向南面广阔的大洋进发。公元前3000年之后,扩散到了印尼、菲律宾。公元后又进一步扩散到马达加斯加、密克罗尼西亚【马绍尔、吉尔伯特(基里巴斯)、关岛查莫罗、加罗林群岛(波纳佩-雅普-特鲁克)、帕拉乌、瑙鲁】、美拉尼西亚【斐济、莫图、雅比姆、所罗门群岛、瓦努阿图】、波利尼西亚[新西兰毛利、乌维亚、萨摩亚、汤加、图瓦卢(艾利斯)、钮埃、库克群岛拉罗通加、社会群岛塔西提、土阿莫图、马克萨斯、夏威夷]。波利尼西亚南部群岛的棕种C含量浓厚。
4、黄种人进入北方取代棕色人种。1万年前,沿海支、内陆支的黄种人分别北上,阿尔泰在与吐火罗人(Y染色体单倍群为P)第一次混血的基础上,又与当时北上的两支黄种人发生了第二次混血,形成黄棕混血的黄种人北亚人种。东部阿尔泰通古斯混有较多的沿海支成分O1,但也混有很多内陆支成分O3(可能是进入文明时代后加入的);中部阿尔泰蒙古混有较多的内陆支成分O3;西部阿尔泰突厥也开始混入了大量的内陆支成分O3。目前,蒙古族血统中,C3占55%,O3占20.5%,O1占4.2%,O2占1%,K占4%,N占5%,R1a、D、Q、J各占2%,RxR1占1%,F 占0.8%,R1b占0.5%。朝鲜族血统中,O2占39%,O3 占30%,O1占2%,O*占3%,K*占2%,J占1%,C占16%,D占5%,N占2%。满族血统中,C占20%、D占6%、N占5%、O占68%、P占1%。 维吾尔族有10%的阿拉伯血统J、3%的印度黄白血统L、39%的雅利安血统R、4%的蒙古血统C、4%的藏族矮黑血统D、2%的芬兰黄种人血统N、14%的汉朝唐朝戍守西域的汉族士兵血统O3。
C3突变为C3a-M93、C3b-P39、C3c-M48/77/86。C3-M217(P44)占布里亚特蒙古族的60%、蒙古族的55%、达斡尔族的31%、锡伯族的27%、哈萨克族的45%、乌孜别克族的17%、吉尔吉斯族的10%、维吾尔族的4%、阿尔泰族的23%、雅库特族的11%、土耳其族的1%、喀山鞑靼的1%、古西伯利亚科里亚克族的30%、宁夏回族的23%、藏族的2%、印度讲印欧语的3%、塞尔库普的3%。
C1-M8/105/131占鄂温克族的65%、鄂伦春族的61%、日本大和族的8.5%、阿伊努人的90%、朝鲜族的16%、满族的20%(含C3)、赫哲族的30%。C2-M38占澳大利亚土著的70%、伊里安查亚的25%、巴布亚新几内亚的3%、婆罗洲的17%。 C4-M210占印度(包括印欧和达罗毗图语系)的比例为5%。
D分布于印度安达曼群岛土著(100%)、苏门答腊岛土著、冲绳人(55%)、藏族(50%)、土家族、彝族、缅甸族、克钦/景颇族、瑶族、日本(34.7%)、朝鲜(5%)、满族人(6%)、维吾尔族(4%)、阿尔泰族(4%)、蒙古族(2%)、乌孜别克族(2%)、哈萨克族(1%)。 N所占比例中,布里亚特为27%、叶尼塞鄂温克族17%、中国鄂温克族0%、鄂伦春族的5%、赫哲族18%、朝鲜族2%、满族5%、达斡尔族9%、锡伯族21%、蒙古族5%、阿尔泰族4%、哈萨克族7%、吉尔吉斯族3%、喀山鞑靼21%、乌孜别克族2%、维吾尔族2%、日本2%、藏族5%。
O1-M119所占比例中,布里亚特蒙古人5%、锡伯族7%、达斡尔族4%、蒙古族4.2%、满族5.6%、乌尔奇Ulchi(赫哲亲/属)3.8%、雅库特4%、宁夏回族的8%、古西伯利亚尼夫赫6%、堪察加人的6%、科里亚克人7%、朝鲜族的2%、日本人3.4%、叶尼塞鄂温克3.2%、中国鄂温克族5%。
O2-M95主要分布在泰国-缅甸的孟族、柬埔寨高棉族、越南京族等南亚(百濮)语系和中国的苗瑶语族;而且,百越民族如泰国泰族的65%、中国壮族的35.95%也是O2;另外,东北亚O2含量也很高,如日本的O2比例高达31.7%,朝鲜族O2比例亦高达39%,满族的O2 比例为26.4%,赫哲族为5%、达斡尔族为21%、鄂伦春族5%、叶尼塞鄂温克0%、中国鄂温克族2%、锡伯族1%、宁夏回族的2%、蒙古族1%。
O3所占比例中,蒙古族20.5%、锡伯族30%(含O*)、达斡尔族27%(含O*)、满族36%、赫哲族46%(含O*)、鄂伦春族22%(含O*)、朝鲜族30%、日本人20.1%、维吾尔族14%、哈萨克族8%、吉尔吉斯族24%、宁夏回族17%(含O*),中国鄂温克族28%(含O*)、叶尼塞鄂温克族和布里亚特蒙古人为0。
阿尔泰人在黄土高原(突厥)的故土被内陆支的黄种人(汉藏民族)霸占,生活在那里的阿尔泰人不是被屠戮就是向北面的家园逃窜,所以今天黄土高原的居民很少有阿尔泰特有单倍群C的发现;阿尔泰人在华北(通古斯)的故土遭到了沿海支黄种人的大规模入侵,不过,沿海支黄种人相对比较温和,与通古斯和平共处而不是屠戮,二者逐渐融合为新的民族---东夷,东夷的C成分相对浓厚。
新石器时代,阿尔泰人在阴山以北创造了以细石器/刮削器在生产工具中占优势的狩猎文化,与阴山以南以农耕文化为主的仰韶文化有明显不同。商族的母系祖先东夷从燕山地区南下到古河济之间的进程中,一部分阿尔泰人(蒙古群)也随之从大兴安岭山原南下来到商族祖居的赤峰市、朝阳市、承德市、北京市,创造了拉苏克游牧文化之一的夏家店上层文化。
后来的匈奴、坚昆、丁零、金山突厥等突厥部落,都是黄种人居于统治地位的棕色白色混血人种。随着突厥人的西迁中亚,他们与当地的晚于吐火罗人到来的印欧语系的雅利安人也发生融合。 公元400年突厥族群的匈奴西迁,演化为保加尔人。公元600年蒙古族群的柔然人厌达人西迁,一部分被斯拉夫人同化;一部分被保加尔人同化。保加尔人的一支演化为目前的楚瓦什人;保加尔人的另一支被斯拉夫人同化为保加利亚人。中亚北部的突厥族群可萨人、佩切涅格人、乌古思人、钦察人逐渐演化成目前巴什基尔人、库梅克人、诺盖人;后来一部分与西迁的蒙古人融合为鞑靼人。
黄种人乌拉尔支N-LLY22g,后来又突变为N1-M128、N2-P43、N3-Tat,而N3-Tat后来又突变为N3a-M178(M231)。N-LLY22g跟随内陆支黄种人来到黄河上游,并进入突厥地盘,与O3一起征服了突厥,成了那里的主宰,原始突厥语、汉藏语、乌拉尔语混杂在一起,形成了一种新的语言-乌拉尔语。前3000年,N途经阿尔泰山,最终西迁至乌拉尔山,形成乌拉尔族群。 乌拉尔族群与当地的占人口多数的斯拉夫-日尔曼人(R)、波罗的海人(I)融合,形成芬兰-乌戈尔人,再后来分成三支向外扩散:向北的一支沿着伏尔加河上游进入北欧,演变为芬兰人、芬兰以北的拉普人(N占45%,I占30%,R1a占20%,R1b占5%)、爱沙尼亚人、莫尔多维亚(莫尔多瓦)人、乌德穆尔特人、马里人、卡累利阿人、科米人(黄种人);向西的一支演变为马扎尔人;向东一支,沿卡马河、越过乌拉尔山,进入西伯利亚,演变为汉蒂(奥斯恰克)人、曼西(沃古尔)人等。剩下的乌拉尔族群被称为萨莫耶德人,包括涅涅茨人(分布在北西伯利亚和乌拉尔山脉两侧,N占80%,R1a占10%,I占6%,R1b占4%)、塞尔库普人(N占7%,R1a占18%,R1b占6%,C占3%,Q占66%)、牙纳桑人,他们生活在俄罗斯极北地区,是相对纯粹的黄种人。
黄种人沿海支和内陆支大规模来到北方以后,分别对当地的阿尔泰-棕种男人进行了杀戮和驱逐,但保留了阿尔泰-棕种女性(Gm血型是ag+axg+ab3st)以婚配,所以在一定程度上可以说,北迁的黄种人的后代与阿尔泰-棕种的后代是同母异父。 当历史进入了阶级社会,情况就发生了变化,奴隶的需求使得黄种人对遭遇到的棕种男人不再灭杀。那段时期黄种人才到达的边缘地区,比如青藏高原、蒙古高原、日本列岛,棕色人种的成分被大量地保留了下来。
日本列岛在棕色人种绳文人到来时还可以通过大陆架很容易地到达,而当黄色人种来到东北亚时,已成为茫茫大洋相隔的海岛,是黄种人传说中的蓬莱仙岛。现在北海道的虾夷人(阿伊努人)和种子岛的部分居民就是绳文人的后代。日本的黄种人--弥生人,是春秋战国之后从中国大陆迁入的东夷人(O2+O1)、汉族人(O3)、通古斯人(C1),弥生人在九州岛登陆,然后向本州岛及更东北方向扩张的过程中,对旧石器的绳文人进行了征服和奴役,造成了日本绳文人比例的下降。但是到1800年,本州岛的北部和库页岛,都还是虾夷人的领地。从日本各地的遗传结构看,棕色人种的遗传比例虽然是从西往东递减,但各地的该种成分都不在少数。所以日本人总体上应该算是两个人种的混血。日本大和民族的Y染色体类型中,O-M175占54.2%(其中O2-M95占31.7%,O3-M122占20.1%,O1-M119占3.4%);D占34.7%;C1-M8占8.5%;N占1.6%。阿伊努人的Y染色体类型中,C1-M8占90%,D占10%。
文波:Y染色体、mtDNA多态性与东亚人群的遗传结构。
摘要:关于现代人起源的“走出非洲”假说已经得到了遗传学和人类学证据的广泛支持,但是走出非洲以后的迁徙,特别是进入东亚地区的路线还存在很多争议。先前的研究提出了两条主要的迁徙路线,一条由中东进入中亚和东亚北部(北线),另一条沿着亚洲大陆海岸线进入南亚和东亚南部(南线)。为了探讨这两条迁徙路线对东亚人群基因库的相对贡献,本论文分析了120个东亚群体5131例个体的Y染色体DNA多态性,以及101个东亚群体4238例个体的线粒体DNA多态性。通过考察Y染色体、mtDNA单倍群(Haplogroup)在东亚及周边地区的分布结合基因多样性的比较,提示Y染色体的O-M175、C-M130、D-YAP单倍群以及mtDNA的单倍群B、R9、M为南线成分,两者分别构成了80%和85%的东亚人群父系、母系基因库;而来自北线的谱系仅仅包含了9%和1.2%的东亚人群Y染色体和mtDNA。这一结果充分表明来自南线的成分是构成东亚人群基因库的绝对主体。通过比较Y染色体、mtDNA单倍群在东亚人群中的分布,以及主成分分析和分子方差分析(AMOVA),支持南北分群之间存在相当明显的遗传差异,空间自相关分析的结果进一步揭示南北人群之间的渐变(Cline)格局。综合遗传学和其它相关学科的证据,提出由南向北的迁徙以及后来的地理限制性扩张是导致南北差异最主要的原因,而早期北线成分在东亚分布的地区性差别加剧了南北差异。自然选择也可能是造成这一差异的原因之一,但尚需进一步的研究。根据分子钟估计,南北分化的时间在2万年之内,而1.8-1万年之间可能是形成南北差异的关键时期。近几千年来北线成分的再次迁入加大了南北差异,而汉藏语系向南的扩张又在一定程度上缓解了南北人群之间的遗传差异。 Y染色体、mtDNA变异与语言学的相关性研究显示东亚人群的Y染色体与语言有很明显的协同关系,而mtDNA与语言学分类没有明显的关联。因此从遗传学的角度看,“父语”是对东亚地区基因进化与语言进化相对关系更恰当的表述。通过mtDNA和Y染色体的比较,发现东亚地区Y染色体之间的分化程度远大于mtDNA之间的分化程度,支持女性的迁徙率大于男性。此外,本论文还观察到近2年多年来从北方迁入南方的藏缅语人群和汉族人群与典型南方人群发生了大范围的基因交流,并且在交融过程中存在明显的性别偏向性,北方人群的Y染色体和南方人群的mtDNA分别构成了其父系和母系基因库的主体。男女性迁徙率的差别可能是导致性别偏向性融合的主要原因。