摘要
罗姆人是欧洲最大的少数民族。他们起源于约1.5年前的西北印度,在西亚各地旅行,直到公元11世纪左右抵达欧洲。他们散居欧洲的特点是人口瓶颈和创始人事件,这促成了他们今天的基因和文化多样性。在我们的研究中,我们通过生成和分析144个新的伊比利亚罗姆人的完整mtDNA序列,重点研究了伊比利亚罗姆人线粒体DNA (mtDNA)库中的创始人效应。他们60%以上的mtDNA是由南亚血统的创始人血统组成的,或者是在中东或欧洲当地散居期间通过基因流获得的。这些血统的TMRCA早于罗马人抵达西班牙的历史记录。创始人血统的丰富性与非吉普赛人伊比利亚人口中约0.7%的本土创始人血统形成鲜明对比。在这些始祖谱系中,我们发现了大量南亚M5a1b1a1单倍型和欧亚西部始祖谱系(U3b1c、J2b1c、J1c1b、J1b3a、H88等)的高频率,我们对这些始祖谱系进行了系统发育特征和系统地理学背景分析。此外,我们在伊比利亚半岛没有发现罗姆人遗传子结构的证据。这些结果显示了伊比利亚吉普赛人创始人效应的程度,并从母系的角度进一步解释了吉普赛人的历史和遗传多样性。
简介
罗姆人,也被称为“吉普赛人”,是欧洲最大的少数民族,人口估计在1000万到1200万之间1.罗姆人一词包含了不同群体的马赛克strictu在基因上、文化上、语言上和历史上都有差异的人,如辛提人、羽衣甘蓝人、罗曼尼切尔人等。然而,遗传和语言研究已经把所有罗姆人的起源都放在印度次大陆的西北部2,3.,4.总的来说,吉普赛人的流散在历史上并没有很好的记录。然而,历史证据似乎表明,他们在公元9世纪左右穿过波斯到达亚美尼亚。强烈的语言影响表明,他们在亚美尼亚的逗留时间可能特别长5.历史记录显示,塞尔柱人对亚美尼亚的入侵造成了众所周知的亚美尼亚人的流离失所,也可能迫使罗姆人的祖先沿着安纳托利亚路线前往君士坦丁堡和巴尔干半岛,11世纪中期就有罗姆人的存在记录6,7.在欧洲,罗姆人在巴尔干半岛南部定居了大约200年,并在奥斯曼帝国统治下一直居住在该地区。然而,后者向中欧的扩张引发了罗姆游牧民族在欧洲不同领土的扩张6.除了吉普赛人的游牧传统外,在许多地区遭受的迫害和社会排斥也在吉普赛人的分散和形成欧洲不同的罗姆人民族语言群体中发挥了关键作用。一些罗姆人迁移到多瑙河公国(今天的罗马尼亚、摩尔达维亚和匈牙利),在那里他们被迫成为奴隶,成为弗拉克斯罗姆人,而其他一些群体,如罗曼格罗罗姆人,则迁移到奥匈帝国。最后,许多其他小团体选择了北部或西部路线,遍布北欧、中欧和西欧7,8.最后,罗马人在15世纪到达伊比利亚半岛,根据历史记载,1425年罗马人出现在萨拉戈萨9.1469年,在伊比利亚半岛,卡斯蒂利亚和阿拉贡王国统一,并开始在其境内寻求文化同质性10.伊比利亚的罗姆人,连同穆斯林和犹太社区,与期望的文化和宗教(天主教)同质性发生冲突10,11.因此,颁布了一系列法律,迫使穆斯林和犹太人皈依或被驱逐,并迫使游牧的罗姆人定居11,12.
对目前罗姆人及其历史的复杂性的理解来自不同的学科。分子人类学研究首先提出了罗姆人的南亚遗传成分,因为他们与印度和巴基斯坦患者存在共同的遗传疾病13,14.后来,由于全基因组数据,他们的起源被确定在1500年前的旁遮普邦3.,4.在最符合基因组证据的人口模型中,原始罗姆人的人口规模较小,在基因上最接近今天的旁遮普人,他们的西欧亚血统最少4,15,16.罗姆人的印度血统也反映在他们的单亲遗传基因组库中,因为他们拥有南亚线粒体DNA (mtDNA) M (M5, M35, M18和M25)和y染色体H1a1a4b2血统3.,17,18.
在离开印度事件之后,罗姆人的基因组中暗示了非常强烈的创始人效应,他们广泛地与非罗姆人混合,并在他们的移民过程中经历了多次瓶颈,导致了今天罗姆人的形成4,15,16,19.在全基因组遗传研究中,观察到中东成分的中等影响和高加索人群的略高遗传影响15,20.,21.这与历史和语言研究提出的罗姆人通过波斯迅速分散以及高加索地区的影响相一致。此外,在所有罗姆人群体中也观察到巴尔干遗传足迹15,19.这种成分形成了一个梯度,与与巴尔干半岛的距离相关,保加利亚、希腊和塞尔维亚罗姆人的巴尔干血统比例最高(45%),而立陶宛、爱沙尼亚或伊比利亚罗姆人的巴尔干血统比例约为25%19.这也与历史记录相吻合,这些记录都表明罗姆人从巴尔干半岛分散到欧洲。除了巴尔干组成部分外,罗姆人种群还表现出与各自宿主种群的不同混合模式,加上人口瓶颈(和创始人事件)和/或社会内婚制实践,弥补了观察到的欧洲罗姆人的遗传异质性19.罗姆人的人口历史也塑造了他们的功能基因组变异,因为创始人效应增加了高频有害变异22.
伊比利亚吉普赛人是巴尔干/东欧以外最大的吉普赛人,代表着欧洲最西端的吉普赛人扩张1.然而,针对伊比利亚罗姆人的研究仍然很少。最近对不同罗姆人进行的全基因组研究表明,伊比利亚半岛内的地理遗传子结构具有不同程度的祖先比例和近亲繁殖,被理解为通过祖先密切相关的个体交配19.关于单亲标记的研究,多个创始人事件也在罗姆母系血统频率上留下了印记。Martinez-Cruz等人2016年通过测序线粒体控制区确定了主要的罗姆人特异性mtDNA创始人谱系。后来,整个有丝分裂基因组被用于增加伊比利亚罗马人(如M5a1b1a1, U3b1c或H88a)中一些世系的系统发育细节。23.
单亲标记为人类迁移和混合的性别特定模式提供了独特的图景。然而,伊比利亚罗姆人mtDNA库尚未得到充分检查。虽然伊比利亚罗马人的创始人血统的存在是众所周知的重要24在美国,许多特征仍然未知,特别是这些血统是何时何地被罗马人获得的。这些问题在以前的研究中进行了调查,但受到样本量小和mtDNA控制区提供的次优分辨率的限制23,24,25.此外,创始人血统是否仅限于经历瓶颈的种群,或者相反,它们是否也出现在一般的欧洲种群中,仍有待探索。
因此,在本研究中,我们分析了伊比利亚吉普赛人的mtDNA库,重点是在原始吉普赛人群体中存在的吉普赛人创始人血统,或者在整个历史中通过混合获得,然后随着漂移而激增。我们还探索了伊比利亚半岛内罗姆人的线粒体遗传子结构,以及人口统计过程可能对罗姆人线粒体创始人谱系产生的功能影响。
方法
样本和测序
我们对144名伊比利亚罗姆人志愿者的唾液样本进行了完整的丝裂基因组测序。志愿者唾液样本的收集工作是在“El Camí del Poble Gitano: una història de diveritat”项目26与罗马FAGiC协会(Federació d 'Associacions Gitanes de Catalunya).所有参与者自认为伊比利亚罗姆人,并获得了所有捐赠者的适当书面同意(补充信息)。本研究已获得我们当地IRB的批准(Comitè d’Ètica de la Investigació, Parc de Salut Mar,参考文献2016/6723/I, 2016年6月7日;和2019/8900/I, 2020年1月15日),初步结果于2019年2月1日在巴塞罗那由FAGiC组织的会议上向罗姆人社区展示。本研究所有方法均按照标准指南和规定进行。
在相同的条件下,对4个不同的片段进行PCR扩增S1而且S2).Nextera XT文库按照Illumina mtDNA基因组指南制备和测序27以及Illumina MiSeq指南28.
序列处理
按照GATK最佳实践步骤处理序列29.首先,FastQC进行了初始质量评估30.然后是BWA 0.7.1531用于将原始读数映射到修订后的剑桥参考序列(rCRS)32.用Picard工具去除PCR重复序列33,基础质量评分重新校准,并通过Qualimap获得最终质量报告34.最后,使用GATK单倍型调用器调用单倍型35.
统计分析
单倍群用haplogrep v.2进行测定36使用phylotree v.17加上Dür等人定义的额外单倍群。37.用pegas计算分子多样性和汇总统计指标38包在R和poppr39用于计算AMOVA和F圣按地理区域划分的距离。结合年龄通过计算⍴和σ得到40,假设突变率为2.355 × 10−8每年每个核苷酸的替换量,考虑到净化选择41.
Phylogeographical分析
我们将伊比利亚罗马人的创始人血统定义为同一单倍群的四个以上线粒体序列的群体(如phylotree.org build 17所定义)42),具有一个或多个突变(不包括Soares et al. 2009中列出的高变量位置),并且仅局限于罗姆人。为了验证这些创始人血统是否是伊比利亚罗马人独有的,Blast使用Genbank搜索具有最高身份百分比的序列。
为了比较伊比利亚罗马人中这些始祖血统的相关性,我们在超过1000个非罗马西班牙语序列的数据集中重复了分析43,44.首先,分析整个非罗马西班牙语参考数据集,寻找达到相对频率为0.0278的单倍群,这是对应于为罗马人设置的阈值的值(4/144,其中144是罗马人样本量)。然后,我们将非罗姆人样本细分为地理组,其大小接近罗姆人样本(表S3),检查其相对频率阈值相同但n > 2的始祖谱系,并在Genbank中运行BLAST,检索最相似的序列。将所有下载的序列添加到西班牙语序列中,我们使用Network 10软件构建了中位连接系统进化树,并手动构建了树状表示。
致病性测定
我们使用MutPred软件预测的致病性评分,用于表中可用的mtDNA编码区域中所有可能的氨基酸变化S3在Pereira等。45.然后,我们使用Mann-Whitney U检验比较了创始人血统和非创始人血统之间的致病性评分的分布。
结果
伊比利亚罗马人线粒体的整体多样性
我们对来自伊比利亚罗姆人的144个个体的丝裂基因组进行了测序,平均每个个体的覆盖率为624X(图2)。S1).伊比利亚吉普赛人表现出72种不同的线粒体单倍型,与任何地理区域的非吉普赛人西班牙人口相比,其多样性值较低S4).
样本显示20个(13.9%)南亚单倍型,主要以M5a1b单倍群序列为代表;124个(86.1%)欧亚西部单倍型。此外,我们的样本显示了51%的西欧亚创始人血统,这些血统之前通过线粒体控制区(U3, H7, J1b3或J1c1)分析或整个有丝分裂基因组分析(H88a, U3b1c)描述过。23,24.除了这些先前观察到的罗姆人创始人谱系之外,我们还能够在单倍群H3g1和J2b1c中检测到一些新的创始人谱系的存在。1).总体而言,在我们的伊比利亚罗马人样本中,13.9%的个体携带了两个南亚血统的创始人血统,而七个西欧亚血统的创始人血统的人口频率达到了51.4%。
罗马创始人血统
考虑到它们最近的邻居,伊比利亚罗马人中的M5a1b序列(13.2%)(图。2)明显源自南亚;所有罗姆人样本都含有定义M5a1b1a1的突变。然而,在M5a1b1a1中,罗姆人样本之间观察到一些差异,证明了先前未观察到的原始罗姆人母体基因库中的多样性水平。此外,我们观察到5个旁遮普人和1个巴基斯坦人与所有罗姆人样本聚类在M5a1b1a1分支内。这进一步证明了这个血统和原始罗姆人起源于印度西北部和巴基斯坦附近的某个地方。到最近共同祖先(TMRCA)的时间为1.8 kya (σ = 0.53 kya)。至于在以前的研究中发现的剩余M南亚血统23我们的样本中没有M35,我们只发现了一个M18单倍型。
伊比利亚罗马人最常见的西欧亚血统是U3b1。在之前的研究中23,罗马人U3b1的系统发育被进一步细化为五个伊比利亚罗马人,他们属于同一个U3b1子分支(后来被命名为U3b1c),并共享变体A2833G-T7759C-T8895C-C11119T-T12783C-T15262C。在我们的研究中(图。3.), 47个序列(32.6%)属于U3b1单倍群。然而,并不是所有的U3b1c都具有定义变异,其中一些缺乏T7759C。一个伊比利亚非罗马人个体的存在,有4 / 6的U3b1c定义突变,这表明在这个分支中可能有更多的未采样的多样性,U3b1c的定义应该仔细修订。除了这个样本,我们还观察到另一个伊比利亚人属于所有U3b1c罗姆人样本,这可能是罗姆人对伊比利亚总人口贡献的一个信号。U3b1c在其他欧洲罗姆人身上的存在,以及在约旦采样的共享A2833G突变的最接近的血统表明,这一血统可能是中东罗姆人在移民期间获得的,比预期的要早(TMRCA = 2.1 kya σ = 0.78 kya)。
每一个其余的创始人血统在线粒体池中都有较小的存在,但它们加在一起占总血统的18.7%。在先前从控制区域序列描述的创始人血统中24,我们能够细化H7a1, J1b3和J1c1的系统发育。H7a1单倍群(图;S2)定义为C16261T,其分布局限于中欧-北欧。我们的H7a1伊比利亚罗马人样本中的四个不属于H7a1内嵌套的每个亚单倍群,并形成由14905A突变定义的独立分支。此外,其中一个含有16148 T突变。
单倍群J1b3(图;4)分为J1b3a和J1b3b两个亚单倍群。罗姆人的样本都属于J1b3a分支,并显示出四种不同的单倍型。三名乌克兰罗姆人和一名斯洛伐克人共有6137C突变。伊比利亚吉普赛人表现出两个不同的单倍型,一个在J1b3a根(还有一个葡萄牙和一个美国样本),另一个通过4197T突变与之分离。此外,亚美尼亚人和亚述人也存在J1b3a单倍群的一些分支。
J1c1b(无花果。S3)也拥有罗马人特有的创始人血统。我们的四个伊比利亚吉普赛人样本,以及一个马其顿吉普赛人和一个匈牙利吉普赛人组成了508G-9554A-14470C定义的分支。所有四个伊比利亚罗姆人和马其顿罗姆人都显示出相同的单倍型,而匈牙利罗姆人额外携带10463C。这些层序的合并年龄为0.4 kya (σ = 0.4 kya)。
在之前的研究中描述了H88a23,在我们罗姆人群中的6个个体中也发现了这种基因,其合并年龄为0.9 kya (σ = 0.5 kya)。S4).
除了这些先前在罗姆语中描述过的单倍群,我们还发现了其他的创始人谱系,如H3g1(图3)。S5),该基因存在于5个伊比利亚罗姆人身上,定义为7419A-11563 t,其中4个序列也包含3666A突变,而另一个个体携带16153A突变。这些层序的合并年龄为2.5 kya (σ = 2.1 kya)。
最后,在我们的样本中有5个序列属于单倍群J2b1c* (sensu stricto Dür et al. 2021)(图。5).与希腊和北马其顿罗姆人样本一起,他们形成了一个单独的集群,由突变508G-10646A-15184C定义。该分支的凝聚年龄为1.2 kya (σ = 0.9 kya)。
为了确定我们在伊比利亚罗马人中发现的创始人血统的数量和总体频率是否可能是来自他们的人口统计学历史的特征,还是与在其他人群中发现的相似,我们在西班牙普通人群的数据集中寻找创始人血统(见“方法”,无花果。S6−向).我们观察到,1066个西班牙非罗马人序列中有8个(0.7%)可以被分配到西班牙特定的创始人血统,而对于伊比利亚罗马人数据集,144个序列中有94个(65.3%)属于罗马人创始人血统(图3)。6).在西班牙非罗姆人数据集中,我们发现了一些属于巴斯克特征血统H1j1的个体(1.4%)46这些都没有考虑到因为已知的特定人口历史47(无花果。S7).在伊比利亚人(而不是巴斯克人)中,我们发现了两种可能的始祖谱系:一种是由来自加泰罗尼亚的3个K1a4序列组成,另一种是由来自安达卢西亚和加泰罗尼亚的5个T2个体组成。S11而且向).
伊比利亚罗马人的遗传子结构
对伊比利亚半岛内伊比利亚罗姆人的遗传结构进行了分析,根据地理起源对样本进行了分离(图。S14系列).计算每个区域的遗传多样性指数(表2)S3).区域群体的一般单倍群组成(即南亚创始人谱系、欧洲创始人谱系和欧洲非创始人谱系的分类)没有显著的异质性(p = 0.255, Pearson的卡方检验)(图2)。S15).
此外,利用AMOVA分析了层序组成的区域亚结构。伊比利亚吉普赛人亚群体的变异比例为- 0.41%,而伊比利亚非吉普赛人的变异比例为0.04%,两者都与零没有显著差异,这表明伊比利亚吉普赛人和一般人群在地理区域之间具有同质性。
根据AMOVA测量,由吉普赛人与非吉普赛人伊比利亚人群之间的差异解释的遗传多样性数量为10.7% (p = 0.0001)。这是一个很大的价值,可以用罗马人的创始人血统的主导地位来解释。事实上,如果除去所有创始人血统,方差分数下降到0.3% (p = 0.2)。这意味着,除了创始人血统之外,罗姆人的mtDNA序列与非罗姆人单倍型难以区分,并且可能主要是最近与非罗姆伊比利亚人混合的结果。
线粒体有害突变负荷
对伊比利亚罗马人的有害突变负荷进行了分析,研究了编码区非同义突变的MutPred评分。我们比较了罗马创始人血统和罗马非创始人血统氨基酸变化的预测致病性。结果表明,与预期相反,罗姆非创始人血统相比罗姆创始人血统显示出更高的平均致病性(图2)。S16).尽管由于移民期间的遗传漂变,可能存在更高的有害突变,但mtDNA证据表明,欧洲血统比罗姆创始人血统具有更高的预测致病性(p = 4.956 × 10)5, Mann-Whitney u检验),无论是与南亚(p = 0.02)或欧洲(p = 10)相比4)谱系(图;肌力).
讨论
利用单亲本和全基因组数据对罗姆人的遗传多样性和种群历史进行了评估3.,23,24,48,49.然而,线粒体DNA研究主要集中在对照区序列,并且,在使用整个有丝分裂基因组的研究中(特别是那些专注于西北罗姆人的研究),样本量一直是一个限制23.在本研究中,我们通过对144个来自生活在西班牙的罗姆人的新样本进行测序,克服了这一限制。
我们的结果显示,与伊比利亚总人口相比,罗姆人的线粒体多样性水平较低,这与之前的研究一致,反映了罗姆人所经历的人口瓶颈24.然而,更深入地观察mtDNA库,我们观察到,除了在罗姆人身上发现的南亚M血统(13.9%),剩余的mtDNA单倍型是罗姆人与西方欧亚人口在印度移民之外的强烈混合的证据。
关于南亚罗姆人血统,经历了印度事件的原始罗姆人的人口规模减少反映在观察到的低多样性水平上。这在线粒体库中很明显,欧洲罗姆人表现出一些不同的M亚单倍群(如M5、M35或M18),在Y染色体多样性中更明显,只有H1a1a4b2和R1a-M780血统来自印度17,50.我们的大多数样本都属于M5a1b1a1单倍群,与来自印度和巴基斯坦西北部旁遮普省地区的六个南亚样本共享。这表明,这一世系和原始罗姆人的地理起源可能在印度次大陆的西北部附近(假设该地区目前的单倍型分布反映了原始罗姆人离开之前的分布),这与先前的研究一致4,15.这个世系起源的分子年代测定(~ 1800 ybp)早于原始罗马人离开印度的事件,据估计约为1500 ybp15.
伊比利亚罗马人最丰富的血统是U3b1c,立陶宛罗马人也有,考虑到在对照地区观察到的U3血统,在较小程度上也可能存在于保加利亚和希腊罗马人24.与先前发表的研究相反,伊比利亚罗姆人在这个单倍群中表现出更高的多样性水平。一个伊比利亚非罗马人个体的存在,有四分之六的U3b1c定义突变,这表明在这个分支中可能有更多的未采样的多样性,并且U3b1c的定义应该仔细修订。这一谱系的起源很难从系统地理上追溯,因为与U3b1c谱系相关的少数样本具有不特定的地理分布(图2)。3.).尽管如此,与U3b1c最接近的单倍型在约旦取样,与U3b1c有一个相同的突变。再加上在罗姆人中分布相对广泛,估计TMRCA为2.1 kya,这比罗姆人的人口历史还要早,可能是由于所采用的血统的分歧,U3b1c最有可能的起源是在中东。如果情况确实如此,伊比利亚罗马人mtDNA库中超过30%的人将由中东血统组成。这与使用常染色体数据的研究中观察到的中东/高加索人的适度影响形成对比,后者在罗马X染色体中特别低19.对mtDNA的进一步研究可以揭示U3b1c单倍群的起源,该单倍群可能是通过漂移事件在伊比利亚罗姆人中达到高频率的。
此外,J1b3a也可能起源于中东,因为它也在亚美尼亚人和亚述人身上被发现(图1)。4).这种血统,我们第一次在西罗马人身上发现,在保加利亚和匈牙利的罗姆人身上比较常见,在乌克兰的罗姆人身上相当普遍24.
此外,除了五个伊比利亚罗姆人和一个马其顿罗姆人样本,我们发现J2b1c*血统只存在于来自巴尔干半岛的非罗姆人身上(图2)。5).这可能表明该血统是罗姆人在巴尔干地区逗留期间获得的,这与所有欧洲罗姆人身上发现的巴尔干血统一致19.
伊比利亚罗马人的其余创始人血统,占样本的13.9%,有明确的欧洲血统,尽管在欧洲大陆的确切起源无法确定。尽管如此,考虑到与其他罗姆人群体共享单倍群的模式以及估计的血统年龄,他们中的大多数很可能是在罗姆人到达欧洲后不久获得的,而不是在伊比利亚半岛本身。
值得注意的是,在我们的样本中,我们没有发现任何北非本土单倍型,如M1或U6。这与先前的研究结果一致,即罗姆人通过北非进入伊比利亚半岛的可能性很小3.,4.
在量化了伊比利亚罗马人和一般西班牙人之间创始人血统频率的差异后,结果表明,线粒体创始人血统的存在可能不是一般欧洲人群的共同特征,而是经历了某些人口统计过程的人群的特征。欧洲吉普赛人流散的人口瓶颈造成的创始人效应是吉普赛人线粒体库中创始人血统高频率的主要原因。此外,由社会文化因素(社会排斥、内婚制婚姻)引起的罗姆人遗传连续性的维持,可能也在伊比利亚罗姆人线粒体库中观察到的模式中发挥了作用,以及在一般西班牙人群中观察到的罗姆人创始人血统的微不足道的存在。
对伊比利亚主要地理区域内的遗传子结构的评估表明,从母系的角度来看,伊比利亚罗姆人在遗传上是同质的。在南亚始祖血统、欧洲始祖血统和欧洲非始祖血统的比例上,我们没有发现区域差异;AMOVA也没有检测到不同地区之间有任何显著差异。罗姆人传统的流动生活方式在一定程度上也是由于他们在历史上遭受的社会排斥。西班牙镇压罗姆人的最高表现是1749年对罗姆人的大围捕。大围捕是由西班牙君主组织的一次突袭,目的是监禁和/或强迫伊比利亚罗姆人劳动。这一事件以及对罗姆人的压制性立法对罗姆人语言和文化的丧失产生了强烈影响,推动了西班牙的反吉普赛人主义,并导致许多罗姆人家庭流离失所51.这可能是目前伊比利亚吉普赛人缺乏遗传子结构的原因。
使用完整的线粒体序列可以分析线粒体编码区域,因此,也可以分析人口统计学历史在人群中的功能影响。种群瓶颈和随后的创始人效应增加了基因组蛋白质编码部分的有害突变负荷22.因此,我们试图通过比较南亚创始人血统、西方-欧亚创始人血统和欧洲非创始人血统的非同义突变的预测致病性来探索罗姆人线粒体血统的有害突变负荷。有趣的是,南亚血统和西欧亚创始人血统与非创始人血统相比,与常染色体外显子体中观察到的相比,具有较低的平均预测致病性。这可能是由于不同的选择机制影响mtDNA,其中通常异质突变可以导致疾病并被选择对抗,而常染色体基因中的大多数突变是隐性的。
目前的研究表明,随着吉普赛人的散居,创始人效应强烈地影响了他们的mtDNA库。此外,对创始人血统的系统地理学分析可以重现他们的散居,从印度西北部一直到欧洲。罗姆人的流散是一个记录不足的事件,未来的全基因组研究可以关注他们与其他人群的关系,以帮助填补关于罗姆人历史的知识空白。
数据可用性
本研究产生的线粒体基因组可在GenBank上获得,登录号为ON155447-ON155590。
参考文献
欧洲委员会。罗姆人平等、包容和参与欧盟(欧盟委员会,2020年)。https://ec.europa.eu/info/policies/justice-and-fundamental-rights/combatting-discrimination/roma-eu/roma-equality-inclusion-and-participation-eu_en(2022年1月12日访问)。
罗姆人在印度-雅利安语中的地位。罗姆人钉。5145(1926)。
蒙迪扎巴尔,我。et al。重建欧洲罗姆人的印度起源和传播:一个母亲遗传的视角。《公共科学图书馆•综合》6(1), 1 - 10。https://doi.org/10.1371/journal.pone.0015988(2011)。
Moorjani, P。et al。从全基因组数据重建罗姆人历史。《公共科学图书馆•综合》8(3) e58633。https://doi.org/10.1371/journal.pone.0058633(2013)。
Miklosich F。Über在木卫二的zigener下,死去的平凡和流浪(Karl Gerold的Sohn, 1872)。
《拜占庭帝国的吉普赛人与中世纪晚期的巴尔干人》。敦巴顿橡树。15, 141年。https://doi.org/10.2307/1291178(1961)。
弗雷泽,a.m.。吉普赛人(欧洲民族)(布莱克韦尔出版社,1992)。
Kalaydjieva, L., Gresham, D. & Calafell, F.罗姆人(吉普赛人)的遗传研究:综述。BMC医学,Genet。2(1) 5。https://doi.org/10.1186/1471-2350-2-5(2001)。
Kenrick D。《吉普赛人(罗姆人)历史词典》(民族与文化历史词典)(2007)。
Martínez Dhier, A。Expulsión o Asimilación, esa es la cuestión: Los Gitanos en Castilla Durante el Gobierno de la MONARQUÍA绝对173 - 230(2011)。
Pérez, J & Hochroth, L。一部悲剧的历史:犹太人被驱逐出西班牙149, 2022年1月24日访问。https://books.google.com/books/about/History_of_a_Tragedy.html?hl=es&id=GKYlN1ySFOYC(2007)。
圣克鲁斯市。Crónica德洛斯雷耶斯Católicos托莫我.(CSIC -西班牙-美洲大学(EEHA), 1951)。2022年3月24日访问。http://hdl.handle.net/10261/245010.
阿兹马诺夫,d.n。et al。罗姆/吉普赛创始人人群中的LTBP2和CYP1B1突变和相关眼部表型欧元。j .的嗡嗡声。麝猫。19(3), 326 - 333。https://doi.org/10.1038/ejhg.2010.181(2011)。
bouw, S。et al。古印第安人W24X突变在一般吉普赛人群体和个别亚分离株中的GJB2携带者率。麝猫。测试11(4), 455 - 458。https://doi.org/10.1089/gte.2007.0048(2007)。
蒙迪扎巴尔,我。et al。报告从全基因组数据重建欧洲罗姆人的人口历史。咕咕叫。医学杂志。22, 2342 - 2349。https://doi.org/10.1016/j.cub.2012.10.039(2012)。
比安科,E。et al。最近共同的起源、减少的人口规模和明显的混合形成了欧洲罗姆人基因组。摩尔。杂志。另一个星球。https://doi.org/10.1093/molbev/msaa156(2020)。
Rai, N。et al。y染色体单倍群H1a1a-M82的系统地理学揭示了欧洲罗姆人可能起源于印度。《公共科学图书馆•综合》7(11), e48477。https://doi.org/10.1371/journal.pone.0048477(2012)。
Garcia-Fernandez C。et al。性别偏见的模式塑造了罗姆人的遗传历史。科学。代表。10(1), 14464。https://doi.org/10.1038/s41598-020-71066-y(2020)。
Font-Porterias, N。et al。欧洲罗姆人群体显示出复杂的西欧亚混血足迹和共同的南亚遗传起源。公共科学图书馆麝猫。https://doi.org/10.1371/journal.pgen.1008417(2019)。
Banfai, Z。et al。从全基因组数据揭示高加索地区对罗姆人遗传遗产的影响”。《公共科学图书馆•综合》13(9), e0202890。https://doi.org/10.1371/journal.pone.0202890(2018)。
Banfai, Z。et al。揭示了奥斯曼帝国占领对中欧东部少数民族和该地区罗姆人的遗传影响。前面。麝猫。10, 558年。https://doi.org/10.3389/fgene.2019.00558(2019)。
Font-Porterias, N。et al。人口统计学对功能基因组变异的抵消作用:罗姆范式。摩尔。杂志。另一个星球。38(7), 2804 - 2817。https://doi.org/10.1093/molbev/msab070(2021)。
Gomez-Carballa,。et al。欧洲吉普赛人流散最西端的印第安人签名:来自Mitogenomes的新见解”。《公共科学图书馆•综合》8(10), e75397。https://doi.org/10.1371/journal.pone.0075397(2013)。
Martinez-Cruz B。et al。欧洲罗姆人的起源、混合和创始人血统。欧元。j .的嗡嗡声。麝猫。24, 937 - 943。https://doi.org/10.1038/ejhg.2015.201(2016)。
来自整个线粒体基因组的母系血统和种群历史。Investig。麝猫。6(1), 1 - 10。https://doi.org/10.1186/S13323-015-0022-2/FIGURES/2(2015)。
Cortés, a.g., Martínez, d.c. & Mesa, a.c.吉塔诺的身份和Origen del Pueblo Gitano。Int。J.罗马种马。1(2), 159 - 184。https://doi.org/10.17583/IJRS.2019.4561(2019)。
Illumina公司。人类mtDNA基因组指南15037958.2020年4月23日访问。https://emea.support.illumina.com/downloads/human_mtdna_genome_guide_15037958.html(2016)。
Illumina公司Illumina®MiSeq系统指南.2020年5月13日访问。www.illumina.com/company/legal.html.
范德奥维拉,g.a.。et al。“从fastQ数据到高置信变量调用:基因组分析工具包最佳实践管道。咕咕叫。Protoc。Bioinform。https://doi.org/10.1002/0471250953.bi1110s43(2013)。
FastQC高通量序列数据的质量控制工具。Babraham生物信息学.https://www.bioinformatics.babraham.ac.uk/projects/fastqc/(2022年1月26日访问)。
李,H。用BWA-MEM对准序列读取,克隆序列和汇编contigs.2020年11月11日访问。http://arxiv.org/abs/1303.3997(2013)。
安德鲁先生et al。人类线粒体DNA剑桥参考序列的再分析和修订。Nat,麝猫。23(2), 147。https://doi.org/10.1038/13779(1999)。
皮卡德工具包。Broad研究所,GitHub知识库(皮卡德工具包,2019年)。http://broadinstitute.github.io/picard/
Okonechnikov, K., Conesa, A. & García-Alcalde, F. Qualimap 2:高通量测序数据的高级多样本质量控制。生物信息学32(2), 292 - 294。https://doi.org/10.1093/bioinformatics/btv566(2016)。
麦肯纳,。et al。基因组分析工具包:用于分析下一代DNA测序数据的MapReduce框架。基因组Res。20.(9), 1297年。https://doi.org/10.1101/GR.107524.110(2010)。
Weissensteiner, H。et al。HaploGrep 2:高通量测序时代的线粒体单倍群分类。核酸测定。44(W1) W58-W63。https://doi.org/10.1093/nar/gkw233(2016)。
Dür, A., Huber, N. & Parson, W. mtDNA序列的微调系统发育比对和单倍群。Int。理学。22(11), 5747年。https://doi.org/10.3390/IJMS22115747(2021)。
帕拉迪斯,E. &巴雷特,J.佩加斯:一个R包的群体遗传学与集成模块化的方法。生物信息学26(3), 419 - 420。https://doi.org/10.1093/BIOINFORMATICS/BTP696(2010)。
Kamvar, Z. N., Brooks, J. C. & Grünwald, N. J.用于分析全基因组人群遗传数据的新颖R工具,重点是克隆性。前面。麝猫。6, 208年。https://doi.org/10.3389/FGENE.2015.00208/BIBTEX(2015)。
Saillard, J., Forster, P., Lynnerup, N., Bandelt, H. J. & Nørby, S.格陵兰爱斯基摩人mtDNA变异:白令海峡扩张的边缘。点。j .的嗡嗡声。麝猫。67(3), 718 - 726。https://doi.org/10.1086/303038(2000)。
Sa, L。et al。非洲以外的撒哈拉以南线粒体谱系的系统地理学突出了全新世气候变化和大西洋奴隶贸易的作用。Int。理学。23(16), 9219年。https://doi.org/10.3390/IJMS23169219(2022)。
构建17:培育人类线粒体DNA树。法医科学。Int。5, e92-e94。https://doi.org/10.1016/j.fsigss.2015.09.155(2015)。
Auton,。et al。人类遗传变异的全球参考。自然526(7571), 68 - 74。https://doi.org/10.1038/nature15393(2015)。
席尔瓦,M。et al。11世纪安达卢斯与北非相关的祖先、流动性和饮食的生物分子洞察。科学。代表。11(1) 1-13。https://doi.org/10.1038/s41598-021-95996-3(2021)。
Pereira, L., Soares, P., Radivojac, P., Li, B.和Samuels, dc .通过比较系统发育和蛋白质变异的预测致病性,揭示了全球人类mtDNA多样性的平等净化选择。点。j .的嗡嗡声。麝猫。88(4), 433年。https://doi.org/10.1016/J.AJHG.2011.03.006(2011)。
贝哈尔博士et al。巴斯克范式:自前新石器时代以来,佛朗哥-坎塔布里亚地区母系延续的遗传证据。点。j .的嗡嗡声。麝猫。90(3), 486 - 493。https://doi.org/10.1016/j.ajhg.2012.01.002(2012)。
Flores-Bello,。et al。巴斯克人的遗传起源、奇点和异质性。咕咕叫。医学杂志。31(10) 2167 - 2177。https://doi.org/10.1016/J.CUB.2021.03.010(2021)。
古斯芒,。et al。通过y染色体谱系的系统地理学分析,对伊比利亚吉卜赛人的历史进行了展望。安。嗡嗡声。麝猫。72(2), 215 - 227。https://doi.org/10.1111/j.1469-1809.2007.00421.x(2008)。
Regueiro, M。et al。罗姆人和南印度人共有的祖先Y-STR单倍型。基因504(2), 296 - 302。https://doi.org/10.1016/j.gene.2012.04.093(2012)。
昂德希尔,p.a.et al。y染色体单倍群R1a的系统发育和地理结构。欧元。j .的嗡嗡声。麝猫。23(1), 124 - 131。https://doi.org/10.1038/ejhg.2014.50(2014)。
Gómez-Alfaro, A. &罗伯茨,T. W.;大吉普赛人围捕:西班牙:1749年对吉普赛人的普遍监禁(编辑Presencia Gitana, 1993)。
确认
我们要感谢所有参与这项研究的志愿者和Roma FAGiC协会(Federació d’associacions giitanes de Catalunya)。这项工作得到了西班牙经济和竞争力部的支持(授权号CGL2016-75389-P (MINEICO/FEDER, UE), PID2019-106485GB-I00 (MINEICO),以及DC和FC的“Unidad María de Maeztu”(MDM-2014-0370);Agència de Gestió d 'Ajuts Universitaris i de la Recerca (Generalitat de Catalunya,拨款2017SGR00702)。
作者信息
作者及隶属关系
贡献
J.A.-I。,D.C. and F.C. designed the study. J.A.-I. conducted the analysis. J.A.-I., D.C. and F.C. contributed to the interpretation of the data. J.A.-I. wrote the manuscript with help of D.C. and F.C., and A.G. and A.C.-M. contributed with the sampling and helped contextualizing the results.
相应的作者
道德声明
相互竞争的利益
作者声明没有利益竞争。
额外的信息
出版商的注意
施普林格自然对出版的地图和机构从属关系中的管辖权主张保持中立。
补充信息
权利和权限
开放获取本文遵循知识共享署名4.0国际许可协议,允许以任何媒介或格式使用、分享、改编、分发和复制,只要您对原作者和来源给予适当的署名,提供知识共享许可协议的链接,并注明是否有更改。本文中的图像或其他第三方材料包含在文章的创作共用许可协议中,除非在材料的信用额度中另有说明。如果材料未包含在文章的创作共用许可协议中,并且您的预期使用不被法定法规所允许或超出了允许的使用范围,您将需要直接获得版权所有者的许可。如欲查看本牌照的副本,请浏览http://creativecommons.org/licenses/by/4.0/.
关于本文
引用本文
Aizpurua-Iraola, J., Giménez, A., carballa - mesa, A.;et al。伊比利亚吉普赛人有丝分裂基因组中的创始人血统概括了吉普赛人的散居,并显示了人口瓶颈的影响。Sci代表12, 18720(2022)。https://doi.org/10.1038/s41598-022-23349-9
收到了:
接受:
发表:
DOI:https://doi.org/10.1038/s41598-022-23349-9