简介

罗姆人,也被称为“吉普赛人”,是欧洲最大的少数民族,人口估计在1000万到1200万之间1.罗姆人一词包含了不同群体的马赛克strictu在基因上、文化上、语言上和历史上都有差异的人,如辛提人、羽衣甘蓝人、罗曼尼切尔人等。然而,遗传和语言研究已经把所有罗姆人的起源都放在印度次大陆的西北部23.4.总的来说,吉普赛人的流散在历史上并没有很好的记录。然而,历史证据似乎表明,他们在公元9世纪左右穿过波斯到达亚美尼亚。强烈的语言影响表明,他们在亚美尼亚的逗留时间可能特别长5.历史记录显示,塞尔柱人对亚美尼亚的入侵造成了众所周知的亚美尼亚人的流离失所,也可能迫使罗姆人的祖先沿着安纳托利亚路线前往君士坦丁堡和巴尔干半岛,11世纪中期就有罗姆人的存在记录67.在欧洲,罗姆人在巴尔干半岛南部定居了大约200年,并在奥斯曼帝国统治下一直居住在该地区。然而,后者向中欧的扩张引发了罗姆游牧民族在欧洲不同领土的扩张6.除了吉普赛人的游牧传统外,在许多地区遭受的迫害和社会排斥也在吉普赛人的分散和形成欧洲不同的罗姆人民族语言群体中发挥了关键作用。一些罗姆人迁移到多瑙河公国(今天的罗马尼亚、摩尔达维亚和匈牙利),在那里他们被迫成为奴隶,成为弗拉克斯罗姆人,而其他一些群体,如罗曼格罗罗姆人,则迁移到奥匈帝国。最后,许多其他小团体选择了北部或西部路线,遍布北欧、中欧和西欧78.最后,罗马人在15世纪到达伊比利亚半岛,根据历史记载,1425年罗马人出现在萨拉戈萨9.1469年,在伊比利亚半岛,卡斯蒂利亚和阿拉贡王国统一,并开始在其境内寻求文化同质性10.伊比利亚的罗姆人,连同穆斯林和犹太社区,与期望的文化和宗教(天主教)同质性发生冲突1011.因此,颁布了一系列法律,迫使穆斯林和犹太人皈依或被驱逐,并迫使游牧的罗姆人定居1112

对目前罗姆人及其历史的复杂性的理解来自不同的学科。分子人类学研究首先提出了罗姆人的南亚遗传成分,因为他们与印度和巴基斯坦患者存在共同的遗传疾病1314.后来,由于全基因组数据,他们的起源被确定在1500年前的旁遮普邦3.4.在最符合基因组证据的人口模型中,原始罗姆人的人口规模较小,在基因上最接近今天的旁遮普人,他们的西欧亚血统最少41516.罗姆人的印度血统也反映在他们的单亲遗传基因组库中,因为他们拥有南亚线粒体DNA (mtDNA) M (M5, M35, M18和M25)和y染色体H1a1a4b2血统3.1718

在离开印度事件之后,罗姆人的基因组中暗示了非常强烈的创始人效应,他们广泛地与非罗姆人混合,并在他们的移民过程中经历了多次瓶颈,导致了今天罗姆人的形成4151619.在全基因组遗传研究中,观察到中东成分的中等影响和高加索人群的略高遗传影响1520.21.这与历史和语言研究提出的罗姆人通过波斯迅速分散以及高加索地区的影响相一致。此外,在所有罗姆人群体中也观察到巴尔干遗传足迹1519.这种成分形成了一个梯度,与与巴尔干半岛的距离相关,保加利亚、希腊和塞尔维亚罗姆人的巴尔干血统比例最高(45%),而立陶宛、爱沙尼亚或伊比利亚罗姆人的巴尔干血统比例约为25%19.这也与历史记录相吻合,这些记录都表明罗姆人从巴尔干半岛分散到欧洲。除了巴尔干组成部分外,罗姆人种群还表现出与各自宿主种群的不同混合模式,加上人口瓶颈(和创始人事件)和/或社会内婚制实践,弥补了观察到的欧洲罗姆人的遗传异质性19.罗姆人的人口历史也塑造了他们的功能基因组变异,因为创始人效应增加了高频有害变异22

伊比利亚吉普赛人是巴尔干/东欧以外最大的吉普赛人,代表着欧洲最西端的吉普赛人扩张1.然而,针对伊比利亚罗姆人的研究仍然很少。最近对不同罗姆人进行的全基因组研究表明,伊比利亚半岛内的地理遗传子结构具有不同程度的祖先比例和近亲繁殖,被理解为通过祖先密切相关的个体交配19.关于单亲标记的研究,多个创始人事件也在罗姆母系血统频率上留下了印记。Martinez-Cruz等人2016年通过测序线粒体控制区确定了主要的罗姆人特异性mtDNA创始人谱系。后来,整个有丝分裂基因组被用于增加伊比利亚罗马人(如M5a1b1a1, U3b1c或H88a)中一些世系的系统发育细节。23

单亲标记为人类迁移和混合的性别特定模式提供了独特的图景。然而,伊比利亚罗姆人mtDNA库尚未得到充分检查。虽然伊比利亚罗马人的创始人血统的存在是众所周知的重要24在美国,许多特征仍然未知,特别是这些血统是何时何地被罗马人获得的。这些问题在以前的研究中进行了调查,但受到样本量小和mtDNA控制区提供的次优分辨率的限制232425.此外,创始人血统是否仅限于经历瓶颈的种群,或者相反,它们是否也出现在一般的欧洲种群中,仍有待探索。

因此,在本研究中,我们分析了伊比利亚吉普赛人的mtDNA库,重点是在原始吉普赛人群体中存在的吉普赛人创始人血统,或者在整个历史中通过混合获得,然后随着漂移而激增。我们还探索了伊比利亚半岛内罗姆人的线粒体遗传子结构,以及人口统计过程可能对罗姆人线粒体创始人谱系产生的功能影响。

方法

样本和测序

我们对144名伊比利亚罗姆人志愿者的唾液样本进行了完整的丝裂基因组测序。志愿者唾液样本的收集工作是在“El Camí del Poble Gitano: una història de diveritat”项目26与罗马FAGiC协会(Federació d 'Associacions Gitanes de Catalunya).所有参与者自认为伊比利亚罗姆人,并获得了所有捐赠者的适当书面同意(补充信息)。本研究已获得我们当地IRB的批准(Comitè d’Ètica de la Investigació, Parc de Salut Mar,参考文献2016/6723/I, 2016年6月7日;和2019/8900/I, 2020年1月15日),初步结果于2019年2月1日在巴塞罗那由FAGiC组织的会议上向罗姆人社区展示。本研究所有方法均按照标准指南和规定进行。

在相同的条件下,对4个不同的片段进行PCR扩增S1而且S2).Nextera XT文库按照Illumina mtDNA基因组指南制备和测序27以及Illumina MiSeq指南28

序列处理

按照GATK最佳实践步骤处理序列29.首先,FastQC进行了初始质量评估30.然后是BWA 0.7.1531用于将原始读数映射到修订后的剑桥参考序列(rCRS)32.用Picard工具去除PCR重复序列33,基础质量评分重新校准,并通过Qualimap获得最终质量报告34.最后,使用GATK单倍型调用器调用单倍型35

统计分析

单倍群用haplogrep v.2进行测定36使用phylotree v.17加上Dür等人定义的额外单倍群。37.用pegas计算分子多样性和汇总统计指标38包在R和poppr39用于计算AMOVA和F按地理区域划分的距离。结合年龄通过计算⍴和σ得到40,假设突变率为2.355 × 10−8每年每个核苷酸的替换量,考虑到净化选择41

Phylogeographical分析

我们将伊比利亚罗马人的创始人血统定义为同一单倍群的四个以上线粒体序列的群体(如phylotree.org build 17所定义)42),具有一个或多个突变(不包括Soares et al. 2009中列出的高变量位置),并且仅局限于罗姆人。为了验证这些创始人血统是否是伊比利亚罗马人独有的,Blast使用Genbank搜索具有最高身份百分比的序列。

为了比较伊比利亚罗马人中这些始祖血统的相关性,我们在超过1000个非罗马西班牙语序列的数据集中重复了分析4344.首先,分析整个非罗马西班牙语参考数据集,寻找达到相对频率为0.0278的单倍群,这是对应于为罗马人设置的阈值的值(4/144,其中144是罗马人样本量)。然后,我们将非罗姆人样本细分为地理组,其大小接近罗姆人样本(表S3),检查其相对频率阈值相同但n > 2的始祖谱系,并在Genbank中运行BLAST,检索最相似的序列。将所有下载的序列添加到西班牙语序列中,我们使用Network 10软件构建了中位连接系统进化树,并手动构建了树状表示。

致病性测定

我们使用MutPred软件预测的致病性评分,用于表中可用的mtDNA编码区域中所有可能的氨基酸变化S3在Pereira等。45.然后,我们使用Mann-Whitney U检验比较了创始人血统和非创始人血统之间的致病性评分的分布。

结果

伊比利亚罗马人线粒体的整体多样性

我们对来自伊比利亚罗姆人的144个个体的丝裂基因组进行了测序,平均每个个体的覆盖率为624X(图2)。S1).伊比利亚吉普赛人表现出72种不同的线粒体单倍型,与任何地理区域的非吉普赛人西班牙人口相比,其多样性值较低S4).

样本显示20个(13.9%)南亚单倍型,主要以M5a1b单倍群序列为代表;124个(86.1%)欧亚西部单倍型。此外,我们的样本显示了51%的西欧亚创始人血统,这些血统之前通过线粒体控制区(U3, H7, J1b3或J1c1)分析或整个有丝分裂基因组分析(H88a, U3b1c)描述过。2324.除了这些先前观察到的罗姆人创始人谱系之外,我们还能够在单倍群H3g1和J2b1c中检测到一些新的创始人谱系的存在。1).总体而言,在我们的伊比利亚罗马人样本中,13.9%的个体携带了两个南亚血统的创始人血统,而七个西欧亚血统的创始人血统的人口频率达到了51.4%。

图1
图1

伊比利亚罗马人的单倍群组成。创始人血统详细到亚单倍群级别。

罗马创始人血统

考虑到它们最近的邻居,伊比利亚罗马人中的M5a1b序列(13.2%)(图。2)明显源自南亚;所有罗姆人样本都含有定义M5a1b1a1的突变。然而,在M5a1b1a1中,罗姆人样本之间观察到一些差异,证明了先前未观察到的原始罗姆人母体基因库中的多样性水平。此外,我们观察到5个旁遮普人和1个巴基斯坦人与所有罗姆人样本聚类在M5a1b1a1分支内。这进一步证明了这个血统和原始罗姆人起源于印度西北部和巴基斯坦附近的某个地方。到最近共同祖先(TMRCA)的时间为1.8 kya (σ = 0.53 kya)。至于在以前的研究中发现的剩余M南亚血统23我们的样本中没有M35,我们只发现了一个M18单倍型。

图2
图2

罗马人有丝分裂基因组单倍群M5a1b1a1的最大简约树。mtDNA变体沿着系统发生树的分支被指示。符号“@”表示反向突变,突出显示的突变表示非同义突变。IBR标签指的是伊比利亚罗姆人,“LithuRo”、“HungRo”和“MaceRo”分别指的是立陶宛罗姆人、匈牙利罗姆人和马其顿罗姆人。

伊比利亚罗马人最常见的西欧亚血统是U3b1。在之前的研究中23,罗马人U3b1的系统发育被进一步细化为五个伊比利亚罗马人,他们属于同一个U3b1子分支(后来被命名为U3b1c),并共享变体A2833G-T7759C-T8895C-C11119T-T12783C-T15262C。在我们的研究中(图。3.), 47个序列(32.6%)属于U3b1单倍群。然而,并不是所有的U3b1c都具有定义变异,其中一些缺乏T7759C。一个伊比利亚非罗马人个体的存在,有4 / 6的U3b1c定义突变,这表明在这个分支中可能有更多的未采样的多样性,U3b1c的定义应该仔细修订。除了这个样本,我们还观察到另一个伊比利亚人属于所有U3b1c罗姆人样本,这可能是罗姆人对伊比利亚总人口贡献的一个信号。U3b1c在其他欧洲罗姆人身上的存在,以及在约旦采样的共享A2833G突变的最接近的血统表明,这一血统可能是中东罗姆人在移民期间获得的,比预期的要早(TMRCA = 2.1 kya σ = 0.78 kya)。

图3
图3

罗马人有丝分裂基因组U3b1c单倍群的最大简约树。mtDNA变体沿着系统发生树的分支被指示。符号“@”表示反向突变,突出显示的突变表示非同义突变。IBR标签指的是伊比利亚罗姆人,LithuRo标签指的是立陶宛罗姆人。

每一个其余的创始人血统在线粒体池中都有较小的存在,但它们加在一起占总血统的18.7%。在先前从控制区域序列描述的创始人血统中24,我们能够细化H7a1, J1b3和J1c1的系统发育。H7a1单倍群(图;S2)定义为C16261T,其分布局限于中欧-北欧。我们的H7a1伊比利亚罗马人样本中的四个不属于H7a1内嵌套的每个亚单倍群,并形成由14905A突变定义的独立分支。此外,其中一个含有16148 T突变。

单倍群J1b3(图;4)分为J1b3a和J1b3b两个亚单倍群。罗姆人的样本都属于J1b3a分支,并显示出四种不同的单倍型。三名乌克兰罗姆人和一名斯洛伐克人共有6137C突变。伊比利亚吉普赛人表现出两个不同的单倍型,一个在J1b3a根(还有一个葡萄牙和一个美国样本),另一个通过4197T突变与之分离。此外,亚美尼亚人和亚述人也存在J1b3a单倍群的一些分支。

图4
图4

罗马人有丝分裂基因组单倍群J1b3a的最大简约树。mtDNA变体沿着系统发生树的分支被指示。符号“@”表示反向突变,突出显示的突变表示非同义突变。IBR标签指的是伊比利亚罗姆人,“UkRo”指的是乌克兰罗姆人,“PTG”指的是葡萄牙罗姆人。

J1c1b(无花果。S3)也拥有罗马人特有的创始人血统。我们的四个伊比利亚吉普赛人样本,以及一个马其顿吉普赛人和一个匈牙利吉普赛人组成了508G-9554A-14470C定义的分支。所有四个伊比利亚罗姆人和马其顿罗姆人都显示出相同的单倍型,而匈牙利罗姆人额外携带10463C。这些层序的合并年龄为0.4 kya (σ = 0.4 kya)。

在之前的研究中描述了H88a23,在我们罗姆人群中的6个个体中也发现了这种基因,其合并年龄为0.9 kya (σ = 0.5 kya)。S4).

除了这些先前在罗姆语中描述过的单倍群,我们还发现了其他的创始人谱系,如H3g1(图3)。S5),该基因存在于5个伊比利亚罗姆人身上,定义为7419A-11563 t,其中4个序列也包含3666A突变,而另一个个体携带16153A突变。这些层序的合并年龄为2.5 kya (σ = 2.1 kya)。

最后,在我们的样本中有5个序列属于单倍群J2b1c* (sensu stricto Dür et al. 2021)(图。5).与希腊和北马其顿罗姆人样本一起,他们形成了一个单独的集群,由突变508G-10646A-15184C定义。该分支的凝聚年龄为1.2 kya (σ = 0.9 kya)。

图5
图5

单倍群J2b1c* Roma有丝分裂基因组的最大简约树。mtDNA变体沿着系统发生树的分支被指示。突出显示的突变表示非同义突变。IBR标签指的是伊比利亚罗马人。

为了确定我们在伊比利亚罗马人中发现的创始人血统的数量和总体频率是否可能是来自他们的人口统计学历史的特征,还是与在其他人群中发现的相似,我们在西班牙普通人群的数据集中寻找创始人血统(见“方法”,无花果。S6).我们观察到,1066个西班牙非罗马人序列中有8个(0.7%)可以被分配到西班牙特定的创始人血统,而对于伊比利亚罗马人数据集,144个序列中有94个(65.3%)属于罗马人创始人血统(图3)。6).在西班牙非罗姆人数据集中,我们发现了一些属于巴斯克特征血统H1j1的个体(1.4%)46这些都没有考虑到因为已知的特定人口历史47(无花果。S7).在伊比利亚人(而不是巴斯克人)中,我们发现了两种可能的始祖谱系:一种是由来自加泰罗尼亚的3个K1a4序列组成,另一种是由来自安达卢西亚和加泰罗尼亚的5个T2个体组成。S11而且).

图6
图6

伊比利亚吉普赛人(IBR)和伊比利亚非吉普赛人(IBnR)人口中特定人群的创始人和非创始人血统的比例。

伊比利亚罗马人的遗传子结构

对伊比利亚半岛内伊比利亚罗姆人的遗传结构进行了分析,根据地理起源对样本进行了分离(图。S14系列).计算每个区域的遗传多样性指数(表2)S3).区域群体的一般单倍群组成(即南亚创始人谱系、欧洲创始人谱系和欧洲非创始人谱系的分类)没有显著的异质性(p = 0.255, Pearson的卡方检验)(图2)。S15).

此外,利用AMOVA分析了层序组成的区域亚结构。伊比利亚吉普赛人亚群体的变异比例为- 0.41%,而伊比利亚非吉普赛人的变异比例为0.04%,两者都与零没有显著差异,这表明伊比利亚吉普赛人和一般人群在地理区域之间具有同质性。

根据AMOVA测量,由吉普赛人与非吉普赛人伊比利亚人群之间的差异解释的遗传多样性数量为10.7% (p = 0.0001)。这是一个很大的价值,可以用罗马人的创始人血统的主导地位来解释。事实上,如果除去所有创始人血统,方差分数下降到0.3% (p = 0.2)。这意味着,除了创始人血统之外,罗姆人的mtDNA序列与非罗姆人单倍型难以区分,并且可能主要是最近与非罗姆伊比利亚人混合的结果。

线粒体有害突变负荷

对伊比利亚罗马人的有害突变负荷进行了分析,研究了编码区非同义突变的MutPred评分。我们比较了罗马创始人血统和罗马非创始人血统氨基酸变化的预测致病性。结果表明,与预期相反,罗姆非创始人血统相比罗姆创始人血统显示出更高的平均致病性(图2)。S16).尽管由于移民期间的遗传漂变,可能存在更高的有害突变,但mtDNA证据表明,欧洲血统比罗姆创始人血统具有更高的预测致病性(p = 4.956 × 10)5, Mann-Whitney u检验),无论是与南亚(p = 0.02)或欧洲(p = 10)相比4)谱系(图;肌力).

讨论

利用单亲本和全基因组数据对罗姆人的遗传多样性和种群历史进行了评估3.23244849.然而,线粒体DNA研究主要集中在对照区序列,并且,在使用整个有丝分裂基因组的研究中(特别是那些专注于西北罗姆人的研究),样本量一直是一个限制23.在本研究中,我们通过对144个来自生活在西班牙的罗姆人的新样本进行测序,克服了这一限制。

我们的结果显示,与伊比利亚总人口相比,罗姆人的线粒体多样性水平较低,这与之前的研究一致,反映了罗姆人所经历的人口瓶颈24.然而,更深入地观察mtDNA库,我们观察到,除了在罗姆人身上发现的南亚M血统(13.9%),剩余的mtDNA单倍型是罗姆人与西方欧亚人口在印度移民之外的强烈混合的证据。

关于南亚罗姆人血统,经历了印度事件的原始罗姆人的人口规模减少反映在观察到的低多样性水平上。这在线粒体库中很明显,欧洲罗姆人表现出一些不同的M亚单倍群(如M5、M35或M18),在Y染色体多样性中更明显,只有H1a1a4b2和R1a-M780血统来自印度1750.我们的大多数样本都属于M5a1b1a1单倍群,与来自印度和巴基斯坦西北部旁遮普省地区的六个南亚样本共享。这表明,这一世系和原始罗姆人的地理起源可能在印度次大陆的西北部附近(假设该地区目前的单倍型分布反映了原始罗姆人离开之前的分布),这与先前的研究一致415.这个世系起源的分子年代测定(~ 1800 ybp)早于原始罗马人离开印度的事件,据估计约为1500 ybp15

伊比利亚罗马人最丰富的血统是U3b1c,立陶宛罗马人也有,考虑到在对照地区观察到的U3血统,在较小程度上也可能存在于保加利亚和希腊罗马人24.与先前发表的研究相反,伊比利亚罗姆人在这个单倍群中表现出更高的多样性水平。一个伊比利亚非罗马人个体的存在,有四分之六的U3b1c定义突变,这表明在这个分支中可能有更多的未采样的多样性,并且U3b1c的定义应该仔细修订。这一谱系的起源很难从系统地理上追溯,因为与U3b1c谱系相关的少数样本具有不特定的地理分布(图2)。3.).尽管如此,与U3b1c最接近的单倍型在约旦取样,与U3b1c有一个相同的突变。再加上在罗姆人中分布相对广泛,估计TMRCA为2.1 kya,这比罗姆人的人口历史还要早,可能是由于所采用的血统的分歧,U3b1c最有可能的起源是在中东。如果情况确实如此,伊比利亚罗马人mtDNA库中超过30%的人将由中东血统组成。这与使用常染色体数据的研究中观察到的中东/高加索人的适度影响形成对比,后者在罗马X染色体中特别低19.对mtDNA的进一步研究可以揭示U3b1c单倍群的起源,该单倍群可能是通过漂移事件在伊比利亚罗姆人中达到高频率的。

此外,J1b3a也可能起源于中东,因为它也在亚美尼亚人和亚述人身上被发现(图1)。4).这种血统,我们第一次在西罗马人身上发现,在保加利亚和匈牙利的罗姆人身上比较常见,在乌克兰的罗姆人身上相当普遍24

此外,除了五个伊比利亚罗姆人和一个马其顿罗姆人样本,我们发现J2b1c*血统只存在于来自巴尔干半岛的非罗姆人身上(图2)。5).这可能表明该血统是罗姆人在巴尔干地区逗留期间获得的,这与所有欧洲罗姆人身上发现的巴尔干血统一致19

伊比利亚罗马人的其余创始人血统,占样本的13.9%,有明确的欧洲血统,尽管在欧洲大陆的确切起源无法确定。尽管如此,考虑到与其他罗姆人群体共享单倍群的模式以及估计的血统年龄,他们中的大多数很可能是在罗姆人到达欧洲后不久获得的,而不是在伊比利亚半岛本身。

值得注意的是,在我们的样本中,我们没有发现任何北非本土单倍型,如M1或U6。这与先前的研究结果一致,即罗姆人通过北非进入伊比利亚半岛的可能性很小3.4

在量化了伊比利亚罗马人和一般西班牙人之间创始人血统频率的差异后,结果表明,线粒体创始人血统的存在可能不是一般欧洲人群的共同特征,而是经历了某些人口统计过程的人群的特征。欧洲吉普赛人流散的人口瓶颈造成的创始人效应是吉普赛人线粒体库中创始人血统高频率的主要原因。此外,由社会文化因素(社会排斥、内婚制婚姻)引起的罗姆人遗传连续性的维持,可能也在伊比利亚罗姆人线粒体库中观察到的模式中发挥了作用,以及在一般西班牙人群中观察到的罗姆人创始人血统的微不足道的存在。

对伊比利亚主要地理区域内的遗传子结构的评估表明,从母系的角度来看,伊比利亚罗姆人在遗传上是同质的。在南亚始祖血统、欧洲始祖血统和欧洲非始祖血统的比例上,我们没有发现区域差异;AMOVA也没有检测到不同地区之间有任何显著差异。罗姆人传统的流动生活方式在一定程度上也是由于他们在历史上遭受的社会排斥。西班牙镇压罗姆人的最高表现是1749年对罗姆人的大围捕。大围捕是由西班牙君主组织的一次突袭,目的是监禁和/或强迫伊比利亚罗姆人劳动。这一事件以及对罗姆人的压制性立法对罗姆人语言和文化的丧失产生了强烈影响,推动了西班牙的反吉普赛人主义,并导致许多罗姆人家庭流离失所51.这可能是目前伊比利亚吉普赛人缺乏遗传子结构的原因。

使用完整的线粒体序列可以分析线粒体编码区域,因此,也可以分析人口统计学历史在人群中的功能影响。种群瓶颈和随后的创始人效应增加了基因组蛋白质编码部分的有害突变负荷22.因此,我们试图通过比较南亚创始人血统、西方-欧亚创始人血统和欧洲非创始人血统的非同义突变的预测致病性来探索罗姆人线粒体血统的有害突变负荷。有趣的是,南亚血统和西欧亚创始人血统与非创始人血统相比,与常染色体外显子体中观察到的相比,具有较低的平均预测致病性。这可能是由于不同的选择机制影响mtDNA,其中通常异质突变可以导致疾病并被选择对抗,而常染色体基因中的大多数突变是隐性的。

目前的研究表明,随着吉普赛人的散居,创始人效应强烈地影响了他们的mtDNA库。此外,对创始人血统的系统地理学分析可以重现他们的散居,从印度西北部一直到欧洲。罗姆人的流散是一个记录不足的事件,未来的全基因组研究可以关注他们与其他人群的关系,以帮助填补关于罗姆人历史的知识空白。