学术源论文发表咨询网 公告: 首页 - 网站声明 - 在线投稿 - 发表流程 - 联系我们 - 加入收藏
医学期刊
建筑期刊
教育综合
计算机类
教育期刊
新闻体育
学报刊物
水利/档案
核心期刊
农业/牧业
科技期刊
音乐/美术
工业期刊
煤炭/电力
经济期刊
其他刊物
您当前的位置:首页 > 科技期刊 > 正文
三个杂交蚂蚁种群的快速和可预测的基因组进化
发布时间:2022-12-21 11:25:21  来源:  【 】   浏览:
 
三个杂交蚂蚁种群的快速和可预测的基因组进化
 
皮埃尔·努豪 ,西蒙·马丁,比阿特丽斯·波蒂尼亚,维托尔·索萨,乔娜·库尔穆尼
发布时间:2022 年 12 月 20 日
 
抽象
杂交在野外很常见,但尚不清楚混合事件何时导致可预测的结果,如果是,在什么时间尺度上。我们表明,在3个杂交的Formica aquilonia × F中混合后,选择导致遗传变异的快速相关分类。多栉蚂蚁种群。在所有种群中,从有效种群规模最低的物种中去除祖先,与清除有害负荷一致。该过程由重组速率变化和功能位点密度调节。此外,在任何一个物种中具有正选择特征的单倍型更有可能在杂交种中固定。这些机制导致了具有可比血统比例的镶嵌基因组。我们的工作证明了自然界中混合后在短时间内的可预测演变。
 
引文: 努霍德 P、马丁 SH、波蒂尼亚 B、索萨 VC、库尔穆尼 J (2022) 三个杂交蚁种群的快速和可预测的基因组进化。公共科学图书馆生物学20(12): e3001914. https://doi.org/10.1371/journal.pbio.3001914
 
学术编辑: Leonie C. Moyle,印第安纳大学,美国
 
收到: 3月 11, 2022;接受: 11月 14, 2022;发表: 12月 20, 2022
 
版权所有: © 2022 努霍等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
 
数据可用性: 所有FASTQ文件都可以在项目PRJEB55288(混合样品)和PRJEB51899(F. aquilonia & F. polyctena samples)下的ENA上找到。VCF文件,FASTSIMCOAL2文件和脚本以及通过基因组窗口计算的统计数据可从figshare:https://doi.org/10.6084/m9.figshare.c.6140793.v3 获得。生物信息学和MSPRIME脚本可从 https://github.com/pi3rrr3/antmixture 获得。
 
资金: 这项工作得到了芬兰科学院(www.aka.fi)第328961号和HiLIFE(www2.helsinki.fi/en/helsinki-institute-of-life-science)对JK的资助。SHM得到了皇家学会大学研究奖学金URF\R1\180682(www.royalsociety.org)的支持。VCS得到了CEECINST/00032/2018/CP1523/CT0008和UIDB/00329/2020赠款(www.fct.pt)的支持。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
 
竞争利益: 提交人声明不存在相互竞争的利益。
 
缩写: AIC, 赤池信息标准;CDS, 编码序列;IO, 独立起源;MAC, 次要等位基因计数;MAF, 次要等位基因频率;PCA, 主成分分析;安全数据表, 十二烷基硫酸钠;SFS, 站点频谱;单核苷酸单核苷酸, 单核苷酸多态性;挥发性有机化合物 单一来源;TMRCA, 最近的共同祖先的时间
 
介绍
杂交很普遍,并塑造了许多现存物种的基因组,是进化新奇的主要来源[1-3]。了解杂交基因组的进化很重要,因为它可以揭示物种屏障是如何建立的,杂交的适应成本(例如,不相容性)和益处(例如,优势),并帮助我们更好地了解基因的功能及其相互作用[4]。在许多分类群中发现了沿杂交基因组的本地祖先模式的变化,包括向日葵[5],猴花[6],人类[7],剑尾鱼[8,9],麻雀[10],蝴蝶[11,12]和玉米[13]。当地血统的这种变异反映了重组与中性(例如漂移,迁移)和选择性过程的相互作用。选择可能导致固定(适应性渗入[1])或清除一个祖先成分(不相容性;一个杂交物种的遗传负荷[14,15])。重组速率变化可以调节选择的影响,例如,通过在低重组区域中更快地清除有害等位基因[14]。外加剂景观还受到过去人口统计和随机事件的影响,例如瓶颈或初始混合比例[16]。这些机制可导致杂交种群中给定位点上一个祖先成分的固定或接近固定,这一过程我们称之为遗传变异的分类(基因组稳定[5,12,17])。以前的一些研究调查了不同中性和选择性因子在多个混合事件中的相互作用,揭示了重复杂交种群中祖先变异的可预测分类[9,10,12]。然而,虽然理论预测对渗入变异的选择效率将迅速下降[7,15,18],但在野外混合后进行分类的时间尺度仍不清楚(但见[19])。
 
在这里,我们利用了2种木蚁Formica aquilonia和F之间的多个杂交种群。Polyctena用于测量混合基因组在野外的进化速度和可预测性,并确定决定这种可预测性的关键因素。这两个物种是一夫多妻制,每个巢多达数百个蜂王。种群是一个超级群体,有几十个相互连接的巢穴,个体之间的相关性很低[20]。尽管一夫多妻和超殖民物种种群内巢穴之间的分化程度较低,但种群之间的分化程度很高,这可能反映了萌芽是主要的传播模式(即步行分散并在已经建立的巢穴附近建造新巢穴,综述于[21])。长距离传播是通过暂时的社会寄生发生的,其中单个交配的女王(或可能很少)进入一个不相关的物种的巢穴,处决当地的女王,并利用当地的劳动力来抚养她的第一个育雏[21]。几种杂交F。具有不同线粒体序列×多栉种群先前已在芬兰南部进行了表征[22],为自然界中混合的结果提供了一个测试案例。
 
结果和讨论
我们从3个杂交种群(图1A,n = 39)生成了全基因组序列数据,并使用了在其重叠范围内和重叠范围内收集的两个物种的基因组(每个物种n = 10 [23];平均覆盖率:20.6×,S1表)。通过分析全基因组约160万个单核苷酸多态性(SNP),我们证实杂交群体在遗传上介于F之间。阿奎洛尼亚和F.多栉(图1B和1C以及S1和S1表)。邦凯里人和皮卡拉人都携带不同的F。aquilonia样有丝分裂型(图1D)。在Långholmen种群中观察到多栉水母样有丝分裂型(图1D),其中2个称为W和R的杂交谱系共存(S1图,[23])。这些谱系基本上共享一个有丝分裂型,可能通过环境依赖性遗传不相容性和分类交配来维持[24,25]。3个杂交群体具有高度分化的有丝分裂型(两个F之间有108个突变步骤)。阿奎洛尼亚样和F.多栉样簇,图1D)和核DNA(平均成对F圣杂交种群之间的估计范围为0.18至0.23),但种群内有丝分裂型的多样性较低(≤2)。这些结果与上述菌落建立过程中的种群瓶颈以及很少的长距离扩散一致。
 
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图1. 年轻、独立进化的杂交木蚁种群之间 F.阿奎洛尼亚和F.芬兰南部的多栉。
 
(A) 欧洲各地的采样点(eCH:东瑞士,wCH:西瑞士,自然地球地图基础图层:https://www.naturalearthdata.com/downloads/110m-physical-vectors)。(B) 46,886个核SNP的主成分分析(5 kbp稀释,MAC≥2)。PC1区分两个物种,PC2区分杂交种群。(C) 对 K = 2 和 K = 6 种群的个体血统系数的 sNMF 估计(交叉熵准则给出 K = 6 作为最佳 K,有关使用 sNMF 计算的详细混合比例,请参见 S1 表K = 2,LOTER和幼稚的染色体绘画输出)。(D)源自199个线粒体SNP的单倍型网络。 圆圈代表单倍型,其大小与其成正比。破折号表示突变步骤的数量,并提供数字 ≥5。黑色箭头表示 2 芬兰 F。携带F的多栉个体。阿奎洛尼亚样有丝分裂型。(E)F之间的掺合历史。阿奎洛尼亚和F.通过基于SFS的方法推断的polyctena。问号表示与混合模型相关的不确定性:参数估计在单一来源和独立来源情景下都是可比的,但单一来源模型支持在短暂的共同祖先之后分离杂交种群。Ne:单倍体数量的平均有效种群大小,m:迁移率。(F)使用FASTSIMCOAL2对每个种群对进行的模型选择分析的结果。SO:单一来源方案;IO:独立起源场景;IOm:混合后杂交种群之间迁移的独立起源情景。这个数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。MAC,次要等位基因计数;SFS,站点频谱;SNP,单核苷酸多态性。
 
https://doi.org/10.1371/journal.pbio.3001914.g001
 
为了阐明杂交种群的祖先和日期混合事件,我们使用基于核SNP的位点频谱(SFS)的合并方法(FASTSIMCOAL2 [26])重建了成对杂交种群的人口历史。聚结分析支持物种之间的混合比例平衡(即,没有明显的次要祖先;图1E和S2-S11表),在假设单个来源(SO,1个混合事件)或独立来源(IO,多个混合事件,S7-S11表)的情况下具有可比较的参数估计值。与现场观察一致,假设杂交事件发生在过去50代中,导致更高的可能性(与较早的混合事件相比),混合时间估计范围为14至47代前(S2-S11表)。模型选择为Bunkkeri-LångholmenW对的IO情景提供了更多支持(中位数相对可能性:LIO= 0.99, L所以= 0.01;图1F)和邦凯里—皮卡拉(LIO= 0.88, L所以= 0.10;图1F)以及朗霍尔门W—朗霍尔门R对(LIO= 0, L所以= 1.00;图 1F)。其余一对的结果尚无定论(Pikkala-LångholmenW: LIO= 0.43, L所以= 0.37;图 1F)。假设SO的模型的参数估计表明,即使杂交种群起源于单一的混合事件,它们也大多独立进化(自混合以来平均9.5代共同祖先,S7-S11表)。在混合事件之后,杂交种群之间或杂交种与两个物种之间均未推断出显着的基因流动(L乔恩在所有比较中<0.12,S7-S11表格和图1F)。 这些人口重建结果和线粒体变异模式与这些杂交种群起源的两种替代情景一致。它们要么是通过独立的杂交事件产生的,要么是建立了结合两个物种的几个母系的祖先杂交种群,并在<50代内分为3个地点,跨越60公里。考虑到木蚁的繁殖和传播生物学,我们建议独立混合事件(IO)作为更可能的情景,符合支持IO的模型选择进行2个种群比较。然而,我们承认准确地重建最近的事件具有挑战性,接下来我们会根据IO和SO场景评估我们的结果。
 
为了研究进化如何在混合后塑造杂交基因组,我们为每个杂交种群独立地绘制了沿染色体的祖先成分。为此,我们使用LOTER(图2A [27])推断了150万个分期SNP的本地血统,并使用TWISST量化了100-SNP窗口中的树拓扑权重(图2B [28])。杂交种群沿基因组具有强相关的混合景观(即,1个种群的局部血统预测另一个种群的本地血统,图2D和S3,Spearman的秩相关系数从TWISST权重计算得出,范围从0.51到0.62,P < 10−15对于所有种群对)。为了测试在中性下是否可以预期这种可预测性,我们使用MSPRIME [29]来模拟每个杂交种群对的SO和IO情景之后的中性混合事件,使用FASTSIMCOAL2推断的人口统计参数。在所有情况下(4 对种群× 2 种混合情景),中性模拟导致两个血统成分沿基因组的平衡贡献,但没有捕捉到基因组局部观察到的任一血统成分的明显偏差(即排序)与我们的经验数据(图 2C-2E,双样本柯尔莫哥罗夫-斯米尔诺夫检验,P < 10−15对于所有种群,S3 和 S4 无花果以及 S12 和 S13 表)。 因此,杂交种群之间的相关分选程度不能仅通过中性过程来解释,包括混合情景(SO与IO)和/或人口统计学历史。此外,基于SFS的人口统计模型(图1F)和杂交种群之间缺乏线粒体单倍型共享(图1D)都反对基因流作为观察到的并行性的潜在来源。因此,必须援引其他机制来解释不同杂交种群中分类和相关混合景观的快速演变。
 
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图2. 在3个杂交木蚁种群中,在中性下遗传变异的分类比预期的更相关。
 
(A)本地血统和(B)拓扑加权模式的示例(绿色:与F局部相关的杂交种。aquilonia,黄色:与F局部相关的杂交种。波利栉)在每个群体中沿 1 条假染色体独立推断(支架 13)。(C)在所有人群中,与模拟数据(IO,SO)相比,观测到的极端拓扑权重超过。与双样本柯尔莫哥罗夫-斯米尔诺夫检验(D,检验统计量和P,P值)相比的经验和模拟分布。(D)每个种群对之间拓扑加权差异的全基因组比较(Δ重量。: 阿奎洛尼亚F.polyctena 权重,按 14,890 个 100-SNP 窗口的每个种群计算,灰色圆圈)。回归线以白色表示。ρ,斯皮尔曼相关系数和P,斯皮尔曼相关检验的P值。(E)与所有群体中的模拟数据相比,观察到的基因组的更大比例被分类(排序以绝对F测量。阿奎洛尼亚或F。polyctena 加权,有关每个成对比较的详细结果,请参见 S3 图)。这个数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。IO,独立起源;所以,单一来源。
 
https://doi.org/10.1371/journal.pbio.3001914.g002
 
我们假设杂交种群中遗传变异的相关分类是由针对在具有最低有效种群大小(Ne [7,8,30,31])。预计这种效应在基因密集区域会更强[8,32],但在低重组区域[14]中也会更强,在这些区域,有害等位基因之间以及中性和有害等位基因之间更紧密的联系导致更大的祖先片段被移除。据估计,2种富美家物种的有效种群大小截然不同,氮含量低约30%e在F.多栉与F相比。过去200,000代的aquilonia([23],图1E)。在杂交种群中,在基因组的低重组区域以及基因丰富的区域中,分类(以下从给定位点的LOTER推断出的任一祖先成分的≥90%)更快(图3A和S5)。此外,在低重组区域,F.aquilonia血统在所有种群中优先固定(图3A)。专注于编码SNP,我们发现F的显着富集。所有种群的aquilonia血统全基因组一致,与杂交种群已经清除了F中积累的有害负荷的假设一致。聚栉,由于其较小的N。e(基因组排列,P < 0.002在所有群体中,图3B)。这些结果支持重组率变异和遗传负荷在促进杂交种祖先变异分类方面的贡献,正如之前在其他研究系统中所描述的那样(综述于[33])。我们的研究还表明,在小种群中,祖先变异的一致分类可以在不到50代的时间内发生(图1E)。
 
缩略图 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图3. 杂交种中祖先多态性的分类是由重组速率变异和遗传负荷驱动的。
 
(A)热图显示了每个杂交种群中排序的20 kbp窗口的比例和排序方向(祖先成分固定)作为重组速率和基因密度分位数的函数。(B)编码区域显著丰富为F。所有杂交种群的阿奎洛尼亚血统成分(P < 0.002)。对于每个群体(面板,与A相同)绘制局部祖先(y轴,0:F。阿奎洛尼亚等位基因固定,1:F。聚栉等位基因固定)作为CDS(x轴)内SNP分数的函数。使用500个基因组排列获得置信区间(灰色)(白线:置换方法的中位数)。这一数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。CDS,编码序列;SNP,单核苷酸多态性。
 
https://doi.org/10.1371/journal.pbio.3001914.g003
 
正向选择可能有助于杂交种群之间遗传变异的相关分类:来自任何一个物种的有利等位基因在混合后都可以重复扫过不同的杂交种群。在这种情况下,为F固定的基因组区域。杂交种中的阿奎洛尼亚血统成分将在F中显示选择的特征。阿奎洛尼亚个体。为了验证这一假设,我们在两种杂交物种中寻找与RAiSD的选择性扫描特征[34],RAiSD通过复合扫描统计μ量化了SFS的变化,连锁不平衡水平和沿基因组的遗传多样性(图4)。一致排序的基因组窗口(即,所有杂交种群中任一物种祖先的固定窗口,总体窗口的1.92%)仅在杂交种中祖先成分固定的物种中显示出显着更高的扫描统计量(基因组排列,P < 0.001,图4B)。虽然在这些一致分类的窗口中,重组率估计值明显低于基因组的其余部分(Wilcoxon检验,W = 1,740,660,P < 10−15),在低重组区域中清除负荷不能解释杂交种具有固定血统的观察结果,这些物种可能在杂交之前发生过扫描(图4B)。
 
thumbnail 下载:
.PPT幻灯片
.PNG大图
.TIFF原始图像
图4. 杂交物种中选择性扫描的特征预测了混合基因组中的排序方向。
 
(A) 在 F 中计算超过 20 kbp 窗口的选择性扫描统计量 (μ) 的分布。阿奎洛尼亚(左)和F.波利栉娜(右)。全基因组μ分布(灰色)和窗口中的观测值固定为 F。阿奎洛尼亚(n = 104 个窗口,绿色)或 F。所有杂交种群中的多栉树祖先成分(n = 98,黄色)。(B) 为任一 F 固定的窗口。阿奎洛尼亚(左)或F。所有杂交种群中的聚栉(右)血统成分均显著富集,F中具有高μ值。阿奎洛尼亚或F。分别是多栉属个体。这表明,在任何一个物种中具有正选择特征的单倍型更有可能在杂交种中固定。通过1,000个基因组排列获得模拟μ值(如[64])。每个圆圈表示在所有一致排序窗口(实心:观察、开放:模拟)上计算的中位数。这个数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。
 
https://doi.org/10.1371/journal.pbio.3001914.g004
 
杂交基因组为进化提供了强有力的见解,因为它们暴露在强大的、通常是相反的选择性力量之下[33]。在这项研究中,我们将混合历史的重建、局部祖先推断和聚结模拟结合起来,表明祖先变异的分类是可预测的,并且在某些情况下,可能在几个自然杂交蚂蚁种群中独立。一些可预测性先前已在其他系统中表征(例如,[9]),例如,在意大利麻雀[10]和Lycaeides蝴蝶的复制杂交种群中,与常染色体相比,性染色体上的渗入受到限制[12]。我们还记录了负选择和重组率变异之间的已知相互作用有助于杂交木蚁种群之间沿基因组的祖先成分显着相关性(Spearman使用TWISST的秩相关系数范围为0.51至0.62杂交木蚁,图2D)。由于杂交木蚁的血统比例是平衡的,因此负选择不应针对任何次要的血统成分,正如在不平衡的血统比例下和物种屏障高度多基因时所假设的那样(例如,[8])。相反,我们的结果表明,负选择正在影响有效种群规模较小的物种的祖先,并且可能具有更高的有害等位基因负荷。区分不相容性的特征与遗传负荷的特征以及它们可能的相互作用仍然是未来研究的挑战。
 
我们还首次表明,在混合之前进行正选择的事件可能有助于混合结果的可预测性(参见[35]的理论治疗):在1个杂交物种中显示选择性扫描特征的基因组区域倾向于在杂交种群中固定相同的祖先成分。这些基因组区域也可能作为不相容性,我们无法仅根据我们的数据来识别,但它们会影响杂交种的渗入景观[9],正如我们之前的研究系统所记录的那样[23,36]。未来,新的方法学发展[37,38]加上更大的样本量,可能允许识别杂交木蚁的候选不相容性。
 
最后,与最近关于杂交基因组进化的其他研究相比,蚂蚁杂交种在混合后约50代后仍然显示出平衡的祖先贡献。波动的、环境依赖性的选择可能是维持杂交种中两个祖先成分的一种机制,作为冷适应F的微卫星等位基因频率。在我们研究的一个杂交种群中,阿奎洛尼亚物种已被证明与16年期间的年温度呈正相关[25]。由于这种相关性在雄性中更强,单倍体是另一种可能有助于维持木蚁遗传变异的机制。总而言之,我们已经表明,由于正向和纯化选择,杂交基因组中祖先遗传变异的分类可以在混合后快速且可预测地发生。
 
方法
采样
F. 阿奎洛尼亚, F.polyctena和它们的芬兰杂交种是一夫多妻制:在一个巢穴中,繁殖努力由数十或数百个产卵女王分担。这两个物种及其芬兰杂交种也是超级殖民地,种群(即超级殖民地)由一个地点内的几个合作巢穴联合形成。一夫多妻制和超殖民性都导致给定人群中抽样个体之间的相关性较低[39]。我们从之前在芬兰南部绘制的3个种群中抽取了杂交个体:Långholmen(由2个杂交谱系R&W组成;[23])、邦凯里和皮卡拉[22]。我们从Bunkkeri(n = 10)和Långholmen(nW= 10, nR= 9)在2018年春季和来自Pikkala(n = 10)在2015年春季(S1表)。Portinha及其同事[40]生成的数据被用作F。阿奎洛尼亚和F.波利栉纳参考面板。简而言之,它由来自欧洲多个单特异性菌落的每个物种的10个工人(二倍体雌性)组成(图1A和S1表)。在瑞士(东部,n = 3;西部,n = 3)、奥兰群岛(芬兰,n = 3)和芬兰南部( n = 1)和F的两个地点收集了F. polyctena样品。在苏格兰(英国,n = 3),瑞士东部(n = 3),芬兰中部(n = 3)和芬兰南部(n = 1)收集了aquilonia样本。这两个物种在芬兰南部都是同源的,而在其他采样地点可以认为它们是异域的(它们在瑞士东部的不同海拔高度发现[40])。
 
脱氧核糖核酸提取
为本研究生成的混合样本和F.阿奎洛尼亚和F.来自Portinha及其同事[40]的polyctena样品同时进行处理和测序,所有数据都通过同一管道。用十二烷基硫酸钠(SDS)方案从全身中提取DNA,并使用Novogene(香港)的NEBNext DNA文库制备试剂盒(新英格兰生物实验室)构建测序文库。
 
DNA测序和读路定位
除非另有说明,否则所有软件均使用默认参数。对Illumina Novaseq 6000(150个碱基对,配对末端读段)进行全基因组测序,靶向每人15×(S1表)。我们使用 TRIMMOMATIC v0.38 修剪了原始的 Illumina 读取和适配器序列,并将修剪后的读取映射到 F。阿奎洛尼亚 × F.使用BWA MEM v0.7.17的polyctena参考基因组[41][41]。然后,我们使用PICARD TOOLS v2.21.4(http://broadinstitute.github.io/picard)删除了重复项。所有生物信息学脚本均可从 https://github.com/pi3rrr3/antmixture 获得。
 
SNP 调用和过滤
我们使用FREEBAYES v1.3.1(使用-k选项禁用群体先验[42])在所有样本中联合调用SNP,并使用VT v0.5对生成的VCF文件(多核苷酸变体的简约左对齐)进行归一化[43]。我们从插入缺失中排除了位于少于2个碱基对的位点,以及仅使用BCFTOOLS v1.10正向或反向读取支持的位点[44]。我们使用VCFLIB v1.0.1中的vcfallelicprimitive分解了多核苷酸变体。接下来的步骤是使用BCFTOOLS进行的。保留质量等于或高于30的双等位基因SNP。(i)基因型质量低于30和/或(ii)覆盖深度低于8的单个基因型被编码为缺失数据。所有样本中缺失数据超过50%的站点被丢弃。由于例如,由于未对齐的读段而导致的基因分型错误使用基于过度杂合性的过滤器去除。为此,我们使用了类似于Pfeifer及其同事[45]的方法,并将所有样本合并在一起,之后我们排除了显示杂合子过量的位点(P < 0.01,—来自VCFTOOLS v0.1.16 [46]的耐寒命令)。由于推定的遗传不相容性在杂交F时不应该是杂合的。阿奎洛尼亚和F.Polyctena 个体,他们不应该受到此过滤步骤的影响。总体而言,删除了122,044个位点,其中一半位于未锚定,重复丰富的重叠群上,并且在所有人群中显示杂合性≥0.48。然后,我们根据SNP位点的单个测序深度分布过滤位点,将其设置为深度低于所考虑个体平均值的一半或两倍的缺失位点。最后,所有样本中缺失数据超过15%的站点被丢弃。这些步骤导致了59个人的1,659,532个SNP的最终数据集。
 
人口结构
使用在变薄(每5 kbp保留1个SNP)和丢弃具有少量等位基因计数(MAC)<2的位点后获得的46,896个SNP的简化数据集评估种群结构。我们使用 PLINK v1.9 [47] 进行了主成分分析 (PCA),并使用 R v3.6.2 [49] 中的 LEA 软件包 v3.0.0 [48] 进行了 sNMF 聚类。对从 1 到 10 的许多祖先组件 (K) 进行聚类,每个 K 值执行 10 次迭代。在 K = 6 时获得最低的交叉熵,在 K = 2 和 K = 6 下以最低的交叉熵运行的结果如图 1C 所示。
 
丝型网络
线粒体SNP使用基于频率的方法(--池连续选项)与FREEBAYES单独调用。SNP过滤使用与核基因组相同的管道进行,这导致在59个个体中鉴定出199个双等位基因SNP。单个FASTA文件使用vcf共识编写,并与MAFFT v7.429保持一致[50]。中值连接网络是使用 POPART [51] 创建的。
 
人口统计建模
在重建混合历史之前,我们去除了位于第三条染色体上的122,479个SNP。该染色体携带一个超基因,控制富美家菌落是由1个还是多个蜂王(社会染色体[52])领导。2个超基因变异之间的重组还原导致富美家物种的祖先多态性得以维持,这可能会使我们的人口推断产生偏差。因此,用于人口统计建模的数据集包含 1,537,053 个 SNP。
 
我们使用FASTSIMCOAL2 v2.6中实施的复合似然法[26]将替代人口统计模型与Portinha及其同事[40]之后从SFS推断的人口学参数进行比较。我们运行每个模型 100 次,每次运行 80 次迭代以实现可能性最大化,并且预期的 SFS 通过每次迭代 200,000 次合并模拟近似值。我们假设突变率为3.5×10−9每代每个单倍体基因组的每血压,这是基于目前社会昆虫估计的平均值[53]。不允许人口增长,但人口规模可能会随着移民率的变化而变化。假设生成时间为2.5年[40]。最后,我们使用Portinha及其同事[40]推断的物种形成历史来约束人口统计模型中混合事件之前的参数范围。这个物种形成历史是从芬兰F推断出来的。阿奎洛尼亚和F.Polyctena个体,包括本研究中使用的个体。所有参数范围在 S2 表(三总体模型)和 S7 表(四总体模型)中表示。
 
实地观察表明,杂交种群可能是通过最近的混合(约50年前)产生的。限制50代(约125年前)以下的混合导致模型对所有杂交种群具有更高的预期可能性,并且S3-S6表中显示了约束和不受约束的结果。
 
弹性文件服务特性
我们使用次要等位基因频率(MAF)和下采样的基因型构建折叠的SFS,以尽量减少丢失的数据,使用 https://github.com/vsousa/EG_cE3c/tree/master/CustomScripts/Fastsimcoal_Example_Bootstrap/Scripts_VCFtoSFS 可用的R脚本。我们首先确定了所有站点的最小样本量(可用于重新采样的个体数量减去每个站点丢失数据的最大数量)。然后,我们在50 kbp窗口中对个体进行重新采样,并丢弃块,其中块内2个连续SNP之间的平均距离为<2 bp。我们根据多态性位点的比例和可调用位点的总数来估计单态位点的数量。后者是使用MOSDEPTH v0.2.9 [54]和为SNP调用定义的单个测序深度阈值从每个单独的BAM文件中获得的。
 
分别为我们的三群和四群模型构建了不同的3D和4D-SFS,以回答特定的研究问题(见下文)。在这两种情况下,我们都使用芬兰南部采样的每个物种的单个个体作为其各自物种的代表。对于每个混合群体,我们在每个窗口重新采样4个个体以构建SFS。3D-SFS包含两个物种和1个焦点杂交种群的信息,而4D-SFS包含两个物种和2个焦点杂交种群的信息。对于后一种模型,我们分析了4种不同的成对组合:Bunkkeri-LångholmenW,Pikkala-LångholmenW,Bunkkeri-Pikkala,最后是LångholmenW-LångholmenR。
 
二次接触与杂交的解开:三群体模型
对于每个混合人群,我们测试了3种可能导致当今混合个体的不同情景。第一种情况是杂交,即F之间的混合事件。聚栉和F.阿奎洛尼亚,其中一个物种将为杂交种群贡献α的遗传输入,而另一个物种将贡献剩余的1 - α部分。在混合(时间向前)后,在杂交种和其中一个(或两个)物种之间有和没有基因流动的情况下,对这种情况进行了评估。
 
第二种情况是二次接触,在物种形成事件之后,杂交祖先将首先从一个物种分化,然后接受来自另一个物种的(单倍体)迁移。此场景在两个方向上都进行了测试(即,假设两个方向((F.多栉,杂交),F.阿奎洛尼亚)和((F.阿奎洛尼亚,杂交种),F.波利栉)拓扑)。在杂交种群和第一个物种分裂之前和之后,两个物种之间的基因流动也是允许的。
 
第三种也是最后一种情况是三分叉模型,其中两个物种和杂交祖先种群首先同时分化,之后所有种群将以不同的速率交换移民。从这两个物种到杂交祖先种群的更高迁移将导致当今杂交种群中的混合个体。
 
解开杂交种群的单一起源和独立起源:四种群模型
通过单一的混合事件和长期的共同祖先产生的杂交种群将比在混合事件后不久分离或通过独立的混合事件产生的遗传变异具有更相关的分类。为了区分这些场景,我们一次使用 2 个混合群体测试了 2 种替代外加剂模型。根据我们的三种群模型的结果,在所有后续模型中,混合时间被限制为最后50代。
 
第一个模型是 SO 场景,其中 F.polyctena贡献了祖先杂交种群遗传物质的比例α,其中F。阿奎洛尼亚提供互补的1 - α分数。然后,这个祖先的杂交种群分化成2个杂交种群。
 
第二个模型是IO情景,其中每个杂交种群通过不同的混合事件产生,两个物种的贡献可能不同(即F。polyctena对第一个杂交种群的贡献为一小部分α,对第二个杂交种群的贡献为β,F.阿奎洛尼亚 1 - 分别为 1 - α 和 1 - β)。由于杂交种群之间的后混合基因流动也可能导致遗传变异的相关分类,我们另外测试了IO迁移(IOm)情景,其中包括最近一次混合事件后2个杂交种群之间的相互迁移。
 
型号选择
我们按照Excoffier及其同事[55],使用基于赤池信息标准(AIC)计算的相对可能性进行了模型选择,以解开每个混合种群对的SO,IO和IOm场景之间的问题。为了尽量减少连锁的影响,如前所述,观察到的SFS用于参数估计,但使用修剪后的数据集,在过滤每个杂交群体至少有4个基因型的位点后,每100个SNP(总共18,378个SNP)保持一次。我们计算了 100 个引导重复的 AIC,使用 https://github.com/vsousa/EG_cE3c/tree/master/CustomScripts/Fastsimcoal_Example_Bootstrap/Scripts_VCFtoSFS 可用的 R 脚本为每个 SNP 重新采样个体。对于每个自举重复,使用每个模型的最大似然估计值,根据模拟 100 次的平均预期 SFS 计算可能性,每个重复运行 200,000 次合并模拟。IO 和 SO 模型都有 8 个参数,而 IOm 模型有 10 个参数。
 
群体重组率估计
我们使用iSMC v0.0.23 [56]来估计基因组的群体重组率。我们假设杂交种的重组景观将是两个物种的重组景观的平均值。使用来自两个物种的所有非芬兰个体,我们拟合了一个具有重组的合并模型,包括40个TMRCA(到最近共同祖先的时间)间隔和10个ρ类别。在非重叠的20 kbp窗口上收集群体重组率估计值,丢弃少于20个SNP的窗口。
 
单倍型估计
在绘制祖先成分之前,我们使用WHATSHAP v1.0 [57]分阶段将所有锚定在支架(占基因组的78.2%)上的SNP,该版本使用配对末端读取中包含的短程信息。然后,我们使用SHAPEIT v4.1.2 [58]进行了统计阶段和插补,使用排序数据设置并增加MCMC迭代方案,如SHAPEIT文档中所示。总分阶段数据集包含 1,490,364 个 SNP。
 
外组信息
我们使用了F。exsecta 作为使用 TWISST 推断的根拓扑的外群(见下文)。该物种属于一个独特的物种组(F.解剖组)而F.阿奎洛尼亚和F.多栉都属于F。鲁法集团[59]。要提取 F。在我们的分期SNP位点解剖基因型,我们将Dhaygude及其同事[60]先前生成的数据与本研究中使用的相同参考基因组进行了映射。这些数据包括从50个(单倍体)雄性池生成的Illumina配对端,2×100 bp读数(总体9.89 Gbp,插入片段中位数:469 bp,ENA加入SAMN07344806)。读取使用与以前相同的参数使用 TRIMMOMATIC 进行修剪,使用 BWA MEM 映射,并使用 PICARD TOOLS 进行重复数据删除。我们使用SAMTOOLS v1.13过滤了映射质量为≥20(86.4%的读数,测序深度为14.5×)的正确读对[61]。我们生成了一个堆积文件(禁用每个碱基对齐质量计算并过滤最小碱基质量≥20),最后提取F。使用自定义 R 脚本在分阶段数据集的每个位点剖腹解剖基因型。
 
沿基因组绘制祖先成分
我们使用3种不同的方法来绘制基因组上的祖先变异,这些方法都依赖于由两个F组成的参考面板。阿奎洛尼亚和F.多栉属个体。随着基因从F.阿奎洛尼亚到F。在外加剂[40]之前,芬兰的polyctena可能会使我们的结果产生偏差,我们在从参考面板中排除了两种物种的芬兰代表后运行了所有3种方法(S1表)。
 
我们使用LOTER v1.0 [27]独立地从每个种群的阶段数据中进行局部血统推断,之后我们在用于种群重组率估计的相同非重叠20 kbp窗口上平均当地血统。
 
我们还使用分阶段数据用TWISST v0.2 [28]记录了沿基因组100-SNP窗口的拓扑权重。共同分析2个物种,外群F。一次剖分和 1 个混合种群,3 个有根拓扑是(图 2B):
 
(((F. aquilonia, hybrid), F.波利克特纳),外群),
(((F. polyctena, hybrid), F.阿奎洛尼亚),外群),
(((F. 阿奎洛尼亚, F.多晶石),杂交种),外群)。
由于第三种拓扑在所有杂交群体中全基因组的平均权重约为10%,因此我们通过减去第二种拓扑的权重来测量每个窗口的拓扑加权差异(F.polyctena 拓扑)到第一个拓扑的权重 (F.阿奎洛尼亚拓扑,图2C和2D)。得到的指标,Δ重量。,范围从 −1 到 +1(在给定窗口中,只有 F。多栉或F.分别推断出阿奎洛尼亚拓扑)。当 Δ重量。接近于零,两种拓扑具有相似的权重,我们将其解释为缺乏对杂交种祖先变异的排序。
 
最后,我们还从非分期基因型进行了“幼稚”染色体绘制方法。为此,我们首先丢弃了所有参考个体中缺失基因型超过2个的位点,之后我们确定了79,336个祖先信息SNP,显示两个物种之间的等位基因频率差异超过80%。
 
聚结模拟
我们使用聚结模拟来测量在重建的混合历史下每个杂交种群中预期的分拣水平。对于用于人口重建的每个种群对,我们模拟了IO和SO情景(4个种群对×2个情景)。我们使用每个情景下推断的参数与FASTSIMCOAL2(参数:散度和混合时间,Ne估计、大小变化、迁移速率和混合比例),并在 MSPRIME v1.0.2 中运行模拟 [29],对 100 个重组速率为 10 的 10 kbp 块进行建模−6在块内。每个模拟运行 100 次,VCF 文件通过 MSPRIME 生成,假设突变率为 3.5 × 10−9每代每个单倍体基因组的bp [53](S12和S13表以及S4图)。拓扑权重是使用TWISST和Δ直接从树序列计算的重量。如上所述,在所有100个重复中获得分布。MSPRIME脚本可从 https://github.com/pi3rrr3/antmixture 获得。
 
选择性扫描检测
我们使用完整数据集在RAiSD v2.9杂交物种中独立寻找选择性扫描的证据[34]。综合选择性扫描统计μ是使用每个物种的非芬兰个体的默认参数估计的。然后将结果平均在R中超过20 kbp的非重叠窗口(图4A)。
 
基因组排列方法
我们测试了(i)F富集的统计学意义。编码SNP的aquilonia血统(图3B)和(ii)分类方向与1个物种选择性扫描的证据之间的关联(图4B),使用类似的基于移位的循环排列方案,受Yassin及其同事的启发[62]。
 
对于第一次分析,我们将LOTER推断的本地祖先景观在SNP水平上滑动了100 kbp增量(即一次五个20 kbp窗口),保持了我们数据中观察到的祖先块的结构。对于每个转移重复,我们然后计算每个本地祖先箱中编码SNP的比例。对于此分析,我们运行了 500 个排列,P 值定义为班次重复的比例,其中至少达到了与我们的经验数据相似的编码 SNP 比例。图 3B 中绘制的第 95 个和第 99 个分位数是计算所有 500 个排列的。
 
在第二项分析中,我们将计算在20 kbp非重叠窗口上的平均局部血统值滑动了100 kbp增量,这也改变了排序窗口的位置。对于每个班次重复,我们然后独立计算了每个祖先成分在所有分类窗口全基因组范围内μ的中位数复合选择性扫描统计量。我们运行了 1,000 个排列,并将 P 值定义为偏移重复的比例,其中中值μ值至少与经验数据中观察到的一样高(图 4B)。
 
分选区域中功能位点的密度和基因含量
通过测量每个窗口落在编码序列(CDS)内的碱基对的比例,计算沿基因组20 kbp非重叠窗口的功能位点密度,这些位置是从GFF注释文件中提取的[63]。
 
202个排序窗口(定义为在所有杂交种群中≥显示90%的相同祖先成分,见图4)与364个基因模型相交;然而,TOPGO v1.0未检测到显著的基因富集[64]。
 
支持信息
主成分分析的前 5 个主成分的可视化在全基因组范围内进行了超过 46,886 个 SNP(5 kb 薄,MAC ≥ 2)。
 
显示 1/18: pbio.3001914.s001.tif
 
跳到无花果共享导航
https://ndownloader.figstatic.com/files/38614141/preview/38614141/preview.jpg
1 / 18
 
 
下载
无花果分享
S1 图 主成分分析的前 5 个主成分的可视化在全基因组范围内进行了超过 46,886 个 SNP(5 kb 薄,MAC ≥ 2)。
这个数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。
 
https://doi.org/10.1371/journal.pbio.3001914.s001
 
(提夫)
 
S2 图 祖先映射方法的比较。
对于每个杂交群体(列)显示TWISST Δ重量。统计量与 LOTER 本地血统估计值(第一行,14,890 个 100-SNP 窗口),TWISST Δ重量。统计与幼稚染色体绘画本地血统估计(PAINTING,第二行,5,529 个窗口,至少有 5 个血统信息 SNP),以及 LOTER 与幼稚染色体绘画当地血统估计值(第三行,5,529 个窗口,至少有 5 个血统信息 SNP)。Δ重量。如果窗口中的所有拓扑都将混合总体与 F 分组,则范围介于 −1 之间。阿奎洛尼亚,如果带F,则为+1。聚栉。LOTER和幼稚染色体绘画都是基于SNP的(结果在窗口上平均),并且F的代码祖先为0。阿奎洛尼亚和 1 代表 F。聚栉。在每个面板中,回归线以白色表示。ρ,斯皮尔曼相关系数和P,斯皮尔曼相关检验的P值。这一数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。
 
https://doi.org/10.1371/journal.pbio.3001914.s002
 
(提夫)
 
S3 图 每个杂交种群对(行)的观察(OBS)和模拟水平的本地血统相关性(左,每个点都是一条染色体)和排序(右)。
排序程度以绝对 F 来衡量。阿奎洛尼亚或F。多栉水母加权。IO:独立源方案,SO:单源方案(每个方案 100 个独立运行)。这个数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。
 
https://doi.org/10.1371/journal.pbio.3001914.s003
 
(提夫)
 
S4 图 每个混合种群对(行)的观测和模拟数据集的主成分分析。
根据图1获得观察到的PCA(5 kb稀薄的SNP数据,次要等位基因计数≥2)。使用msprime使用fastsimcoal2在单起源和独立起源情景下推断的参数估计值进行模拟,并假设突变率为3.5×10−9.每个模拟场景随机选取一个运行。这个数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。
 
https://doi.org/10.1371/journal.pbio.3001914.s004
 
(提夫)
 
S5 图
LOTER本地血统估计的分布(x轴,0:F固定。阿奎洛尼亚血统成分,1:固定为F。Polyctena 祖先分量)跨越每个杂交种群(列)中的重组率(上行)和基因密度(下行)四分位数,计算超过 20 kbp 非重叠窗口。中位数用黑点表示。这个数字背后的数据可以在 https://doi.org/10.6084/m9.figshare.c.6140793.v3 中找到。
 
https://doi.org/10.1371/journal.pbio.3001914.s005
 
(提夫)
 
S1 表。 研究中分析的每个样品的样品信息、测序统计、混合指数和入藏号。
在种姓栏中,w:工人和q:年轻的未交配女王。主成分坐标(PC1 和 PC2)和 F。aquilonia 外加剂比例(在 K = 2,sNMF_K2_Faq 下运行的 sNMF 聚类分析)均基于 MAC ≥ 2 的 46,896 个 SNP 的 5 kbp 细化数据集。HI_loter值基于1,490,364个阶段SNP,非芬兰物种样本用作参考面板。HI_paint值基于79,336个祖先信息标记,显示非芬兰物种样本之间的等位基因频率差异≥80%。
 
https://doi.org/10.1371/journal.pbio.3001914.s006
 
(三十)
 
S2 表。 人口统计模型分析中由fastsimcoal2估计的人口参数。
除非有界,否则可能会超出搜索范围的上限。每个模型仅使用这些参数的子集。用星号(*)表示的混合时间参数(TADMS)首先不受约束,然后约束以测试最近的杂交(<50代)。双星号 (**) 标记计算在模型之间更改的参数。备用最小和最大边界显示在相应的列中。
 
https://doi.org/10.1371/journal.pbio.3001914.s007
 
(三十)
 
S3 表。 所有模型的最大似然参数估计值与F的历史有关。阿奎洛尼亚 × F.在皮卡拉(包含348,228个地点)采样的多栉树杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测可能性为 −1,377,703.973。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s008
 
(三十)
 
S4 表。 所有模型的最大似然参数估计值与F的历史有关。阿奎洛尼亚 × F.在邦凯里(包含463,401个地点)采样的多栉杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测似然为 −1,821,814.189。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s009
 
(三十)
 
S5 表。 所有模型的最大似然参数估计值与F的历史有关。阿奎洛尼亚 × F.在LångholmenW(包含289,948个站点)采样的polyctena杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测可能性为 −1,144,658.203。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s010
 
(三十)
 
S6 表。 所有模型的最大似然参数估计值与F的历史有关。阿奎洛尼亚 × F.在LångholmenR(包含223,927个站点)采样的polyctena杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测可能性为 −883,471.568。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s011
 
(三十)
 
S7 表。 人口统计模型分析中由fastsimcoal2估计的人口参数。
除非有界,否则可能会超出搜索范围的上限。每个模型仅使用这些参数的子集。
 
https://doi.org/10.1371/journal.pbio.3001914.s012
 
(三十)
 
S8 表。 关于F历史的模型的最大似然参数估计。阿奎洛尼亚 × F.在邦凯里和皮卡拉(包含328,913个地点)采样的多栉鱼杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测可能性为 −1,509,459.108。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s013
 
(三十)
 
S9 表。 所有模型的最大似然参数估计值与F的历史有关。阿奎洛尼亚 × F.在Bunkkeri和LångholmenW(包含282,215个站点)采样的polyctena杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测可能性为 −1,291,308.181。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s014
 
(三十)
 
S10 表。 所有模型的最大似然参数估计值与F的历史有关。阿奎洛尼亚 × F.在Pikkala和LångholmenW(包含218,545个站点)采样的polyctena杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测可能性为 −1,001,623.462。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s015
 
(三十)
 
S11 表。 所有模型的最大似然参数估计值与F的历史有关。阿奎洛尼亚 × F.在LångholmenW和LångholmenR(包含150,207个站点)采样的polyctena杂交种群。
所有有效尺寸 (Ne) 以单倍体数给出。时间以代数给出。迁移率根据种群有效大小(2Nm)进行缩放。参数的最大似然估计值取自达到执行的 100 个游程中最高复合似然的运行。可能性以对数刻度给出。此数据集的最大观测可能性为 −693,262.061。ΔLikelihood 是通过从观察到的最大似然中减去预期似然来计算的。
 
https://doi.org/10.1371/journal.pbio.3001914.s016
 
(三十)
 
S12 表。 在每次比较中观察和模拟每个种群的多样性平均值(π)。
使用使用fastsimcoal2推断的两个模型(SO:单源情景,IO:独立原点情景)使用msprime生成模拟估计值。模拟估计值平均超过100次独立运行。
 
https://doi.org/10.1371/journal.pbio.3001914.s017
 
(三十)
 
S13 表。 观测和模拟的发散平均值(F圣)在每次比较中的种群之间。
使用使用fastsimcoal2推断的两个模型(SO:单源情景,IO:独立原点情景)使用msprime生成模拟估计值。模拟估计值平均超过100次独立运行。
 
https://doi.org/10.1371/journal.pbio.3001914.s018
 
(三十)
 
确认
我们感谢 G. Barroso 对 iSMC、SpecIAnt 小组的反馈和芬兰 CSC-IT 科学中心的计算资源的帮助。这项工作是在全球蚂蚁基因组学联盟下进行的。
 
引用
1.Oziolor EM, Reid NM, Yair S, Lee KM, Guberman VerPloeg S, Bruns PC, et al.适应性渗入使进化能够从极端环境污染中拯救出来。科学。2019;364:455–457.密码:31048485
查看文章PubMed/NCBI谷歌学术搜索
2.苏亚雷斯-冈萨雷斯 A, 莱克瑟 C, 克朗克 QCB.适应性渗入:植物视角。生物学杂志. 2018;14:20170688.密码:29540564
查看文章PubMed/NCBI谷歌学术搜索
3.Taylor SA,Larson EL.从基因组对自然界杂交的进化重要性和流行性的见解。Nat Ecol Evol.2019;3:170–177.密码:30697003
查看文章PubMed/NCBI谷歌学术搜索
4.鲍威尔 DL, 加西亚-奥拉扎巴尔 M, 基冈 M, 赖利 P, 杜 K, 迪亚斯-洛约, 等.自然杂交揭示了导致剑尾鱼黑色素瘤的不相容等位基因。科学。2020;368:731–736.pmid:32409469
查看文章PubMed/NCBI谷歌学术搜索
5.比尔克尔,里塞贝格LH。同倍体杂交种的基因组稳定率。演化。2008;62:266–275.密码:18039323
查看文章PubMed/NCBI谷歌学术搜索
6.Brandvain Y, Kenney AM, Flagel L, Coop G, Sweigart AL. Mimulus nasutus和Mimulus guttatus之间的物种形成和渗入。公共科学图书馆热内特。2014;10:e1004410.pmid:24967630
查看文章PubMed/NCBI谷歌学术搜索
7.哈里斯·尼安德特人渗入的遗传成本。遗传学。2016;203:881–891.密码:27038113
查看文章PubMed/NCBI谷歌学术搜索
8.舒默 M, 徐 C, 鲍威尔 DL, 杜瓦苏拉 A, 斯科夫 L, 霍兰德 C, 等.自然选择与重组相互作用,塑造杂交基因组的进化。科学。2018;360:656–660.密码:29674434
查看文章PubMed/NCBI谷歌学术搜索
9.兰登 QK, 鲍威尔 DL, 金 B, 班纳吉 SM, 佩恩 C, 道奇 TO, 等.杂交基因组当代进化中的可预测性和并行性。公共科学图书馆热内特。2022;18:e1009914.pmid:35085234
查看文章PubMed/NCBI谷歌学术搜索
10.Runemark A, Trier CN, Eroukhmanoff F, Hermansen JS, Matschiner M, Ravinet M, et al.杂交基因组形成的变异和限制。Nat Ecol Evol.2018;2:549–556.pmid:29335572
查看文章PubMed/NCBI谷歌学术搜索
11.Edelman NB, Frandsen PB, Miyagi M, Clavijo B, Davey J, Dikow RB, et al.基因组结构和渗入塑造了蝴蝶辐射。科学。2019;366:594–599.pmid:31672890
查看文章PubMed/NCBI谷歌学术搜索
12.Chaturvedi S, Lucas LK, Buerkle CA, Fordyce JA, Forister ML, Nice CC, et al.最近的杂交种概括了古代的杂交结果。纳特公社。2020;11:2179.密码:32358487
查看文章PubMed/NCBI谷歌学术搜索
13.Calfee E, Gates D, Lorant A, Perkins MT, Coop G, Ross-Ibarra J. 玉米和Teosinte沿海拔斜线的祖先渗入的选择性分类。公共科学图书馆热内特。2021;17:e1009810.pmid:34634032
查看文章PubMed/NCBI谷歌学术搜索
14.金比,胡贝尔CD,洛穆勒柯。有害的变异塑造了渗入的基因组景观。公共科学图书馆热内特。2018;14:e1007741.密码:30346959
查看文章PubMed/NCBI谷歌学术搜索
15.维勒 C, 埃德尔曼 NB, 穆拉利达尔 P, 诺瓦克马.针对内渗DNA的重组和选择。生物Rxiv。2021:846147.
查看文章谷歌学术搜索
16.杜兰顿M,池JE。自然选择和重组之间的相互作用塑造了渗入的基因组景观。分子生物学。2022:39. pmid:35666817
查看文章PubMed/NCBI谷歌学术搜索
17.Rieseberg LH, Raymond O, Rosenthal DM, Lai Z, Livingstone K, Nakazato T, et al.杂交促进野生向日葵的主要生态转变。科学。2003;301:1211–1216.密码:12907807
查看文章PubMed/NCBI谷歌学术搜索
18.巴顿新罕布什尔州。多位点斜线。演化。1983;37:454–471.密码:28563316
查看文章PubMed/NCBI谷歌学术搜索
19.马图特 DR, 科莫特 AA, 厄尔利 E, 塞拉托-卡普奇纳 A, 皮德 D, 蒙罗伊-埃克伦德 A, 等.两对果蝇物种之间混合种群的快速和可预测的进化。遗传学。2020;214:211–230.密码:31767631
查看文章PubMed/NCBI谷歌学术搜索
20.Pamilo P. 一妻多夫制和等位基因频率差异在蚂蚁Formica aquilonia中两性之间。遗传。1993;70:472–480.
查看文章谷歌学术搜索
21.Maeder A, Cherix D, Bernasconi C, Freitag A, Ellis S. Wood ant生殖生物学和社会系统。木蚁生态与保护.剑桥大学出版社;2016.第37–50页。
22.贝雷斯福德 J, 埃利亚斯 M, 普鲁克罗斯 L, 松德斯特伦 L, 巴特林 RK, 帕米洛 P, 等.芬兰南部土墩木蚁内部的广泛杂交导致细胞核错配和性别特异性杂交分解的可能性。分子生态学 2017;26:4013–4026.密码:28503905
查看文章PubMed/NCBI谷歌学术搜索
23.Kulmuni J,Seifert B,Pamilo P.分离畸变导致杂交蚂蚁中雄性和雌性基因组之间的大规模差异。美国国家科学院院刊,2010;107:7371–7376.密码:20368452
查看文章PubMed/NCBI谷歌学术搜索
24.库尔穆尼 J, 努霍德 P, 普鲁克罗斯 L, 萨托坎加斯 I, 达伊古德 K, 布特林 RK.木蚁物种形成背后的候选屏障位点自然选择的不稳定性。分子生态学 2020;29:3988–3999.密码:32854139
查看文章PubMed/NCBI谷歌学术搜索
25.Martin-Roy R, Nygård E, Nouhaud P, Kulmuni J. 亲本物种之间热耐受性的差异可能促进杂交木蚁的热适应。美国国家 2021;198:278–294.密码:34260873
查看文章PubMed/NCBI谷歌学术搜索
26.Excoffier L, Marchi N, Marques DA, Matthey-Doret R, Gouy A, Sousa VC.FastSimcoal2:复杂进化情景下的人口推断。生物信息学。2021. pmid:34164653
查看文章PubMed/NCBI谷歌学术搜索
27.迪亚斯-阿尔维斯 T, 迈拉尔 J, 布鲁姆 MGB.Loter:一个软件包,用于推断各种物种的本地血统。分子生物学。2018;35:2318–2326.pmid:29931083
查看文章PubMed/NCBI谷歌学术搜索
28.Martin SH,Van Belleghem SM.使用拓扑加权探索基因组中的进化关系。遗传学。2017;206:429–438.密码:28341652
查看文章PubMed/NCBI谷歌学术搜索
29.Kelleher J, Etheridge AM, McVean G. 大样本量的高效聚结模拟和谱系分析。公共科学图书馆计算生物学. 2016;12:e1004842.密码:27145223
查看文章PubMed/NCBI谷歌学术搜索
30.Bierne N, Lenormand T, Bonhomme F, David P. 杂交区的有害突变:突变负荷能否降低基因流动的障碍?基因研究 2002;80:197–204.pmid:12688658
查看文章PubMed/NCBI谷歌学术搜索
31.尤里克一世,埃施巴赫,库普·针对尼安德特人渗入的选择强度。赖希D,编辑。公共科学图书馆热内特。2016;12:e1006340.密码:27824859
查看文章PubMed/NCBI谷歌学术搜索
32.马丁 SH, 戴维 JW, 萨拉查 C, 吉金斯 CD.重组速率变异塑造了蝴蝶基因组渗入的障碍。莫伊尔L,编辑。公共科学图书馆生物学 2019;17: e2006288.密码:30730876
查看文章PubMed/NCBI谷歌学术搜索
33.莫兰 BM, 佩恩 C, 兰登 Q, 鲍威尔 DL, 布兰德万 Y, 舒默 M.杂交的基因组后果。生活。2021;10:e69016.pmid:34346866
查看文章PubMed/NCBI谷歌学术搜索
34.Alachiotis N, Pavlidis P. RAiSD基于选择性扫描和SNP载体的多个特征检测正选择。通讯生物学. 2018;1:79.pmid:30271960
查看文章PubMed/NCBI谷歌学术搜索
35.萨奇德瓦 H,新罕布什尔州巴顿。链接下渗入的可复制性。多基因选择。遗传学。2018;210:1411–1427.
查看文章谷歌学术搜索
36.Kulmuni J,Pamilo P.杂交蚂蚁的渗入在雌性中受到青睐,但在雄性中被选中。美国国家科学院院刊,2014;111:12805–12810.密码:25136088
查看文章PubMed/NCBI谷歌学术搜索
37.布兰卡特 A,支付者 BA。使用来自杂交群体的基因组序列发现杂交不相容性。分子生物学。2021;38:4616–4627.密码:34097068
查看文章PubMed/NCBI谷歌学术搜索
38.李J,舒默M,银行C.杂交群体中重组单倍型的不平衡分离揭示了染色体间和染色体内的Dobzhansky-Muller不相容性。公共科学图书馆热内特。2022;18:e1010120.密码:35344560
查看文章PubMed/NCBI谷歌学术搜索
39.Sundström L, Seppä P, Pamilo P. Formica 蚂蚁的遗传种群结构和传播模式—综述.安·祖尔·芬尼奇。2005;42:163–177.
查看文章谷歌学术搜索
40.波蒂尼亚 B, 艾薇儿 A, 贝纳斯科尼 C, 海兰特拉 H, 莫纳汉 J, 塞弗特 B, 等.对多个木蚁种群对的全基因组分析支持相似的物种形成历史,但不同程度的基因流动,跨越其欧洲范围。分子生态学 2022;31:3416–3431.
查看文章谷歌学术搜索
41.Li H, Durbin R. 使用Burrows-Wheeler变换进行快速准确的长读长对齐。生物信息学。2010;26:589–595.pmid:20080505
查看文章PubMed/NCBI谷歌学术搜索
42.Garrison E,Marth G.基于单倍型的短读长测序变异检测。arXiv[q-bio.GN]。2012. 可用自: http://arxiv.org/abs/1207.3907.
查看文章谷歌学术搜索
43.Tan A, Abecasis GR, Kang HM. 遗传变异的统一表示.生物信息学。2015;31:2202–2204.pmid:25701572
查看文章PubMed/NCBI谷歌学术搜索
44.Danecek P, Bonfield JK, Liddle J, Marshall J, Ohan V, Pollard MO, et al.十二年的SAMtools和BCFtools。千兆科学。2021:10. pmid:33590861
查看文章PubMed/NCBI谷歌学术搜索
45.Pfeifer SP, Laurent S, Sousa VC, Linnen CR, Foll M, Excoffier L, et al.内布拉斯加州鹿鼠的进化史:面对强基因流的局部适应。分子生物学。2018;35:792–806.密码:29346646
查看文章PubMed/NCBI谷歌学术搜索
46.Danecek P, Auton A, Abecasis G, Albers CA, Banks E, DePristo MA, et al.变体调用格式和 VCF 工具。生物信息学。2011;27:2156–2158.密码:21653522
查看文章PubMed/NCBI谷歌学术搜索
47.Chang CC, Chow CC, Tellier LC, Vattikuti S, Purcell SM, Lee JJ. 第二代 PLINK:迎接更大、更丰富的数据集的挑战。千兆科学。2015;4:7.密码:25722852
查看文章PubMed/NCBI谷歌学术搜索
48.Frichot E,François O. LEA:用于景观和生态关联研究的R包。方法生态学.2015.
查看文章谷歌学术搜索
49.R 核心团队。R:统计计算的语言和环境。奥地利维也纳;2019. 可从: https://www.R-project.org/.
50.MAFFT多序列比对软件版本7:性能和可用性的改进。分子生物学。2013;30:772–780.密码:23329690
查看文章PubMed/NCBI谷歌学术搜索
51.Leigh JW,Bryant D. Popart:用于单倍型网络构建的全功能软件。方法生态学.2015;6:1110–1116.
查看文章谷歌学术搜索
52.布雷尔斯福德 A, 珀塞尔 J, 艾薇儿 A, 陈文 P, 张 J, 布鲁奇 T, 等.一种古老而被侵蚀的社会超级基因在富美家蚂蚁中广泛存在。当代生物学. 2020;30:304–311.e4.密码:31902719
查看文章PubMed/NCBI谷歌学术搜索
53.刘海, 贾茹, 孙晓, 田德, 赫斯特, 杨 S. 直接测定大黄蜂突变率揭示了弱重组相关突变的证据和昆虫中近似速率恒定性。分子生物学。2017;34:119–130.pmid:28007973
查看文章PubMed/NCBI谷歌学术搜索
54.Pedersen BS,Quinlan AR. Mosdepth:基因组和外显子组的快速覆盖计算。生物信息学。2018;34:867–868.密码:29096012
查看文章PubMed/NCBI谷歌学术搜索
55.Excoffier L,Dupanloup I,Huerta-Sánchez E,Sousa VC,Foll M.来自基因组和SNP数据的稳健人口推断。公共科学图书馆热内特。2013;9:e1003905.pmid:24204310
查看文章PubMed/NCBI谷歌学术搜索
56.巴罗佐G,普佐维奇N,杜泰尔JY。从一对基因组推断重组图谱及其在古代样本中的应用。公共科学图书馆热内特。2019;15:e1008449.密码:31725722
查看文章PubMed/NCBI谷歌学术搜索
57.Martin M, Patterson M, Garg S, Fischer SO, Pisanti N, Klau GW, et al.WhatsHap:快速准确的基于读取的阶段。生物Rxiv。2016:085050.
查看文章谷歌学术搜索
58.德拉诺 O, 扎古里 J-F, 罗宾逊 MR, 马尔基尼 JL, 德米扎基斯 ET.准确、可扩展和综合的单倍型估计。纳特公社。2019;10:5436.密码:31780650
查看文章PubMed/NCBI谷歌学术搜索
59.博罗维茨,盖普SP,拉伯林·全球系统发育揭示的富美家蚂蚁社会寄生的进化。美国国家科学院院刊,2021:118。密码:34535549
查看文章PubMed/NCBI谷歌学术搜索
50米达伊古德 K, 奈尔 A, 约翰逊 H, 乌尔姆 Y, 松德斯特伦 L.蚂蚁Formica exsecta及其沃尔巴克氏体内共生体的基因组初稿揭示了从内共生体到宿主的广泛基因转移。BMC Genom.2019;20:301.pmid:30991952
查看文章PubMed/NCBI谷歌学术搜索
61.李H, 汉德克 B, 威索克 A, 芬内尔 T, 阮 J, 荷马 N, 等.序列对齐/映射格式和 SAMtools。生物信息学。2009;25:2078–2079.密码:19505943
查看文章PubMed/NCBI谷歌学术搜索
62.亚辛 A, 德巴特 V, 巴斯蒂德 H, 吉达谢夫斯基 N, 大卫 JR, 池 JE.在岛上果蝇种群中对有毒水果的反复特化。美国国家科学院院刊,2016;4771–4776。密码:27044093
查看文章PubMed/NCBI谷歌学术搜索
63.Nouhaud P,Beresford J,Kulmuni J.来自单倍体雄性的杂交Formica aquilonia×F. polyctena Ant基因组的组装。J 赫里德。2022;113:353–359.
查看文章谷歌学术搜索
64.Alexa A,Rahnenfuhrer J,Lengauer T.通过去关联GO图结构改进了基因表达数据中官能团的评分。生物信息学。2006:1600–1607.密码:16606683
查看文章PubMed/NCBI谷歌学术搜索
 
上一篇:如何发表体育科研论文

下一篇:孕期最佳分娩方式:使用国家生命统计数据进行个性化预测
咨询方式

 ---->>学术源论文咨询发表网
 ---->>咨询QQ:854727998 
 ---->>电话:
   
13889158687(微信同号)

 ---->>邮箱:lunwen133@163.com
投稿写明所投期刊,3日内回复.五日未回复可电话咨询。

工作时间:8:00-17:00   周六值班、周日休息,国家法定假日休息

学术焦点 更多>>

《健康必读》省级医学月刊 当月发
《医药前沿》国家级医学月刊 ISS
《中国健康月刊》国家医学月刊-是
《才智》省级教育类月刊-CN22-13
《商情教育经济研究》省级教育类月
《考试周刊》省级教育类月刊/国内
《科教导刊》省级教育类旬刊 ISS
《文艺生活》省级教育类月刊 ISS
学术推荐 更多>>

《中小学电教

     《中小学电教》:省教育厅主管,省电教馆主办。国内统一刊号:C

《文艺生活》

     《文艺生活》杂志是经中华人民共和国新闻出版总署批准,由湖南省

《黑龙江科技

     《黑龙江科技信息》杂志是经国家科技部和国家新闻出版总署批准在
首页   -   关于我们   -   联系我们   -   发表流程   -   网站声明   -   在线投稿   -   友情链接

咨询电话 13889158687(微信同号)  QQ咨询:854727998


投稿邮箱:lunwen133@163.com
学术源论文发表咨询网 www.xueshuyuang.com  备案号:
闽ICP备2021001903号-2
版权所有  学术源论文发表咨询网