学术源论文发表咨询网 公告: 首页 - 网站声明 - 在线投稿 - 发表流程 - 联系我们 - 加入收藏
医学期刊
建筑期刊
教育综合
计算机类
教育期刊
新闻体育
学报刊物
水利/档案
核心期刊
农业/牧业
科技期刊
音乐/美术
工业期刊
煤炭/电力
经济期刊
其他刊物
您当前的位置:首页 > 医学期刊 > 正文
厦门评职称发表论文-简单的缩放定律控制着人类复杂性状的遗传结构
发布时间:2025-10-18 10:03:07  来源:  【 】   浏览:
厦门评职称发表论文-简单的缩放定律控制着人类复杂性状的遗传结构
尤瓦尔·西蒙斯 ,哈哈马内什·穆斯塔法维,朱惠生,考特尼·史密斯,乔纳森·普里查德 ,盖伊·塞拉
发布时间:2025 年 10 月 13 日
 
抽象
全基因组关联研究表明,复杂性状的遗传结构差异很大,包括显着命中的数量、效应大小和等位基因频率。然而,目前我们缺乏一种原则性的方式来理解性状之间的异同。在这里,我们描述了一个概率模型,该模型将各个位点的突变、漂移和稳定选择的影响与表型变异的基因组规模模型相结合。在这个模型中,性状的结构源于突变选择系数的分布和两个缩放参数。我们将此模型拟合到来自英国生物样本库的 95 个不同种类的高度多基因定量性状。值得注意的是,我们推断所有这些特征都具有相当相似但不相同的选择系数分布。这种相似性表明,高度多基因性状结构的差异主要源于两个缩放参数:突变靶标大小和每个位点的遗传力,它们在性状之间存在数量级差异。当考虑这两个尺度因子时,我们发现所有 95 个特征的架构都非常相似。
 
数字
Fig 7Fig 1Fig 2Fig 3Fig 4Fig 5Fig 6Fig 7Fig 1Fig 2Fig 3
   
引文: Simons YB、Mostafavi H、Zhu H、Smith CJ、Pritchard JK、Sella G (2025) 简单缩放定律控制人类复杂性状的遗传结构。公共科学图书馆生物学 23(10): 电子3003402号。 https://doi.org/10.1371/journal.pbio.3003402
 
编辑 器: Greg Gibson,佐治亚理工学院,美利坚合众国
 
收到: 2025 年 8 月 10 日;接受: 2025 年 9 月 5 日;发表: 10月 13, 2025
 
版权所有: © 2025 Simons 等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
 
数据可用性: 作者确认,研究结果所依据的所有数据都是完全可用的,不受限制。代码可在 https://github.com/YuvalSimons/Scaling 获得。图数据可在 https://doi.org/10.5281/zenodo.17041176 获得。
 
资金: 这项工作得到了美国国立卫生研究院 (https://grants.nih.gov/) 的支持:R01 HG008140 和 JKP 的R01HG011432;R01GM115889 to GS;并F32HG011202到 YBS。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。
 
利益争夺: 提交人声明不存在竞争利益。
 
介绍
遗传学的一个中心目标是了解遗传变异如何映射到表型变异。从 20 世纪末开始,在识别孟德尔性状的基因方面取得了巨大进展。但人类的大多数表型变异在遗传上是复杂的,直到最近15年,全基因组关联研究(GWAS)才开始揭示各种复杂性状变异的遗传基础[1]。这些研究现已确定遗传变异与各种性状和疾病之间存在数以万计的强有力关联。
 
这项工作的一个有趣的观察是复杂性状之间遗传结构的显着差异[2\u20125]。(在这里,我们使用术语“架构”来指因果变异的数量及其等位基因频率和效应大小的联合分布。已发现遗传结构的各个方面性状都存在差异,包括:在给定样本量下发现的重要信号的数量和大小[6];先导GWAS信号解释的遗传力分数[3];显著变异的等位基因频率分布[4,7];致病变异的估计数量[8,9];以及基于SNP的遗传力[10,11]。
 
尽管如此,不同的特征确实显示出重要的相似之处。首先,大多数复杂性状都受到大量影响较小的变异的影响,在当前样本量下,只有一小部分变异可以可靠地检测到[12\u201214]。事实上,即使是相对“简单”的复杂性状(例如分子生物标志物)也是高度多基因的,约104因果变异在整个基因组中广泛分布,而约105或身高或BMI等性状的更多变异[2,9,15\u201217]。
 
其次,使用正态分布等标准建模假设,因果变异的效应大小分布不能很好地拟合。相反,效应大小通常跨越几个数量级,很像幂律分布[18\u201219]。
 
第三,性状相关变异通常具有高度多效性:即,它们同时影响许多性状。许多性状对显示出显着的遗传相关性,表明等位基因影响通常是共享的[16,20,21];此外,每当不同的性状通过重叠的细胞类型或途径介导时,即使效应方向不相关,我们也可以预期它们将共享许多相同的调控变异[5,14,16,22]。
 
第四,选择在塑造复杂性状结构中起着核心作用。进化论和经验证据表明,具有表型效应的变异通常会被选择,特别是对于效应较大的变异,这种选择通常更强[23]。与此一致的是,具有较大效应量的变异往往具有较低的频率,这表明选择阻止了此类变异达到高频[24\u201226]。由于遗传力取决于效应大小和等位基因频率,因此一个重要的结果是,对性状最重要的基因对遗传力的贡献低于在没有选择的情况下预期的,从而使基因之间的遗传力分布趋于平缓[17,27,28]。
 
在这里,我们开发了一种原则性方法来理解遗传结构的异同。具体来说,我们想了解突变、选择和漂移的群体遗传过程以及个体性状的特性如何决定变异的数量,以及等位基因频率和效应大小的联合分布。这些过程的哪些特征在性状之间是共享的?哪些不同?因此,遗传结构的哪些特征在性状之间是共享的或不同的?
 
为了回答这些问题,我们需要一个模型来了解群体遗传过程如何塑造复杂的性状结构。目前的模型主要不同之处在于它们对等位基因选择(或其频率)与这些等位基因对感兴趣性状的影响大小之间的关系的假设[23]。为估计SNP遗传力而开发的启发式“α模型”假设等位基因频率和效应大小之间存在特定的参数关系[25,29,30]。虽然α模型是由观察到的效应大小和频率之间的反比关系驱动的,但精确的函数形式是任意的。反过来,一些进化模型假设等位基因选择强度与其效应大小之间存在特定的参数关系,然后依靠显式群体遗传学模型来推导出等位基因频率和效应大小与遗传结构其他方面之间的关系[31\u201236]。然而,这些模型在对架构的预测上有所不同,因为它们假设了各种临时参数关系。
 
Simons等人(2018)引入了一种进化模型,该模型超越了临时选择,在明确、可解释的生物学模型下推导出等位基因选择及其对性状的影响之间的关系[27]。由于大量证据表明许多数量性状都受到稳定选择的影响,其中适应性随着与最佳性状值的位移而下降[23,37,38],并且影响一个性状的遗传变异通常会影响许多其他性状[5,16,22],他们对多维性状空间中稳定选择产生的等位基因进行选择建模。然后,他们使用显式群体遗传模型推导出了在多维性状空间中具有突变、遗传漂变和稳定选择的焦点性状的遗传结构。
 
正如我们将在下一节中展示的那样,Simons 等人的模型可以重新构建为连续复杂性状的遗传结构的生成(统计)模型,这取决于一些生物学上可解释的参数。接下来,我们将描述如何推断这些参数并根据GWAS的数据测试模型拟合。将我们的推理应用于来自英国生物样本库的 95 个不同种类的高多基因定量性状,我们表明该模型与数据非常拟合。令人惊讶的是,我们发现性状之间结构的大多数差异仅由两个缩放参数的差异来解释:突变靶标大小和每个位点的遗传力。
 
结果
复杂性状的群体遗传模型。作为起点,我们假设表型变异存在于稳定选择下的高维性状空间中。在这里,我们概述了模型的关键要素;更多细节和生物学动机可以在S1注释和[23,27]中找到。
 
我们将每个人的表型建模为 n 维特征空间中的一个点,并假设该维度很高 ()。为了对稳定选择进行建模,我们假设存在最优表型,并且适应度随着与最优的欧几里得距离而降低(图1A)。
 
thumbnail 下载:
PPT的PowerPoint 幻灯片
巴布亚新几内亚大图
蒂夫原图
图1. 模型。
 
(A) 我们使用费舍尔的多维特征空间概念。在稳定选择下,个体的适应性随着与最佳表型的距离而下降[40]。(B) 变体所经历的选择系数与所有性状的平方效应之和成正比。(C) 我们计算以 s 和人口统计为条件的衍生等位基因频率 (q) 的分布。(D)性状1的效应大小分布(b1) 给定 s 呈正态分布。(E) 在任何给定站点的 q、β 和观察到的 Z 分数的生成模型。在C和D中,有效中性、中度和强选择的曲线对应于和10−2分别。
 
https://doi.org/10.1371/journal.pbio.3003402.g001
 
每个变体的表型效应由 n 维性状空间中的随机向量表示,即 ,其中 b我是衍生等位基因对第 i 个性状的累加效应。我们假设一个人的表型是根据n维标准加性模型的基因型产生的:它是所有变异效应的向量和加上代表环境效应的随机向量[39]。
 
到目前为止,该模型在数学上与Fisher的几何模型[40]相似,Fisher和其他人用它来研究适应性过程[41],但我们考虑了一个不同的问题和不同的进化环境。我们专注于在突变、多维性状空间中的稳定选择和遗传漂变之间平衡中出现的单个高度多基因性状的遗传结构。
 
个别位点的突变、选择和漂移。每一代,突变都会以每个位点、每个配子、每代μ的速度将新的影响性状的变异引入种群。变异株的长期命运是由选择和漂移的共同作用决定的。
 
在稳定选择下,在平衡状态下,选择使种群的表型平均值非常接近最佳表型,因此对突变(以及一般变异)起作用。作用于变体的选择强度 s 与其在 n 维性状空间中的平方大小成正比(图 1B):
 
 
(1)
以反映适应度函数的宽度在最优附近。
 
给定 s,我们可以计算当今的等位基因频率分布,如下所示。当性状受到稳定选择的影响时,个别位点的选择显性不足,这意味着无论影响方向如何,选择都会作用于次要等位基因[27,42,43]。在强选择位点,这近似于针对有害等位基因的标准选择模型。具体来说,给定当前衍生的等位基因频率 q 在单代中常染色体位点的等位基因频率的预期变化是
 
 
(2)
同时,等位基因频率变化的方差,即漂移,与种群规模成反比[44]。因此,当今等位基因频率的分布是一个随机过程的结果,包括过去的突变、选择和漂移——这取决于种群规模的历史。为了进行分析,我们使用对英国人口估计的人口统计学模型计算了稳定选择模型下当今等位基因频率的分布[45]。正如预期的那样,强选择的变体(大 s)往往很少见,而接近中性的变体(小 s)可能会漂移到高频(图 1C)。
 
选择和效应大小之间的关系。接下来,我们需要了解多维性状空间中的选择如何与感兴趣的单个焦点性状的遗传结构相关。在不失去通用性的情况下,我们专注于 n 维特征空间中的第一个维度,为了简化符号,我们表示效应大小 b1性状 1 上的变体简单地称为 b。
 
从因果关系上讲,效应大小决定了选择系数。然而,由于我们要描述频率和效应大小的协同分布,因此我们需要反转这种关系:具体来说,我们需要给定 s 的特征 1 上的效应大小的条件分布。这种条件分布反映了如果我们只知道 s(或等效的)则投影到第一个维度上的不确定性。幸运的是,当性状数量足够多时,这种条件分布可以通过正态分布很好地近似(参见 [27] 和 S1 注释中的第 1.3 节),即:
 
 
(3)
哪里。直观地说,弱选择(小 s)下的变体往往具有较小的平方效应大小 (b2)和强选择下的变体(大s)往往具有更大的平方效应大小(图1D)。
 
给定 s 的 b 和 q 的分布,我们现在可以计算每个位点对表型方差的预期贡献作为 s 的函数,由 E[2b 给出2q(1 − .在非均衡人口统计下,期望没有简单的形式,但它绘制在 S1 注释的图 B 中。在选择较弱的地点,b2很小,这些位点对加性遗传变异贡献很小。当选择性强时,b2很大,但选择保持q(1-q)较低,并且这些效应被抵消,因此这些位点在贡献程度方面受到限制[27]。
 
单点动力学和遗传力。从单个位点转向全基因组模型,让 L 是基因组中突变可以影响性状 1 的位点数量(更准确地说,我们要求突变具有超过某个预定义小值的效果);我们将 L 称为突变靶标大小。我们使用 f(s) 来表示这些 L 位点突变选择系数的未知分布。然后,性状 1 的预期总加性遗传方差由下式给出
 
 
(4)
接下来,我们将 b 从原始但任意的测量单位重新缩放为性状值的标准差单位:我们定义 ,其中 是表型方差。将两边除以 ,并注意这是(狭义)遗传力 h2,我们可以将遗传力与站点级参数联系起来:
 
 
(5)
该方程表达了遗传力(h2)、突变靶标大小 (L) 以及对每个位点方差的预期贡献。
 
最后,可以根据β和群体遗传学参数重写式 3(有关详细信息,请参阅 S1 注中的第 1.5 节):
 
 
(6)
其中 k 是一个常数,取决于 f(s) 和人口统计学,约为 1,μ 是突变率。至关重要的是,方程 6 显示该性状每个位点的遗传力,h2/L,是一个基本的缩放因子,它将等位基因的选择与它们对性状的影响联系起来。
 
这些结果共同为复杂性状的遗传结构提供了生成模型(图1E)。假设每个位点的人口统计学历史和突变率是预先已知的,则该模型根据三个未知数完全指定:突变靶标大小,L;每个站点的遗传力,h2/L;和选择系数的分布,f(s)。我们现在描述如何从 GWAS 数据中估计这些数据。
 
从GWAS数据推断模型参数。原则上,我们希望使用所有因果变体进行推理,但这在技术上具有挑战性,因为大多数因果位点的效应量非常小;因此,哪些部位是因果关系及其真实效应大小存在很大的不确定性。作为一种易于处理的替代方案,我们将推断限制在每个性状的独立全基因组显着命中。我们在推理中解释了这一限制,指出我们只观察到绝对 GWAS z 分数超过 5.45 的位点子集,对应于常规显着性阈值 ,并且次要等位基因频率 (MAF) 超过 1%,对应于插补阈值(参见 S1 注释中的第 2.1 节)。我们进行了仿真,以说明GWAS命中时的架构变化作为每个主要模型组件的函数(图2;S1 注释中的第 5 节)。正如理论所期望的那样:
 
当选择较弱时,因果变异可能会漂移到高频,而最显着的命中发生在常见变异上。相反,当选择性强时,显着命中中罕见变异的比例较大,效应大小和等位基因频率之间呈反比关系。
当性状每个站点具有高遗传力时2/L,与低 h 的性状相比,平方效应大小和 z 分数往往更大,全基因组显着命中更多,并且它们解释了更大比例的遗传力2/L.
当性状具有较大的突变靶标大小 L 时(保持 h2/L 和 f(s) 常数),有更多的因果变异和更多的全基因组显着命中,但等位基因频率和效应大小的分布,以及命中解释的遗传力比例不受影响。
thumbnail 下载:
PPT的PowerPoint 幻灯片
巴布亚新几内亚大图
蒂夫原图
图2. 模型参数的推断。
 
(A)–(C)次要等位基因频率 (MAF)、z 分数和每个性状的命中数的联合分布取决于模型参数,如图所示。每张图都显示了全基因组显着命中的模拟分布,每行中的图在我们模型的主轴之一上有所不同。(D)–(F)f(s) 和 h 分布的真值2/L 和 L 用虚线表示;推理由实线或带有袖标和条形的点估计值表示,表示 90% 的引导 CI。每行中特征对之间的推断参数以灰色突出显示。有关使用的参数值,请参阅 S1 注释中的第 9 节。图数据可在以下网址获得:https://doi.org/10.5281/zenodo.17041176。
 
https://doi.org/10.1371/journal.pbio.3003402.g002
 
我们实施了一种最大似然方法,该方法根据 q 的联合分布和显着命中来估计模型的分量(图 2D–2F;S1 注释中的第 5 节)。我们使用具有四个结的样条函数拟合 f(s)(有关如何选择结的数量和位置,请参阅 S1 注释中的第 4.8 节),因此我们的完整模型包括每个特征的六个参数:四个用于 f(s),以及 h2/L 和 L。
 
我们在各种参数值下使用模拟的 GWAS 数据测试了该方法。我们发现,即使命中次数适中(∼100),该方法也能提供准确的估计值,而对于命中次数较少的性状(例如,面板2E),估计值会产生噪声。我们可以从相对较少的观察中估计 f(s) 似乎令人惊讶,但每个变体都携带有关选择强度的大量信息:该变体的等位基因频率范围从上方和效应大小范围从下方和上方,因此它们共同具有很高的信息量(S1 注释中的图 D)。鉴于这些结果,我们分析了至少有 100 次命中的特征。
 
我们还观察到,在可能的选择系数范围的两端,数据的信息量较少:GWAS检测非常强选择的变异()的功效较低,因为它们的等位基因频率太低,而检测有效中性变异()的功效较低,因为它们的效应量太小。因此,我们实施了正则化惩罚,以将 f(s) 限制在这些极端值下的合理值(S1 注释中的第 3.8 节)。
 
来自英国生物样本库的 95 个数量性状的数据集。我们从英国生物样本库中选择了性状进行分析,如下所示(S1 注释中的第 2.4 节)。由于我们的模型最直接适用于定量连续性状,因此我们将分析限制在此类性状上。我们使用COJO确定了每个性状的独立先导变异[46]。由于低频变异通常估算不佳,因此我们删除了 MAF<1% 的命中(参见 S1 注释中的第 6.3 节,了解我们如何在推理中考虑这一点)。我们排除了超过 10% 的命中落在单个 LD 块内的性状,以及极高 LD 区域的命中(LD 分数 >500)。如上所述,我们将自己限制在至少有 100 个独立命中的特征;这样做意味着这些性状是 UKBB 中更多基因和可遗传的性状之一。对于每个性状,我们记录了命中的次数,以及每个命中的估计等位基因频率、z 分数和有效样本量。
 
我们的推断使用 GWAS 命中的架构作为它们标记的因果变异架构的代理。在 S1 Note 的第 7 节中,我们使用数据分析和模拟测试了该近似值的有效性。例如,我们从 UKB 的基因型开始,选择具有因果关系的变体并以各种方式为它们分配效应大小,根据加法模型为个体分配表型,然后执行 GWAS 并运行 COJO,使我们能够将推断的命中数及其频率和效应大小的分布与已知的底层架构进行比较。我们的结果表明,在合理的假设下,COJO 选择的 GWAS 命中忠实地反映了潜在因果变异的架构。
 
我们的标准得出了 95 个特征的列表,每个特征的命中次数范围为 100 到 1,760 次(平均值 = 495)。这些特征包括 40 个形态学特征,其中 26 个与体重或肥胖有关(例如 BMI、腰围和出生体重)以及其他 14 个特征(例如身高、骨矿物质密度和握力)。这些特征还包括 27 种血液表型(例如 血小板特征、淋巴细胞计数和血红蛋白测量值),以及从血液或尿液中取样的 12 个分子特征(例如 IGF-1、甘油三酯和钙水平)。此外,我们还有 9 种心血管特征,包括脉搏率、血压测量值和肺功能特征。最后,我们包括 6 个眼科特征和 1 个行为特征(首次年龄)。
 
性状参数的分布。我们将推理应用于所有 95 个性状。图 3A 显示了选择系数的估计分布,这些选择系数在多基因性和种类上变化,从钙水平到 BMI,代表了所有 95 个性状所跨越的范围(参见 S1 注释中的图 F)。请注意,尽管我们的推断是基于显着命中,但 f(s) 代表了 s 在新突变中的分布。
 
thumbnail 下载:
PPT的PowerPoint 幻灯片
巴布亚新几内亚大图
蒂夫原图
图 3. 例如性状的参数估计值。
 
(A) 新出现突变的选择系数 f(s) 分布的 CDF,使用性状特异性分布分别估计每个性状,具有 90% 置信包络线。(B)新出现突变的选择系数的单共享分布(SSD)的CDF,一起使用所有95个性状一起估计。(C) 示例性状的属性。h2和 L 是使用 SSD 的 f(s) 估计的。图数据可在以下网址获得:https://doi.org/10.5281/zenodo.17041176。
 
https://doi.org/10.1371/journal.pbio.3003402.g003
 
我们对分布的点估计(实线)在性状之间差异很大,但它们具有重要的特征。大多数影响性状的突变都处于弱选择之下,模式范围在 10 之间−4– 10−5.5.在这个范围内,选择的强度大致相当于遗传漂变(每代),这与许多GWAS变异是常见的观察结果一致,更普遍地说,复杂性状的大部分可遗传变异来自共同变异[3,4,10,12]。然而,这些分布在强选择范围内(s > 10−3),因此跨越多个数量级。由于选择系数跨越多个数量级,因此效应大小也应该跨越多个数量级。这与最近的研究结果相呼应,即复杂性状的效应大小分布确实跨越了多个数量级(与统计遗传学模型中经常假设的正态分布相反)[18,19]。
 
尽管我们对分布的点估计(实线)在性状之间差异很大,但它们的置信度包络线在很大程度上重叠(阴影)。由于我们的推断是基于显着命中的架构,置信包络之间的重叠表明,这种架构在很大程度上对我们的点估计中反映的差异不敏感(另见 S1 注释中的第 5.2 节)。因此,我们推测,我们可以通过假设 f(s) 的单一共享分布(我们称之为 SSD)来构建一个统一的模型,而不是假设单独的特定于特征的分布 (TSD)。SSD 如图 3B 所示。我们还推断了选择的性状子集的 SSD,以尽量减少性状之间的遗传相关性(15 个性状 |rg|<任何对的 0.2),并发现估计的 SSD 对完整数据集中性状之间的相关性不敏感(S1 注释中的第 6.4 节)。正如我们将展示的,SSD 为单个特征的架构提供了有用的近似值,同时大大减少了模型参数的数量并突出了特征架构的重要共享特征。
 
与 f(s) 相比,我们对遗传力的估计 h2突变靶标大小L的跨度很广,远远超过单个性状的CI(图3C和S1表)。例如,在图3C中的性状中,BMI(541次命中)的估计目标大小为220 MB,是最高的估计目标大小之一,而尿素(231次命中)的目标大小为4 MB,是最小的估计目标大小之一。这些结果与先前多基因研究的预期大致一致,这些研究表明,包括身高和BMI在内的形态学特征比分子性状具有更多的贡献变异,这里用尿素和钙来说明[2,9]。我们对遗传力的估计值在性状之间差异超过一个数量级,并且与之前的估计值一致(S1 表,S1 注释中的图 J;[10])。我们对比率 h 的估计2/L 变化小于 h2和单独的 L,可能是因为对带有命中的特征的条件使我们偏向于具有更大(因此范围更有限)h 的特征2/L(见图 2B 及下图)。
 
量化模型拟合。接下来,我们评估了我们的模型与GWAS中观察到的遗传结构的拟合度,包括使用SSD近似如何影响拟合(S1注释中的第4节)。为此,我们使用给定等位基因频率和研究规模的 z 分数的预测分布计算了模型拟合度。对于每个变体 i,我们计算了我们所说的残差 p 值:Pr(),其中 z我和 q我分别是观察到的 SNP i 的 z 分数和频率,Model 表示 SSD 或 TSD 模型。SSD 模型拟合仅取决于一个特定于特征的参数 h2/L,因为 f(s) 是跨性状共享的。相比之下,TSD 模型拟合取决于每个性状的五个参数:h2/L 和四个参数以拟合 f(s)。估计的目标大小 L 不会影响此度量的拟合,并且更一般地影响(因为给定其他模型参数,L 是通过匹配预期和观察到的命中数来估计的)。
 
残差 p 值有一个简单的解释:如果我们正确地对显着命中之间的 z 分数分布进行建模,那么残差 p 值的分布将在 0 和 1 之间均匀。如果观察到的 z 分数太小,则残差 p 值将向 1 倾斜,如果 z 分数太高,则将向 0 倾斜。为了避免过度拟合,我们将基因组拆分为近似独立的块[47],每次推断出90%的块的模型,并计算被保留的10%的残差p值。
 
我们首先考虑了模型对身高的拟合度,这是数据集中命中次数最多的特征(图4A)。对于高度,1760 个命中的 z 分数分布基本上与 SSD 模型完美契合(图 4A)。相比之下,两个更简单的启发式模型对z分数分布的拟合很差(图4A)。首先,当我们假设效应大小呈正态分布时,生成的残差 p 值与许多极小的 p 值的均匀性有很大偏差。我们还考虑了一种α模型版本,其效应大小密度正常,取决于等位基因频率[30]。通过拟合等位基因频率和效应大小之间的反比关系,alpha 模型提高了整体拟合度,但仍有过多的微小 p 值。在这两种情况下,潜在的正态分布都太窄,无法适应观察到的效应大小的广泛变化,包括许多接近显着性阈值的命中和少数更强的命中。
 
thumbnail 下载:
PPT的PowerPoint 幻灯片
巴布亚新几内亚大图
蒂夫原图
图4. 模型拟合度。
 
(A)3种模型下身高残差p值(每个数据点为SNP)的QQ图:SSD模型对z分数分布拟合较好,而另外2种模型拟合较差。(B) 对于 BMI,SSD 模型符合大部分 z 分数分布,但少数命中比预期更显着,尤其是在 FTO 处。(C) TSD、SSD 和 α 模型的模型拟合(按特征)的 QQ 图。图数据可在以下网址获得:https://doi.org/10.5281/zenodo.17041176。
 
https://doi.org/10.1371/journal.pbio.3003402.g004
 
对于 BMI,我们的 SSD 型号有 541 次点击,非常适合大部分分布,但最高点击量比预期的要大(图 4B)。特别是,即使在 Bonferroni 校正后,一个 SNP 的残余 p 值也很显着。该异常值代表了众所周知的FTO信号,即使在非常早期的GWAS研究中也检测到了[48,49]。
 
我们发现了各种其他性状的 14 个额外的异常值 SNP。这 14 个异常值包括错义和非编码变异,并且都发现在先前与相关性状生物学有关的基因附近(S1 注释中的表 A 和 S2 表)。我们的推论对排除这些异常值不敏感(参见 S1 注释中的第 4.5 节)。我们假设这些异常值在某种程度上违反了我们的模型假设,尽管它们具有很大的影响,但它们仍然是常见的。例如,它们的多效性效应可能比大多数影响这些性状的其他变异小得多,考虑到它们的效应大小,导致选择比预期的要弱[50]。或者,它们可能是强正选择或平衡选择的目标,尽管它们的效应量很大,但这些选择使它们能够达到高频。
 
接下来,我们对每个性状进行了拟合优度检验,以确定残差p值的总体分布是否与预期的均匀分布相匹配,使用Kolmogorov-Smirnov统计量(图4C;S1 注释中的第 4 节)。我们发现 α 模型对数据的拟合比 TSD 和 SSD 模型差得多;值得注意的是,我们可以在 FDR 为 0.05 的情况下拒绝 95 个特征中的 93 个特征(S1 注释中的第 4 节)。相比之下,TSD和SSD模型似乎都很好地拟合了数据,p值适度膨胀,可能与简化模型和推理的假设有关(图4C)。对于大多数特征,TSD 模型比 SSD 模型稍好,TSD 没有拒绝任何特征,SSD 有 26 个特征被拒绝,FDR 为 0.05(S1 注释中的第 4 节),表明 TSD 正确识别了某种程度的特征特异性信号。尽管如此,SSD 模型非常适合数据,并且更加简约,与 TSD 模型的 5 个特征特定参数相比,具有一个特定特征的参数。
 
等位基因年龄的预测。前面的结果表明,该模型为数据提供了良好的经验拟合。接下来,我们想评估它是否也可以预测遗传结构背后的进化过程。为此,我们转向了与模型完全不同的预测类型。根据等位基因频率,有害等位基因往往比中性等位基因年轻[24,51];我们的参数估计可用于预测 GWAS 命中的这种影响程度。我们将模型的预测与使用Relate [45]重建祖先重组图估计的等位基因年龄进行了比较(有关详细信息,请参阅S1注释中的第8节,包括对等位基因年龄估计量的校正)。
 
查看 Relate 估计的所有 95 个性状的 GWAS 命中的等位基因年龄,我们发现它们比频率匹配的假定中性等位基因年轻得多(图 5)。我们估计,GWAS命中变异的中位年龄为137,000年,而匹配的中性变异的中位年龄为594,000年。这些观察结果强调了选择和漂移对 GWAS 命中的竞争影响:由于选择,GWAS 命中比匹配的中性变体年轻得多,但同时选择性足够弱,以至于大多数 GWAS 命中都相当古老,早于非洲以外的瓶颈。这一发现与之前的研究结果相呼应,即许多常见的GWAS命中在非洲和非非洲人群中共享[52,53]。
 
thumbnail 下载:
PPT的PowerPoint 幻灯片
巴布亚新几内亚大图
蒂夫原图
图5. 等位基因老化。
 
使用 Relate 估计的所有 95 个性状(纯蓝色)的 GWAS 的分布等位基因年龄与我们的模型预测的等位基因年龄分布(蓝色虚线)相比。还显示了中性频率匹配的 SNP 的等位基因年龄分布(纯红色)和中性模型预测的分布(红色虚线)。等位基因年龄通过假设每代28年转换为年[54]。图数据可在以下网址获得:https://doi.org/10.5281/zenodo.17041176。
 
https://doi.org/10.1371/journal.pbio.3003402.g005
 
最重要的是,SSD模型很好地预测了GWAS命中与匹配对照SNP相比的年龄变化,表明该模型捕获了正确大小的选择系数。(有关我们通过此分析区分选择系数的能力的结果,请参阅 S1 注释中的图 X。由于 Relate 推断的等位基因年龄是根据局部单倍型结构估计的,我们的推断未使用这些信息,因此这种一致性提供了 SSD 模型的外部验证。
 
简单的缩放规则控制特征架构的差异。SSD 模型的拟合提出了一个有趣的预测:性状之间遗传结构的差异主要是由于两个性状特异性参数:每个位点的遗传力 (h2/L)和突变靶标大小(L)。
 
要了解原因,请考虑所有变异的性状的完整遗传结构,无论它们是否可以被 GWAS 检测到。首先,对于给定的人口统计历史,等位基因频率的分布仅取决于选择系数 f(s) 的分布。因此,在SSD近似下,等位基因频率分布在性状之间是共享的,并且可以从我们对f(s)的估计中预测(黑线,图6A)。
 
thumbnail 下载:
PPT的PowerPoint 幻灯片
巴布亚新几内亚大图
蒂夫原图
图6. SSD 模型下的共享遗传架构。
 
(A) 所有因果变异(黑色)和全基因组显着命中(浅/深蓝色)的等位基因频率分布,对于我们给定英国人口历史推断的 f(s)。(B)具有不同次要等位基因频率的因果变异的选择系数分布。(C)平方效应大小的分布,此处显示了三个示例次要等位基因频率;请注意,效应大小按 h 的自然单位缩放2/L. 对于高 h 的性状2/L,浅蓝色和深蓝色区域内的变异具有全基因组显着性 (GWS);对于低 H 的性状2/L,只有深蓝色区域很重要。有关使用的参数值,请参阅 S1 注释中的第 9 节。图数据可在以下网址获得:https://doi.org/10.5281/zenodo.17041176。
 
https://doi.org/10.1371/journal.pbio.3003402.g006
 
其次,虽然 f(s) 表示新突变之间选择系数的分布,但强选择的变体不太可能达到高频率。因此,选择系数的分布随着等位基因频率的增加而变小,如图6B所示。
 
鉴于图6B中不同等位基因频率下的选择系数分布,我们可以通过将方程6积分到s上来计算平方效应大小的分布作为等位基因频率的函数。至关重要的是,在 SSD 模型下,如果 x 轴上的效应大小按 h 缩放,则这些分布在各个特征中是相同的2/L(黑线,图 6C)。
 
这些分布如何影响 GWAS 命中?与基础分布不同,检测GWAS中显着变异的能力取决于实际的平方效应大小,而不是按h2/L(这取决于等位基因频率和样本量)。因此,检测具有较高 h 的性状的变异的能力更大2/L – 这是直观的,因为 h 较高2/L 意味着平均而言,每个站点解释了特征中的更多方差。图6C说明了这一点:对于高h2/L,浅蓝色和深蓝色区域内的变异在全基因组范围内都很重要,但对于低 h2/L,则仅检测到深蓝色区域内的变体。
 
此外,尽管因果变异等位基因频率的潜在分布在性状之间是共享的,但预计命中的频率分布会有所不同。对于高 h 的性状2/L 与低 h 的性状相比,检测低频变异的功效相对更大2/L(图6A)。
 
最后,第二个缩放参数 L 表示突变靶标大小。以 h 为条件2/L,更改 L 仅更改因果变体的数量(和命中数),但不会更改任何分布。
 
我们首先测试了三个特征的预测:身高、血小板临界(一种血液表型)和 FEV1(肺功能的衡量标准),我们将样本量减少到 330,000,因此所有特征都是相同的(S1 注释中的第 6.7 节)。图7A显示了身高和血小板暴击。这两个性状在命中次数(1533 次对 648 次)、估计遗传力(77% 对 32%)和突变目标大小(30 MB 对 10 MB)方面差异很大。但是,我们估计它们的 h 值非常相似2/L ( × 10−8).与我们的预测一致,对于这两个性状,显着命中的 z 分数、效应大小和 MAF 的分布几乎相同。
 
thumbnail 下载:
PPT的PowerPoint 幻灯片
巴布亚新几内亚大图
蒂夫原图
图7. 遗传力和目标大小是特征架构之间差异的基础:
 
三个特征的示例。(A) 每个位点的身高(蓝色)和血小板暴击(红色)具有相同的遗传力 h2/L,但身高具有更高的突变目标大小 L。这导致身高 (1533) 的命中比血小板暴击 (648) 的命中要多得多(左 2 个面板)。然而,对于这两个特征,效应大小、MAF 和命中的 z 分数的边际分布几乎相同(右 3 个图)。(B) 身高(蓝色)和 FEV1(金色)的差异为 h2/L,但具有相似的 L。因此,z 分数和 MAF 的联合分布明显不同(左图 2 个),命中效应大小、MAF 和 z 分数的边际分布(右图)也明显不同。(C)在按它们各自的比例进行缩放后,对两个性状施加更严格的尺度显著性阈值(对应于FEV1),其命中的z分数和MAF的联合分布(左2个图)和相应的边际分布(右3个图)高度相似。图数据可在以下网址获得:https://doi.org/10.5281/zenodo.17041176。
 
https://doi.org/10.1371/journal.pbio.3003402.g007
 
相比之下,身高和 FEV1 具有相似的突变靶标大小,但 h2/身高的 L 比 FEV1 高约 6 倍(图 7B)。正如预期的那样,这导致检测与身高相关的变异的能力比 FEV1 更大(40% vs. 14% h2用显着的点击来解释)。因此,与 FEV1 相比,身高的全基因组显着命中具有更大的效应大小和更大的 z 分数。我们还看到 FEV1 的低 MAF 命中略少(p = 0.01,KS 测试),因为与高度相比功率较低。
 
我们预测,在重新缩放这些特征的 z 分数(和效应大小)后,它们的架构应该变得几乎相同。在这个尺度上,FEV1的显著性截止值高于身高(如图6C中的浅蓝色和深蓝色区域所示)。因此,我们使用缩放单位中的较高阈值比较了两个性状的全基因组显着命中的架构。这样做之后,我们只有 95 次身高命中,但很明显,这两个特征的汇总属性确实非常相似(图 7C)。
 
我们对数据集中其他 57 个性状重复了此缩放过程,这些性状的缩放阈值低于 FEV1。这样做之后,所有命中的分布与身高和FEV1的缩放分布高度相似(虚线,图7C)。我们对所有性状重复了类似的分析,发现在应用这些缩放定律后,所有 95 个性状的架构几乎相同(S1 注释中的第 10 节)。
 
讨论
是什么决定了复杂性状的遗传结构?给定性状的遗传变异是否主要反映了其生物学的特质,或者,它是否反映了不同性状之间共享的过程?
 
在这里,我们描述了解决这些问题的原则性方法。我们的出发点是基于经验动机和可解释的生物学假设的遗传结构的进化模型。鉴于许多定量(连续)性状受到稳定选择的影响[23,37,38],并且影响一个性状的遗传变异通常会影响许多其他性状[5,20,21]的论点和证据,我们对多维性状空间中稳定选择产生的等位基因选择进行建模。否则,我们假设标准种群遗传模型结合了突变、选择、遗传漂变和人口历史的影响。该模型产生了一系列遗传结构,其中给定性状的结构由影响性状位点的选择系数分布以及两个缩放参数决定:突变目标大小和每个位点的遗传力。
 
我们进行了推理,允许所有这些参数在性状之间有所不同。我们发现,该模型很好地拟合了我们数据集中 95 个定量性状的等位基因频率和效应大小在全基因组显着命中的联合分布。有趣的是,我们还发现这些性状之间选择系数分布的置信包络在很大程度上重叠,这表明它们的遗传结构可以通过选择系数的单一共享分布 (SSD) 和每个性状的两个附加尺度参数来近似。然后,我们联合使用所有性状的数据来估计 SSD,表明它很好地适应了单个性状的架构,并通过表明它准确预测了所有性状的 GWAS 命中时等位基因年龄的分布来验证我们对 SSD 的估计。
 
SSD模型的拟合意味着,除了两个缩放参数外,所有95个性状中全基因组显着命中的遗传结构是相似的。估计的共享架构的横截面如图6所示。事实上,正如预测的那样,在我们通过每个位点的估计遗传力重新缩放效应大小后,我们发现GWAS命中的效应大小和等位基因频率的联合分布在性状之间是相似的。同时,给定性状的命中次数与估计的目标大小成正比(图7)。
 
这些发现描绘了性状和性状特异性特征之间共有的遗传结构属性。在此过程中,他们提出了新的见解和问题:
 
不同复杂性状中遗传变异的选择系数分布有多相似?我们的结果表明,我们检查的95个性状之间的选择效应分布足够相似,以至于GWAS命中的架构对它们之间的差异不敏感。以前的工作已经暗示了这种相似性:例如,使用α模型的工作报告了MAF与各种性状之间的效应大小之间的关系大致相似[25,26,36],但应该注意的是,在选择系数方面没有对α的直接解释[36]。之前的工作还暗示了我们发现的分布的共同特征,特别是许多GWAS命中的选择足够弱,以至于它们先于非洲外瓶颈并在种群之间共享[52,53],以及它们的效应大小跨越几个数量级[18\u201219]。
 
我们可能会期望复杂性状之间的选择系数分布存在一些相似性。在假设的极端情况下,所有功能变异都会影响所有性状,分布必然在性状之间共享。这种逻辑可以很好地解释突变靶标大小包含基因组大部分功能部分的性状之间的相似性;例如,我们估计BMI的目标大小约为基因组的7%,而估计为约8%是功能性的[55\u201257]。它也可能适用于通过相同组织介导的性状[14]。然而,这种逻辑并不能解释靶标大小明显较小且主要通过不同组织介导的性状之间的相似性[58]。例如,我们数据集中的生物标志物的靶标大小比BMI小一个数量级以上(例如,钙水平的靶标大小约为基因组的0.1%),并且通过不同的细胞类型或组织介导[9]。
 
选择系数分布的共同特征可能反映了影响复杂性状的变异产生的生物系统的相似性,特别是在基因调控网络中。复杂性状的遗传变异分布在大部分基因组中,并在影响这些性状的组织中表达的大多数基因附近的调控区域中富集[14]。先导变异通常只能解释遗传力的一小部分[3],而最相关的生物学途径通常仅适度富集遗传力[9,14]。换句话说,大多数可遗传变异是通过调节与性状生物学没有密切联系的基因和途径介导的[9,14,59]。也许,基因调控网络的基本逻辑及其进化在组织之间足够相似,可以产生我们发现的共同特征,即使特定的途径、基因、增强子和变体不同。
 
然而,分布之间的相似性具有重要的条件。即使在我们检查的 95 个性状中,我们的推断仅限于 GWAS 命中,我们仍然发现不同性状的选择效应分布之间存在统计学上的显着差异(见上文和 S1 注释中的第 4 节)。正如我们已经指出的,将我们的推理限制在MAF>1%的GWAS命中上,限制了我们在选择系数范围的弱端和强端(例如,for 和)推断选择效应的能力。因此,我们不能排除在分布方面存在更实质性的差异,例如,强烈选择的罕见变异,即使在我们检查的性状中也是如此(参见[28])。此外,我们检查的特征是根据 100 次命中确定的。具有截然不同的选择系数分布的性状可能无法通过此阈值,例如,大多数遗传力来自强选择变异的性状。
 
局限性和未来分析。这些限制和其他限制可以在将来解决。例如,全基因组测序[60]将为强选择的变异提供更大的功效。同时,对解释LD的因果变异的全部分布进行整合的方法[11,19,36]可能使我们能够放松对全基因组显著命中的依赖,从而增加识别弱选择变异的能力,更广泛地提高我们对TSD和SSD模型的推理精度,并允许分析GWAS命中较少的性状。
 
未来我们对不同类型特征的推论的敏感性和应用的提高也可能保证我们的进化模型的扩展。值得注意的是,我们目前的模型仅限于数量性状,不能立即适用于包括疾病在内的二元性状。人们可以想象,选择影响某些复杂疾病风险的变异是为了将这种风险降到最低,因此需要进行纯化(定向)选择,但最近的研究表明,至少影响它们的常见变异主要由我们在这里假设的那种多效性稳定选择[61,62].通过适当调整模型以适应病例对照 GWAS 的数据,我们可能会发现复杂疾病的结构与我们检查的数量特征相似。
 
我们的模型和推论依赖于一个简化的假设,即给定性状中的所有遗传变异都受到相同程度的多效性选择的影响(这种程度反映在性状空间的维度上;例如,参见等式 3 和 Simons 等人,2018 年)。我们现在有强有力的证据表明,这一假设在影响GWAS中鉴定的变异类型方面受到违反[50]。该模型的未来扩展可能会包括多效性选择程度的变化,其中这种变化也可能在复杂性状之间有所不同。
 
为什么性状特异性缩放参数会有所不同?尽管未来会有所改进,但我们的进化模型具有选择效应的共享分布,与数据集中所有 95 个性状的数据非常吻合,这表明,正如我们也证实的那样,高度多基因性状之间全基因组显着命中的遗传结构的差异在很大程度上取决于两个性状特异性缩放因子:突变靶标大小和每个位点的遗传力。
 
在我们的95个性状中,突变靶标大小变化超过2个数量级。虽然估计是新的,但考虑到这些性状在生物学上的巨大差异,它们之间的差异并不奇怪。这些性状的不同在于受少数到许多组织的影响,以及直接影响这些组织中性状的基因和途径的数量和特性[59,63]。此外,直接影响这些性状的途径在它们对遗传(和环境)变异的缓冲程度和模块化方面存在合理差异,这似乎反映了性状的种类和选择压力在比遗传变异的周转时间更长的进化时间尺度上[64,65]。我们对遗传力的估计变化较小,但仍跨越一个数量级,并且在不同种类的性状之间存在差异(S1表)。这两种观察结果已经为人所知近一个世纪了,但关于其原因的问题在很大程度上仍然悬而未决[23,37,38]。我们的结果表明,性状之间结构的其他差异与这两个尺度参数引起的变化相比相形见绌。
 
展望。退后一步,我们的研究结果强调,进化思维对于理解人类 GWAS 的发现至关重要,更广泛地说,理解复杂性状的遗传变异。这一见解与该领域的长期思考一致,因为复杂性状的遗传变异反映了对表型的多次遗传扰动的结果,这些影响通过了进化的筛子[23,38]。具体来说,在 GWAS 中测量的信号反映了因果变异对遗传力的贡献,这取决于它们对所考虑性状的影响,还取决于它们的次要等位基因频率,其中两者之间的关系是由自然选择介导的。至少对我们来说,令人惊讶的是,在这种情况下,基于进化模型的分析可以走多远,表明许多高度多基因的数量性状的遗传结构在很大程度上是共享的。这一发现对人类 GWAS 及其应用具有许多影响,我们计划在其他地方探索其中一些。除了其他证据外,它还暗示了在很大程度上仍有待发现的潜在生物学,可能与基因调控网络的特性有关。我们认为,进化推理与基因调控的系统方法相结合,将使我们更接近回答可追溯到遗传学领域最开始的关于从遗传变异到表型的映射的问题。
 
支持信息
包括:
 
显示 1/3:pbio.3003402.s001.pdf
 
跳至图分享导航
抱歉,我们无法加载您的数据。
1 / 3
 
 
下载
无花果分享
S1 注意。 包括:
图A. n维效应与其对单个性状的投影之间的几何关系
 
图B.突变选择平衡近似。
 
图C.使用的所有GWAS命中的d值的直方图。
 
图D。MAF和z-score绑定了选择系数。
 
图 E. 人口统计模型。
 
图F.所有95个性状的选择系数推断分布的CDF。
 
图 G. 调整惩罚的强度。
 
图 H. 选择结数。
 
图一.降低样本量。
 
图 J. 遗传力估计。
 
图K.罕见变异的比例。
 
图 L. 模拟数据集上的推理。
 
图 M. 对非 SSD 数据集的推理。
 
图N. 15个几乎独立性状的SSD结果。
 
图 O. 95 个性状的 GWAS 命中摘要。
 
图 P. 相对不确定性。
 
图 Q. 最大相关性。
 
图R.选型交配的效果。
 
图S.模拟架构的遗传结构和推理。
 
图 T. 模拟,点击量为 9,834 次。
 
图 U. 末端分支突变起源示意图。
 
图五 等位基因年龄的分布。
 
图 W. 等位基因年龄的启发式估计器。
 
图十 选择系数分布偏移的等位基因年龄预测。
 
表 A. 异常值 SNP。
 
表 B. 模型和推理假设。
 
https://doi.org/10.1371/journal.pbio.3003402.s001
 
(PDF格式)
 
S1 表。 推断所有 95 个性状的目标大小和遗传力。
https://doi.org/10.1371/journal.pbio.3003402.s002
 
(CSV)
 
S2 表。 异常值 SNP 的扩展表。
https://doi.org/10.1371/journal.pbio.3003402.s003
 
(XLSX)
 
确认
我们感谢 Nick Barton、Graham Coop、Arbel Harpak、Magnus Nordborg、Roshni Patel、Molly Przeworski、Jeff Spence、Carl Veller、Laura Hayward、Himani Sachdeva 和 Coop、Pritchard 和 Sella 实验室的对话和评论。
 
引用
1.Claussnitzer M、Cho JH、Collins R、Cox NJ、Dermitzakis ET、Hurles ME 等。人类疾病遗传学简史。自然界。2020;577(7789):179–89.PMID:31915397
查看文章考研/NCBI谷歌学术
2.Loh P-R、Bhatia G、Gusev A、Finucane HK、Bulik-Sullivan BK、Pollack SJ 等。使用快速方差成分分析对比精神分裂症和其他复杂疾病的遗传结构。纳特·热内特。2015;47(12):1385–92.
查看文章谷歌学术
3.Shi H, Kichaev G, Pasaniuc B. 从汇总关联数据中对比 30 个复杂性状的遗传结构。我 J Hum Genet。2016;99(1):139–53.PMID:27346688
查看文章考研/NCBI谷歌学术
4.新泽西州廷普森、格林伍德 CMT、索兰佐 N、劳森 DJ、理查兹 JB。遗传结构:遗传对人类特征和疾病的贡献的形状。纳特牧师热内特。2018;19(2):110–24.PMID:29225335
查看文章考研/NCBI谷歌学术
5.渡边 K、斯金格 S、弗雷 O、乌米切维奇·米尔科夫 M、德·列乌 C、波尔德曼 TJC 等。复杂性状中多效性和遗传结构的全球概述。纳特·热内特。2019;51(9):1339–48.PMID:31427789
查看文章考研/NCBI谷歌学术
6.卡内拉-桑德里 O、罗利克 K、特内萨 A.英国生物样本库的遗传关联图谱。纳特·热内特。2018;50(11):1593–9.PMID:30349118
查看文章考研/NCBI谷歌学术
7.Yang J、Bakshi A、Zhu Z、Hemani G、Vinkhuyzen AAE、Lee SH 等。使用插补变异的遗传方差估计发现,人类身高和体重指数的遗传力缺失可以忽略不计。纳特·热内特。2015;47(10):1114–20.PMID:26323059
查看文章考研/NCBI谷歌学术
8.Zhang Y, Qi G, Park J-H, Chatterjee N. 使用来自 32 个复杂性状的全基因组关联研究的汇总级统计量估计复杂的效应大小分布。纳特基因。 2018; 50(9):1318–26. PMID:30104760
查看文章考研/NCBI谷歌学术
9.辛诺特-阿姆斯特朗 N、纳克维 S、里瓦斯 M、普里查德 JK。三种分子性状的 GWAS 突出了核心基因和途径以及高度多基因的背景。生活。 2021; 10:e58615。PMID:33587031
查看文章考研/NCBI谷歌学术
10.Ge T、Chen CY、Neale BM、Sabuncu MR、Smoller JW。更正:英国生物样本库的全表观遗传力分析。公共科学图书馆基因。 2018; 14(2):e1007228。PMID:29425192
查看文章考研/NCBI谷歌学术
11.Hou K、Burch KS、Majumdar A、Shi H、Mancuso N、Wu Y 等。从生物样本库规模数据中准确估计 SNP 遗传力,无论遗传结构如何。纳特基因。 2019; 51(8):1244–51. PMID:31358995
查看文章考研/NCBI谷歌学术
12.Yang J、Benyamin B、McEvoy BP、Gordon S、Henders AK、Nyholt DR 等。常见的 SNP 解释了人类身高遗传力的很大一部分。纳特·吉内特。 2010; 42(7):565–9. PMID:20562875
查看文章考研/NCBI谷歌学术
13.Bulik-Sullivan BK、Loh PR、Finucane HK、Ripke S、Yang J、精神病基因组学联盟精神分裂症工作组等。LD 评分回归区分了全基因组关联研究中的混杂性和多基因性。纳特基因。 2015; 47(3):291–5. PMID:25642630
查看文章考研/NCBI谷歌学术
14.博伊尔 EA、李毅、普里查德 JK。复杂性状的扩展视图:从多基因到全基因。 细胞。 2017; 169(7):1177–86.
查看文章谷歌学术
15.Zhang Y, Qi G, Park J-H, Chatterjee N. 使用来自 32 个复杂性状的全基因组关联研究的汇总级统计量估计复杂的效应大小分布。纳特基因。 2018; 50(9):1318–26. PMID:30104760
查看文章考研/NCBI谷歌学术
16.Frei O、Holland D、Smeland OB、Shadrin AA、Fan CC、Maeland S 等。双变量因果混合模型量化了超越遗传相关性的复杂性状之间的多基因重叠。国家公社。 2019; 10(1):2417. PMID:31160569
查看文章考研/NCBI谷歌学术
17.奥康纳 LJ、舍奇 AP、霍尔莫兹迪亚里 F、加扎尔 S、帕特森 N、普莱斯 AL。复杂性状的极端多基因性可以通过负选择来解释。Am J Hum Genet。 2019; 105(3):456–76. PMID:31402091
查看文章考研/NCBI谷歌学术
18.奥康纳 LJ。常见变异效应大小的分布。纳特·吉内特。 2021; 53(8):1243–9. PMID:34326547
查看文章考研/NCBI谷歌学术
19.斯宾塞 JP、辛诺特-阿姆斯特朗 N、阿西姆斯 T、普里查德 JK。一个灵活的建模和推理框架,用于从 GWAS 汇总统计中估计变异效应大小。生物Rxiv。 2022.
查看文章谷歌学术
20.Bulik-Sullivan B、Finucane HK、Anttila V、Gusev A、Day FR、Loh PR 等。人类疾病和性状的遗传相关性图谱。纳特·吉内特。 2015; 47(11):1236–41. PMID:26414676
查看文章考研/NCBI谷歌学术
21.皮克雷尔 JK、贝里萨 T、刘 JZ、塞古雷尔 L、董 JY、海因兹 DA。对 42 种人类性状的共同遗传影响的检测和解释。纳特·吉内特。 2016; 48(7):709–17. PMID:27182965
查看文章考研/NCBI谷歌学术
22.史密斯 CJ、辛诺特-阿姆斯特朗 N、Cichońska A、Julkunen H、Fauman EB、Würtz P 等。代谢物 GWAS 的综合分析阐明了多效性和遗传相关性的分子基础。电子生活。2022 年:e79348。https://doi.org/10.7554/eLife.79348
23.塞拉 G,新罕布什尔州巴顿。思考全基因组关联研究时代复杂性状的进化。Annu Rev 基因组学嗡嗡声基因。 2019; 20:461–93. PMID:31283361
查看文章考研/NCBI谷歌学术
24.Gazal S、Finucane HK、Furlotte NA、Loh PR、Palamara PF、Liu X 等。人类复合性状的连锁不平衡依赖性结构显示出负选择的作用。自然遗传学。2017;49(10):1421–7.
查看文章谷歌学术
25.曾 J、德弗拉明 R、吴 Y、罗宾逊 MR、劳埃德-琼斯 LR、Yengo L 等。人类复杂性状遗传结构中负选择的特征。纳特·热内特。2018;50(5):746–53.PMID:29662166
查看文章考研/NCBI谷歌学术
26.速度 D,福尔摩斯 J,秃头 DJ。使用汇总统计评估和改进遗传力模型。纳特·热内特。2020;52(4):458–62.PMID:32203469
查看文章考研/NCBI谷歌学术
27.西蒙斯 YB、布劳基 K、哈德逊 RR、塞拉 G.人类数量性状 GWAS 发现的群体遗传学解释。公共科学图书馆生物学 2018 年;16(3):e2002985。
查看文章谷歌学术
28.Weiner DJ、Nadig A、Jagadeesh KA、Dey KK、Neale BM、Robinson EB 等。394,783 个外显子组中罕见编码变异的多基因结构。自然界。2023;614(7948):492–9.PMID:36755099
查看文章考研/NCBI谷歌学术
29.速度 D、Hemani G、Johnson MR、秃头 DJ。改进了全基因组 SNP 的遗传力估计。2012;91(6):1011–21.PMID:23217325
查看文章考研/NCBI谷歌学术
30.Speed D、Cai N、UCLEB 联盟、Johnson MR、Nejentsev S、Balding DJ。复杂人类性状中SNP遗传力的重新评估。纳特·热内特。2017;49(7):986–92.PMID:28530675
查看文章考研/NCBI谷歌学术
31.凯特利警察局,希尔 WG。数量性状在突变-选择平衡下保持变异:适应性性状的多效性副作用。伦敦皇家学会会刊 B 系列:生物科学。1990;242(1304):95–100.
32.普里查德 JK。罕见变异是否导致对复杂疾病的易感性?我 J Hum Genet。2001;69(1):124–37.PMID:11404818
查看文章考研/NCBI谷歌学术
33.Eyre-Walker A. 复杂性状的遗传结构及其对适应性和全基因组关联研究的影响。美国国家科学院院刊。2010;107(suppl_1):1752–6。
34.Agarwala V、Flannick J、Sunyaev S、GoT2D 联盟、Altshuler D. 评估复杂疾病遗传结构的经验界限。纳特·热内特。2013;45(12):1418–27.PMID:24141362
查看文章考研/NCBI谷歌学术
35.曼库索 N、罗兰 N、兰德 KA、坦登 A、艾伦 A、昆克 D 等。罕见变异对前列腺癌遗传力的贡献。纳特·热内特。2016;48(1):30–5.PMID:26569126
查看文章考研/NCBI谷歌学术
36.曾 J、薛 A、江 L、劳埃德-琼斯 LR、吴 Y、王 H 等。在人类复杂性状和功能基因组类别中广泛出现自然选择特征。纳特公社。2021;12(1):1164.PMID:33608517
查看文章考研/NCBI谷歌学术
37.Johnson T, Barton N. 数量性状选择和突变的理论模型。Philos Trans R Soc Lond B Biol Sci. 2005;360(1459):1411–25.PMID:16048784
查看文章考研/NCBI谷歌学术
38.Walsh B, Lynch M. 数量性状的进化和选择。牛津大学出版社;2018.
39.林奇 M、沃尔什 B 等人。遗传学和数量性状分析。马萨诸塞州桑德兰:西瑙尔;1998.
40.费舍尔 RA。自然选择的遗传理论。牛津:克拉伦登出版社;1930.
41.奥尔哈。适应的遗传理论:简史。纳特牧师热内特。2005;6(2):119–27.PMID:15716908
查看文章考研/NCBI谷歌学术
42.赖特·方差分析以及亲属之间与最优偏差的相关性。遗传学之旅。1935;30(2):243–56.
查看文章谷歌学术
43.罗伯逊 A.基于偏差或纯合子病的极端偏差的选择效果。J 热内特。1956;54(2):236–48.
查看文章谷歌学术
44.Charlesworth B, Charlesworth D. 进化遗传学的要素。罗伯茨公司;2010.
45.Speidel L、Forest M、Shi S、Myers SR。一种对数千个样本进行全基因组谱系估计的方法。纳特·热内特。2019;51(9):1321–9.PMID:31477933
查看文章考研/NCBI谷歌学术
46.Yang J、Ferreira T、Morris AP、Medland SE,人体测量性状遗传学研究 (GIANT) 联盟、DIAbetes 遗传学复制和荟萃分析 (DIAGRAM) 联盟等。对GWAS汇总统计量进行条件和联合多SNP分析,确定了影响复杂性状的其他变异。纳特·热内特。2012;44(4):369–75,第 1-3 条。PMID:22426310
查看文章考研/NCBI谷歌学术
47.贝丽莎 T,皮克雷尔 JK。人类群体中近似独立的连锁不平衡块。生物信息学。2016;32(2):283–5.PMID:26395773
查看文章考研/NCBI谷歌学术
48.Claussnitzer M、Dankel SN、Kim KH、Quon G、Meuleman W、Haugen C 等人 FTO 肥胖变异电路和脂肪细胞褐变。N Engl J Med. 2015;373(10):895–907.PMID:26287746
查看文章考研/NCBI谷歌学术
49.索布雷拉 DR、乔斯林 AC、张 Q、威廉姆森 I、汉森 GT、法里斯 KM 等。广泛的多效性和等位基因异质性介导 IRX3 和 IRX5 的代谢作用。科学。2021;372(6546):1085–91.PMID:34083488
查看文章考研/NCBI谷歌学术
50.斯宾塞 JP、穆斯塔法维 H、太田 M、米林德 N、Gjorgjieva T、史密斯 CJ。特异性、长度和运气:罕见和常见变异关联研究如何优先考虑基因。生物Rxiv。2024. https://www.biorxiv.org/content/early/2024/12/16/2024.12.12.628073
51.Kiezun A、Pulit SL、Francioli LC、van Dijk F、Swertz M、Boomsma DI 等。人类基因组中的有害等位基因平均比相同频率的中性等位基因年轻。公共科学图书馆基因。2013;9(2):e1003301。PMID:23468643
查看文章考研/NCBI谷歌学术
52.Marigorta UM, Navarro A. GWAS 结果的高跨种族可复制性意味着共同的因果变异。公共科学图书馆基因。2013;9(6):e1003566。PMID:23785302
查看文章考研/NCBI谷歌学术
53.李YR,基廷BJ。跨种族全基因组关联研究:在不同人群中作图的优势和挑战。基因组医学 2014 年;6(10):91.PMID:25473427
查看文章考研/NCBI谷歌学术
54.Moorjani P、Sankararaman S、Fu Q、Przeworski M、Patterson N、Reich D。一种对古代基因组进行测年的遗传学方法可以直接估计过去 45,000 年来人类的世代间隔。Proc Natl Acad Sci U S A. 2016;113(20):5652–7.PMID:27140627
查看文章考研/NCBI谷歌学术
55.Ward LD, Kellis M. 人类最近获得的调节功能进行大量纯化选择的证据。科学。2012;337(6102):1675–8.PMID:22956687
查看文章考研/NCBI谷歌学术
56.Rands CM、Meader S、Ponting CP、Lunter G. 8.2% 的人类基因组受到限制:人类谱系中不同功能元素类别的周转率变化。公共科学图书馆基因。2014;10(7):e1004525。PMID:25057982
查看文章考研/NCBI谷歌学术
57.古尔科 B、胡比斯 MJ、格罗瑙 I、西佩尔 A.一种计算人类基因组中点突变的适应性后果概率的方法。纳特·热内特。2015;47(3):276–83.PMID:25599402
查看文章考研/NCBI谷歌学术
58.Finucane HK、Reshef YA、Anttila V、Slowikowski K、Gusev A、Byrnes A 等。特异性表达基因的遗传力富集可识别疾病相关组织和细胞类型。纳特·热内特。2018;50(4):621–9.PMID:29632380
查看文章考研/NCBI谷歌学术
59.刘某,李毅,普理查德JK.反式对基因表达的影响可以驱动全基因遗传。细胞。2019;177(4):1022-1034.e6。PMID:31051098
查看文章考研/NCBI谷歌学术
60.Wainschtein P、Jain D、Zheng Z、TOPMed 人体测量工作组、NHLBI 精准医学跨组学 (TOPMed) 联盟、Cupples LA 等人。从全基因组序列数据评估罕见变异对复杂性状遗传力的贡献。纳特·热内特。2022;54(3):263–73.PMID:35256806
查看文章考研/NCBI谷歌学术
61.Koch E、新泽西州康纳利、Baya N、Reeve MP、Daly M、Neale B 等。遗传关联数据与塑造人类常见疾病和性状的稳定选择大致一致。生物Rxiv。2024.
查看文章谷歌学术
62.Berg JJ、Li X、Riall K、Hayward LK、Sella G. 复杂疾病的突变-选择-漂移平衡模型。生物Rxiv。2025.
查看文章谷歌学术
63.Udler MS. 2 型糖尿病:多种基因,多种疾病。Curr Diab 众议员 2019 年;19(8):55.PMID:31292748
查看文章考研/NCBI谷歌学术
64.de Visser JAGM、Hermisson J、Wagner GP、Ancel Meyers L、Bagheri-Chaichian H、Blanchard JL 等。透视:遗传鲁棒性的进化和检测。演化。2003;57(9):1959–72.PMID:14575319
查看文章考研/NCBI谷歌学术
65.瓦格纳 GP、帕夫利切夫 M、切维鲁德 JM。模块化之路。纳特牧师热内特。2007;8(12):921–31.PMID:18007649
查看文章考研/NCBI谷歌学术
 
上一篇:厦门免费医学论文发表-中风后结合伽马神经调控和机器人康复可恢复小白蛋白中间神经元

下一篇:最后一页
咨询方式

 ---->>学术源论文咨询发表网
 ---->>咨询QQ:854727998 
 ---->>电话:
   
13889158687(微信同号)

 ---->>邮箱:lunwen133@163.com
投稿写明所投期刊,3日内回复.五日未回复可电话咨询。

工作时间:8:00-17:00   周六值班、周日休息,国家法定假日休息

学术焦点 更多>>

《健康必读》省级医学月刊 当月发
《医药前沿》国家级医学月刊 ISS
《中国健康月刊》国家医学月刊-是
《才智》省级教育类月刊-CN22-13
《商情教育经济研究》省级教育类月
《考试周刊》省级教育类月刊/国内
《科教导刊》省级教育类旬刊 ISS
《文艺生活》省级教育类月刊 ISS
学术推荐 更多>>

《中小学电教

     《中小学电教》:省教育厅主管,省电教馆主办。国内统一刊号:C

《文艺生活》

     《文艺生活》杂志是经中华人民共和国新闻出版总署批准,由湖南省

《黑龙江科技

     《黑龙江科技信息》杂志是经国家科技部和国家新闻出版总署批准在
首页   -   关于我们   -   联系我们   -   发表流程   -   网站声明   -   在线投稿   -   友情链接

咨询电话 13889158687(微信同号)  QQ咨询:854727998


投稿邮箱:lunwen133@163.com
学术源论文发表咨询网 www.xueshuyuang.com  备案号:
闽ICP备2021001903号-2
版权所有  学术源论文发表咨询网