学术源论文发表咨询网 公告: 首页 - 网站声明 - 在线投稿 - 发表流程 - 联系我们 - 加入收藏
医学期刊
建筑期刊
教育综合
计算机类
教育期刊
新闻体育
学报刊物
水利/档案
核心期刊
农业/牧业
科技期刊
音乐/美术
工业期刊
煤炭/电力
经济期刊
其他刊物
您当前的位置:首页 > 医学期刊 > 正文
厦门免费医学论文发表-人类癌症-种系基因调查:连接早期胚胎中 X 染色体定位、DNA 甲
发布时间:2025-10-19 08:54:45  来源:  【 】   浏览:

厦门免费医学论文发表-人类癌症-种系基因调查:连接早期胚胎中 X 染色体定位、DNA 甲基化和性别偏向表达

阿克塞尔·洛里奥特 ,朱莉·德维斯 ,洛朗·加托,查尔斯·德·斯梅特 抽象 人类癌症种系 (CG) 基因是一组睾丸特异性基因,在各种肿瘤中变得异常激活。正在进行的研究旨在了解它们的功能,以评估它们作为抗癌治疗靶点的潜力。有证据表明,CG 基因的亚类存在,具体取决于常染色体或性染色体上的位置、对 DNA 甲基化进行转录调节的依赖,以及配子发生和早期胚胎发生过程中的表达概况。为了澄清这个问题,我们开发了 CTexploreR,这是一个 R/Bioconductor 包,它集成了人类 CG 基因的最新参考列表 (n = 146) 与多个块和单细胞甲基组和转录组数据集。根据启动子甲基化谱和对 DNA 甲基化抑制剂的反应性,74% 的 CG 基因被归类为 DNA 甲基化依赖性 (Methdep)。有趣的是,大多数 X 连锁 CG 基因 (69/70) 都属于这一类,从而表明 DNA 甲基化依赖性与 X 染色体上睾丸特异性基因的过度代表性有关。我们进一步观察到,虽然 X 连锁的 Methdep CG 基因在胎儿睾丸的精原细胞前发生去甲基化和激活,但它们中的大多数在女性生殖细胞中抵抗 DNA 去甲基化,因此在胎儿和成人卵母细胞中保持沉默。重要的是,许多 X 连锁 Methdep CG 基因(例如 FMR1NB、GAGE2A、MAGEB2/C2、PAGE2、VCX3A/B)在受精后维持了这种母体特异性印记,并且仅在遗传父系 X 染色体的女性植入前胚胎中表达。总之,我们使用 CTexploreR 包的研究使我们能够证明 X 连锁 CG 基因经历短暂的母体印记,因此有助于早期胚胎的转录性别二态性。 作者总结 癌症种系 (CG) 基因包括一组通常仅在睾丸中活跃但在不同类型的肿瘤中异常打开的基因,使它们成为新抗癌治疗的潜在靶点。我们开发了一种名为 CTexploreR 的新分析工具来研究这些基因,并观察到大量 CG 基因位于 X 染色体上,并使用 DNA 甲基化作为非睾丸组织的抑制机制。在胎儿睾丸中,这些基因失去甲基化并在早期生精细胞中被激活,而在女性卵巢中,它们保持甲基化并保持沉默。值得注意的是,我们证明几个CG基因在受精后保持这种甲基化模式,因此在女性胚胎中表达,而不是在男性胚胎中表达,这些胚胎只继承了一条母系X染色体。因此,携带这种短暂母体印记的 CG 基因似乎是植入前胚胎中性别偏向 mRNA 表达的主要贡献者。因此,我们的发现为CG基因的功能、早期胚胎的性别二态性以及表观遗传印记的代际传递开辟了新的研究领域。 数字 Fig 7Fig 8Fig 9Fig 1Fig 2Fig 3Fig 4Fig 5Fig 6Fig 7Fig 8Fig 9Fig 1Fig 2Fig 3 引文: Loriot A、Devis J、Gatto L、De Smet C (2025) 人类癌症种系基因调查:连接早期胚胎中的 X 染色体定位、DNA 甲基化和性别偏向表达。公共科学图书馆基因 21(10): 电子邮件1011734。 https://doi.org/10.1371/journal.pgen.1011734 编辑 器: Duncan Sproul,爱丁堡大学 MRC 人类遗传学部门,大不列颠及北爱尔兰联合王国 收到: 2025 年 5 月 16 日;接受: 2025 年 9 月 29 日;发表: 10月 15, 2025 版权所有: © 2025 Loriot et al.这是一篇根据知识共享署名许可条款分发的开放获取文章,允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。 数据可用性: 所有结果都是使用 CTexploreR (www.bioconductor.org/packages/release/bioc/html/CTexploreR.html) 生成的,其中包括一个配套包 CTdata,用于存储所有使用的数据集。本文中用于生成图形的整个代码可在 GitHub 存储库 (https://github.com/UCLouvain-CBIO/2023-CTexploreR) 中找到。 资金: Axelle Loriot 得到了 de Duve Institute 的支持。资助者在研究设计、数据收集和分析、发表决定或手稿准备中没有发挥任何作用。 利益争夺: 提交人声明不存在竞争利益。 介绍 癌症-种系 (CG) 基因,也称为癌症-睾丸 (CT) 基因,是一组通常仅在睾丸生殖细胞中表达的基因,但在很大一部分不同组织学起源的肿瘤中变得异常激活。具有这种特定表达谱的基因最初是根据其产生细胞溶解性T淋巴细胞识别的肿瘤特异性抗原的能力来鉴定的[1]。CG基因产物的免疫原性是由于其在生殖细胞中的表达受限,生殖细胞不表达抗原呈递的主要组织相容性复合物(MHC)[2]。相反,体细胞来源肿瘤中 CG 基因的激活会产生出现在细胞表面的抗原肽,并且可以被免疫系统识别为非自身。因此,CG基因是抗癌疫苗的理想靶点[3,4]。然而,它们独特的表达谱将其临床潜力扩展到癌症免疫疗法之外。确实,预计它们可能用作癌症生物标志物[5],并且可能代表开发副作用有限的抗癌疗法的有吸引力的靶点[5]。在这方面,正在进行研究以阐明CG基因的细胞功能仍然知之甚少,以确定它们是否有助于致癌途径[6\u20128]。 自最初发现 CG 基因以来,许多其他基因已通过克隆肿瘤抗原编码基因或转录谱来鉴定。发现分离的 CG 基因具有几个共同特征。首先,大多数CG基因存在于X染色体上[9],这被认为是由于具有睾丸特异性功能的基因的进化限制造成的。“性拮抗”理论指出,在进化过程中,赋予雄性生殖优势而不是雌性的生殖优势的基因在X染色体上富集[10]。然而,目前尚不清楚 CG 基因是否发挥与性相关的功能。进一步的观察是,许多位于X染色体上的CG基因属于基因家族,并且具有最近的进化起源,其中一些是人类物种特有的[11]。 CG基因的一个显著特征是,其中许多基因使用DNA甲基化(CpG序列中胞嘧啶的化学修饰)作为体细胞组织中转录抑制的主要机制[12,13]。因此,这些基因在肿瘤中的异常激活可以用肿瘤发生经常伴随的整体DNA去甲基化过程来解释[14\u201216]。然而,DNA 甲基化对所有 CG 基因的作用尚未得到研究,因此不确定这种表观遗传调控机制是否适用于全部或仅部分基因。 在成人睾丸中,在精子发生的各个阶段观察到 CG 基因的表达。令人惊讶的是,位于X染色体上的CG基因在减数分裂前阶段表现出优先表达,特别是在精原细胞中[17]。相反,驻留在 X 以外的染色体上的 CG 基因通常在生殖细胞分化的后期阶段表达,包括精母细胞和精子细胞。这种染色体位置依赖性表达模式的原因仍未解释。 一些CG基因也在雌性生殖细胞中表达[18,19]。然而,尚不清楚这是否可以推广到所有 CG 基因。研究女性种系中的基因表达并不是一件容易的事,因为减数分裂前生殖细胞仅存在于胎儿卵巢中,而卵母细胞仅占构成成人卵巢组织的细胞的一小部分。 最后,几项研究报道了胚胎中CG基因的表达[20,21]。然而,关于这种表达发生的胚胎阶段,以及胚胎表达适用于大多数或仅少数 CG 基因的程度,仍然存在不确定性。 考虑到上述问题,CG 基因似乎实际上可能属于不同的类别,具体取决于染色体位置、转录调控和表达谱。然而,建立这样的子分类需要访问一个整合了CG基因各种特征的数据库。目前,参考数据库是CTdatabase[22],这是一个基于文献的存储库,于2009年发布。CT数据库引用了276个CG基因,但不再更新。最近使用组学数据对它们在正常组织中的表达进行重新评估表明,该数据库中的某些基因没有表现出预期的组织特异性表达[6]。CT数据库的另一个局限性是它不是易于导入的格式,并且某些基因没有正确命名,这完全导致下游分析的互作性较差。最近的组学研究产生了其他CG基因列表[23\u201226]。然而,这些列表彼此之间存在很大差异,主要是因为它们使用各种标准来定义 CG 基因。此外,许多列表是作为补充数据文件而不是可搜索的数据库提供的。最后,这些研究都没有探讨 DNA 甲基化参与单个 CG 基因的调节。 在这里,我们提出了CTexploreR [27],这是一个R/Bioconductor软件包,它将最新的CG基因参考列表与多个组学数据库集成在一起,包括正常和癌组织和细胞系的甲基化组和转录组,以及雄性和雌性腺以及早期胚胎的单细胞RNA-Seq和亚硫酸氢盐Seq数据。使用CTexploreR [27],我们探索了CG基因亚类别的存在,与配子发生和胚胎发生过程中DNA甲基化依赖性、染色体定位和表达谱有关。 结果 CTexploreR 包 作为第一步,我们使用公开可用的组学数据来实现可靠的CG基因列表(图1A)。检查了基因型-组织表达(GTEx)数据库[28]中健康组织的RNA-Seq数据,并选择了表达严格限于睾丸的基因。然而,我们注意到一些众所周知的CG基因(例如,MAGE、SSX、CT45A和GAGE家族的基因)在GTEx睾丸样本中是检测不到的。这可能是因为这些基因家族中成员之间的序列相似性很高,这导致 mRNA 读数的多重定位(即与不同基因组区域对齐的读数)并随之而来的 GTEx RNA-Seq 处理管道中的消除。为了克服这个问题,正常组织的原始 RNA-Seq 数据在多映射支持下进行了处理。在这些条件下,最初缺失的CG基因变得可观察到(S1图),并被添加到睾丸特异性基因列表中。接下来,我们试图消除在睾丸体细胞以及体细胞组织的离散细胞群中显示表达的基因。为此,将基因列表与人类蛋白质图谱[30]的单细胞类型图谱分类[29]进行交叉,以排除被标记为任何体细胞类型特异性的基因。这导致了 1493 个基因的最终列表,这些基因在睾丸生殖细胞中表现出高度限制的表达。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图1. CTexploreR。 (A) 应用于选择 CG 基因的工作流程摘要。(B) 集成到包中的组学数据集。 https://doi.org/10.1371/journal.pgen.1011734.g001 接下来,筛选选定的基因,以识别那些在肿瘤细胞中被激活的基因。为此,筛选了来自癌症基因组图谱 [31] (TCGA) 和癌细胞系百科全书 [32] (CCLE) 的 RNA-Seq 数据,并选择了至少 1% 的肿瘤和任何组织学类型的癌细胞系中显示转录激活的基因。为了选择具有高表达特异性的基因,我们在此阶段进一步消除了正常肿瘤周围组织 (TCGA) 中超过阈值表达水平(> 25% 样本中 TPM > 0.5)的基因。 我们的工作流程最终列出了 146 个 CG 基因,这些基因在睾丸生殖细胞中显示出高度特异性表达,并在肿瘤细胞中显示显着激活(S1 表)。这些基因被转录在构成CTexploreR包核心的表格中[27]。 我们将多个组学数据集集成到包中,并开发了能够在体或单细胞水平上可视化正常组织和肿瘤组织中CG基因的表达和启动子DNA甲基化的功能(图1B)。 值得注意的是,我们还编制了一份被称为“CG-preferential”(n = 134)的基因列表,这些基因显示出不严格局限于睾丸(testis-preferential)的表达,但在不同的肿瘤中表现出显着的上调(S2表)。然而,我们将把分析重点放在 146 个高度特异性的 CG 基因上。 CTexploreR与其他CG基因数据库的比较 我们将146个CG基因列表与CT数据库中报告的基因进行了比较[22]。引人注目的是,CT数据库中包含的276个基因中有183个不存在于我们的CG基因列表中(图2A),因为它们被CTexploreR认为是非睾丸特异性和/或未在癌症中激活的。另一方面,我们在 CTexploreR 中选择的 83 个 CG 基因以前未在 CTdatabase 中报告过。如上所述,最近根据组学数据分析建立了其他CG基因列表[23\u201226],但所使用的选择方法并不一致。毫不奇怪,所选CG基因的数量因列表而异,并且研究之间的重叠通常非常低(图2B)。尽管存在这种明显的异质性,但我们观察到CTexploreR中列出的98个CG基因(67%)也存在于至少一个其他基因列表中(图2B)。重要的是,CTexploreR 中选择的 48 个基因以前从未被归类为癌症种系。总之,这些观察结果表明,我们的列表代表了非常严格但极具代表性的 CG 基因选择。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图2. CTexploreR 的 CG 基因列表与其他癌症睾丸基因列表的比较。 (A)维恩图显示CTexploreR(棕色)和CT数据库(灰色)中报告的CG基因之间的重叠。请注意,该分析仅应用于 CTdatabase 的 246 个基因,因为最初报告的 276 个基因中有 30 个被错误注释。(B)翻转图显示CTexploreR与其他五个已发表的癌症睾丸基因列表之间的所有交集,按交集数和交叉基因数排序。矩阵中的实心圆表示属于交点的列表。 https://doi.org/10.1371/journal.pgen.1011734.g002 大多数CG基因表现出DNA甲基化依赖性 在生成了可互作的CG基因数据集后,我们首先着手确定其中哪些依赖于启动子DNA甲基化作为转录调控机制。为此,我们首先探索了正常人体组织的全基因组亚硫酸氢盐测序(WGBS)数据,以识别在非表达体细胞组织中表现出一致启动子甲基化的CG基因。此外,我们还询问了暴露于DNA甲基化抑制剂5-Aza-2′-脱氧胞苷(5-AzadC)的细胞系(n = 8)的RNA-Seq数据[33\u201236],目的是识别由该治疗诱导的CG基因。满足两个标准(预期启动子甲基化谱和 5-AzadC 转录诱导)的 CG 基因被归类为“甲基化依赖性”(Methdep)。对于少数CG基因(n = 22,主要包括MAGE、GAGE、CT45等多定位基因),由于WGBS数据缺失,仅使用第二个标准进行分类。根据我们的过滤标准,108/146(74%)CG基因符合Methdep的条件(图3A)。WGBS数据的可视化证实,Methdep CG基因的启动子甲基化水平在体细胞组织中通常较高,而在睾丸(体细胞和生殖细胞的混合物)和精子中则明显较低(图3B)。Methdep CG基因的启动子在胎盘中也显示出中间的DNA甲基化水平,胎盘是一个临时器官,之前已经报道了几种CG基因的表达[37]。相反,非Methdep CG基因的启动子显示出高度可变的甲基化水平,体细胞组织和种系组织之间没有显着差异(图3B)。5-AzadC处理的细胞系的RNA-Seq数据的热图表示(图3C)显示,在至少一个细胞系中暴露于DNA甲基化抑制剂时,Methdep CG基因显着上调,但非Methdep CG基因没有。总之,这些结果表明,CG 基因根据其对组织特异性表达的 DNA 甲基化的依赖性分为两类:大多数依赖于其启动子 DNA 甲基化状态(Methdep,74%),另一部分(非 Methdep,26%)可能依赖于其他调节机制。由于 CpGs 的密度会影响 DNA 甲基化的调节作用,因此我们检查了 CG 基因启动子的 DNA 序列。我们观察到,与非 Methdep CG 基因相比,Methdep CG 基因更常含有 CpGs 中等密度的启动子(Fisher 精确检验:p 值 = 0.0002;图3D)。这与先前的观察结果一致,表明CpGs密度中等的启动子更容易获得组织特异性甲基化模式[38]。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图3. 确定 CG 基因的 DNA 甲基化依赖性。 (A) 分类为 DNA 甲基化依赖性 (Methdep) 或非依赖性 (non-Methdep) 的 CG 基因的选择标准和比例。(B)从WGBS分析推断出正常组织中CG基因启动子的平均DNA甲基化水平。每个点代表一个 CG 基因启动子 (C) 根据暴露于 (+) 或未暴露 (-) 的指示细胞系的 RNA-Seq 数据,评估 CG 基因对 DNA 去甲基化剂诱导的反应性 (5azadC)。(D)Methdep和非Methdep的CG基因启动子根据其启动子区域的CpG密度(每100 bp的CpG数量)进行分类:高(n ≥ 4)、中等(2 ≤ n < 4)、低(n < 2)。每个类别中的 CG 基因数量以图形表示。(E)Methdep基因在CG基因(146个基因中有1个无法分类)和非CG睾丸生殖细胞特异性基因中的比例。 https://doi.org/10.1371/journal.pgen.1011734.g003 然后,我们试图确定CG基因是否表现出甲基化依赖性的特定倾向,或者这一特征是否在所有睾丸生殖细胞特异性基因中普遍共享,即即使是那些在癌症中没有被激活的基因。为此,我们将甲基化依赖性过滤应用于最初选择的睾丸生殖细胞特异性基因,这些基因未保留为 CG 基因 (n = 1331)。结果表明,在这些基因中,只有14.7%属于Methdep,而85.3%属于非Methdep组(图3E)。因此,这些结果表明CG基因之间DNA甲基化依赖性具有很强的富集(卡方检验,p值= 2.33E-64),表明使用这种调控机制的基因在癌症中特别容易发生异常激活。 DNA 甲基化依赖性 (Methdep) CG 基因富集在 X 染色体上 146个CG基因的染色体分配显示,其中70个(48%)在X染色体上定位(图4A)。这一计数表明X染色体上显着富集,即使在每条染色体的基因总数归一化后也是如此,这与之前的观察结果一致[17]。出乎意料的是,位于 X 染色体上的 CG 基因中有 98% (69/70) 属于 Methdep 类别。这与非Methdep CG基因形成鲜明对比,后者在X染色体上没有显示富集(图4A和4B)。值得注意的是,在比较睾丸特异性基因的 Methdep 和非 Methdep 类别时,也做出了类似的观察结果,这些基因在肿瘤中没有激活,因此不被归类为 CG 基因(图 4B)。总之,这些结果表明,CG 基因,更普遍的是睾丸特异性基因在 X 染色体上的位置偏差归因于 DNA 甲基化依赖性,而不是睾丸特异性表达或功能。这一观察结果不符合解释 X 染色体上睾丸特异性基因富集的“性拮抗”理论。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图4. CG基因在X染色体上的富集与其DNA甲基化依赖性有关。 (A)Methdep和非Methdep CG基因的染色体分布。(B)评估了所有睾丸特异性基因(CG或非CG)的X染色体富集与DNA甲基化依赖性有关。 https://doi.org/10.1371/journal.pgen.1011734.g004 X连锁Methdep CG基因在肿瘤中显示出更高的激活频率 研究表明,CG基因在肿瘤中被激活的易感性差异很大,有些基因在某些肿瘤中的激活率超过50%,而另一些基因则从未超过几%[23]。在这里,我们检查了我们定义的 CG 基因的子类别在癌症中被激活的倾向是否不同。为此,检查了三种组织学类型(黑色素瘤、肺腺癌、头颈癌)的肿瘤细胞系(CCLE)和组织(TCGA)的RNA-Seq数据集。我们观察到,与非 Methdep 类别的基因相比,Methdep 类别的 CG 基因通常在肿瘤中表现出更频繁的激活和更高的表达水平(图 5A 和 5B)。驻留在X染色体上的Methdep CG基因的激活频率和表达水平最高,尤其是MAGE家族成员(图5C)。请注意,所有肿瘤类型中单个CG基因的激活频率都可以在CTexploreR包中检索。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图5. Methdep 和非 Methdep CG 基因在癌细胞系 (CCLE) 和肿瘤样本 (TCGA) 中的表达。 (A) 显示黑色素瘤 (SKCM)、肺腺癌 (LUAD) 和头颈癌 (HNSC) 中 CG 基因表达水平的热图。每种组织学类型代表了 50 个随机选择的细胞系或肿瘤。基因顺序基于沃德聚类。(B)SKCM、LUAD和HNSC中CG基因在阳性样本(上图)中的平均表达水平和激活频率(下图)。如果基因的表达水平≥ 1 TPM,则样本被定义为基因阳性。韦尔奇的 t 检验。(C) 与 (B) 中一样,但结合了三种癌症类型,并鉴定了 X 连锁基因。(D)肿瘤细胞系和组织样本中Methdep和非Methdep CG基因共激活的比较。 https://doi.org/10.1371/journal.pgen.1011734.g005 CG基因经常被发现在肿瘤中表现出共激活[14,37],这归因于它们对DNA甲基化的依赖性,因此它们在经历了广泛的全基因组DNA去甲基化的肿瘤中普遍容易去抑制[14,39\u201241]。为了支持这一论点,我们观察到,与非Methdep CG基因相比,Methdep CG基因在肿瘤细胞系和组织中显示出更高的共激活趋势,后者显示出更分散的激活模式(图5A和5D)。总之,这些结果证实,在 CG 基因中,受 DNA 甲基化调节的基因在癌症中共同去抑制的风险更高。 DNA 甲基化和染色体位置影响精子发生过程中的 CG 基因表达模式 先前的研究报道了CG基因在精子发生过程中表达的不同模式,X连锁CG基因在生殖细胞分化的减数分裂前阶段表现出明显的表达偏向[17,18,39,42]。然而,不同类别的CG基因的确切表达窗口尚未得到系统定义。为了解决这个问题,我们分析了来自成人睾丸的公开scRNA-Seq数据[43,44]。如图6A所示,不同类别的CG基因在精子发生的不同阶段表现出对比的mRNA表达模式。大多数 X 连锁 CG 基因也属于 Methdep 类别,在精子发生的减数分裂前阶段表现出优先表达,即从精原细胞干细胞到早期精母细胞。这些基因的 mRNA 水平在晚期精母细胞中降低,在细长的精子细胞和精子中完全不存在。值得注意的是,一些X连锁的Methdep CG基因表现出不同的表达谱(SPANXB1、SPANXD、SPANXC、DDX53、TGIF2LX),因为它们的mRNA从圆形精子细胞阶段开始进入精子即可检测到(图6A)。不驻留在X染色体上的Methdep CG基因表现出较少的表达限制谱,其中几个基因的mRNA几乎在精子发生的所有阶段都被检测到(图6A)。最后,非Methdep CG基因(无论其染色体位置如何)显示出不同的表达窗口,尽管表达窗口有限,因为scRNA-Seq数据在生殖细胞中鉴定出相应的mRNA,代表减数分裂前,减数分裂或减数分裂后阶段的精子发生(图6A)。总之,这些结果表明,精子发生过程中CG基因的表达模式受到对DNA甲基化的依赖性和在X染色体上的位置的影响。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图6. CG基因在雄性种系中的表达和启动子DNA甲基化。 (A)基于scRNA-Seq数据的CG基因在产前和成年男性生殖细胞中的表达。热图显示了在任何成人睾丸生殖细胞的≥5%中检测到的CG基因(n = 96)的数据,以及每个种系阶段的50个随机选择的细胞(PGC:原始生殖细胞,FGC:胎儿生殖细胞,Spg:精原细胞,Spg:精细胞,Spd:精子细胞)。(B) 成人精子发生过程中常染色体 (n = 18205)、X 连锁 MethDep CG (n = 59) 和 X 连锁非 CG (n = 696) 基因的 mRNA 表达水平(平均对数计数,95%CI)。在减数分裂前阶段未检测到的基因被排除在分析之外。红色虚线代表MSCI的开始。(C)产前雄性生殖细胞分化的时间。(D)左图:检测到CG基因的胎儿生殖细胞平均分数的箱线图(计数>0)。右图:跨发育时间点的雄性生殖细胞和雄性体细胞 (Soma) 中 CG 基因的平均启动子 DNA 甲基化水平的箱线图。(E)雄性产前生殖细胞中CG基因代表性实例的表达(阳性细胞的分数)和平均启动子甲基化水平(%)。 https://doi.org/10.1371/journal.pgen.1011734.g006 已经证明,X连锁的Methdep CG基因启动子在精子中保持未甲基化状态,即使这些基因在这个阶段不再表达[16]。因此,X连锁Methdep CG基因的减数分裂后沉默可能依赖于DNA甲基化无关的机制。一个合理的解释是精母细胞中发生减数分裂性染色体失活(MSCI)的过程,并导致驻留在X染色体上的大多数基因发生DNA甲基化非依赖性下调[45,46]。为了支持这一假设,我们观察到X连锁的Methdep CG mRNA消失的时间与源自X染色体上大部分基因的mRNA消失的时间一致(图6B)。因此,这一观察结果表明,在经历 MSCI 的 X 染色体上的位置解释了 X 连锁 Methdep CG 基因减数分裂后的下调。 产前雄性生殖细胞中 Methdep CG 基因的 DNA 去甲基化和激活 由于许多 Methdep CG 基因已经在精原干细胞中表达,这对应于成人睾丸中最早的生殖细胞阶段,因此我们的下一个问题是确定这些基因是否在产前种系发育过程中被去甲基化和激活,如果是,则在哪一步。在人类男性中,原始生殖细胞 (PGC) 在受精后周 (PFW) 4-6 左右迁移到发育中的性腺中。在PFW 8和10之间,PGC开始产生生殖细胞,这些生殖细胞通过连续的分化阶段进行,以下统称为胎儿生殖细胞(FGC)(图6C)。FGC分化的最终步骤导致原原细胞的形成,前精原细胞在PFW 12和20之间在胎儿性腺中积累,并在出生前保持静止状态[47,48]。第一波基因组去甲基化发生在迁移的 PGC 中,在此期间约 80% 的 DNA 甲基化标记被擦除。随后是DNA去甲基化的第二阶段,发生在PFW 7和11之间的性腺中,并进一步将甲基化CpG的比例降低到6-8%[49]。 为了评估Methdep CG基因在不同产前雄性生殖细胞阶段的表达和DNA甲基化状态,下载了两项研究的公开数据集,这些研究在出生前人性腺(PFWs6和21之间收获)在单细胞水平上分析了转录组(scRNA-Seq)和DNA甲基化组(scBS-Seq)[48,50].在分析雄性性腺衍生的scRNA-Seq数据后,我们观察到,与PGC或FGC相比,Methdep CG基因(X和非X)的mRNA检测在精原细胞前显着增加(图6A和6D)。这一观察结果与先前的研究一致,这些研究将MAGEA4(一种由X连锁Methdep CG基因编码的蛋白质)确定为胎儿男性性腺精原细胞前分化的特异性标志物[51]。另一方面,对scBS-Seq的检查表明,虽然Methdep CG基因启动子的平均DNA甲基化水平在最早的胚胎生殖细胞阶段(PFW 6-7)已经很低(中位数= 23%),但从PFW 17开始,它们显示出进一步下降(中位数= 7%)(图6C和6D)。后一个时间窗口遵循第二个基因组 DNA 去甲基化,并且与前精原细胞的积累同时发生。对单个Methdep CG基因的scRNA-Seq和scBS-Seq数据的详细检查证实,产前雄性生殖细胞的转录上调与广泛的启动子去甲基化同时发生(图6E)。总之,这些数据表明,尽管Methdep CG基因启动子在PGC中已经部分去甲基化,但其中许多在PFW 7之后经历了进一步的DNA去甲基化,这与原原细胞前mRNA表达的增加有关(图6D)。生殖细胞发育过程中DNA甲基化和单个CG基因表达的模式可以在CTexploreR中检索。 雌性生殖细胞中 X-Methdep CG 基因的有限 DNA 去甲基化和激活 女性的生殖细胞发育与男性有很大不同,特别是因为减数分裂是在胎儿发育过程中启动的(从 PFW 12 开始),产生的卵母细胞在第一个减数分裂前期仍然停滞。从青春期开始,卵巢中的卵母细胞亚群在每个月经周期恢复成熟,导致卵母细胞排卵,并进一步发展到减数分裂 2 中期(MII 卵母细胞)。减数分裂的完成仅发生在 MII 卵母细胞受精后。我们搜索以确定我们在雄性生殖细胞中检测到表达的 CG 基因是否也在雌性生殖细胞中表达。为此,我们使用了从产前女性性腺的生殖细胞[48]和不同成熟阶段的成年卵母细胞[43]中生成的scRNA-Seq数据。结果表明,根据在雄性生殖细胞中的表达来鉴定的44%的CG基因的mRNA在产前和/或成年雌性生殖细胞中未检测到(比较图6A和图7A)。有趣的是,这种男性偏向的表达仅对 X 连锁 Methdep CG 基因显着(卡方检验,p值 = 1.99E-7),而对其他两类 CG 基因不显着(图 7B)。然而,X-Methdep CG基因中有一些例外,在产前(PAGE2、PAGE5)或成体(MAGEB1、MAGEB2、MAGEC1、FTHL17)卵母细胞发育阶段(图7A)在雌性生殖细胞中显示出可检测到的mRNA表达。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图7. 女性种系中CG基因的表达和启动子DNA甲基化。 (A)基于scRNA-Seq数据(显示每个阶段50个随机选择的细胞)在产前和成年雌性种系发育的不同阶段显示CG基因(与图6A中相同的基因)表达的热图。(B) 在任何阶段的雄性或雌性生殖细胞中表达的 CG 基因数量(在 scRNA-Seq 数据中> 10% 的细胞中计数> 0)。(C)产前雌性生殖细胞分化的时间。(D)跨发育时间点的雌性生殖细胞和雌性体细胞(Soma)中CG基因的平均启动子DNA甲基化水平的箱线图。非CG基因组包括4047个自连锁基因和137个X连锁基因,这些基因是根据体细胞中DNA甲基化水平高(>75%)选择的。(E)成熟MII卵母细胞和精子细胞(不包括携带Y染色体的细胞)中X连锁CG基因的平均启动子DNA甲基化水平。(F)位于X染色体、MII卵母细胞和精子细胞中的Methdep CG(n = 40)和非CG(n = 780)基因之间平均启动子DNA甲基化水平(%)的比较。 https://doi.org/10.1371/journal.pgen.1011734.g007 接下来,我们探索了从人类产前性腺生成的scBS-Seq数据[50],以建立女性胚胎和胎儿生殖细胞中Methdep CG基因的DNA甲基化谱。据报道,与雄性一样,雌性的 PGC 会经历 DNA 甲基化标记的第一次部分擦除(降至 ~20% 甲基化 CpG),然后是 PFW 7 和 10 之间的 DNA 去甲基化第二阶段,只留下约 7% 的 CpG 甲基化。值得注意的是,在女性PGC中,灭活的X染色体已经被PFW 4重新激活[49]。我们观察到,在女性性腺中,X连锁的Methdep CG基因的启动子甲基化水平中位值为25%,在受精后几周内没有下降(图7C和7D)。这与非 X Methdep CG 基因的启动子形成鲜明对比,后者的中位 DNA 甲基化水平在 PFW 17 时降至 6%(图 7D)。作为对照,我们还评估了大部分体细胞甲基化但非CG基因的甲基化状态,这些基因驻留在常染色体或X染色体上,并证实这些基因内DNA甲基化的中位水平在产前卵母细胞中降低到7%(图7D)。总之,这些观察结果表明,X连锁的Methdep CG基因显示出在胎儿卵子发生过程中逃逸广泛启动子DNA去甲基化的特定特征。重要的是,由于它们在雄性种系发育过程中不会逃脱去甲基化(图6D),因此X连锁的Methdep CG基因有望在受精配子中表现出性别特异性的DNA甲基化谱。对从成年精子和MII卵母细胞生成的scBS-Seq数据集的检查证实了这一点[52],结果表明,MII卵母细胞中X连锁Methdep CG基因启动子的DNA甲基化水平通常高于精子(36.7% vs 11.1%,Welch t检验,p值= 1,83E-08)(图7E和7F)。相比之下,驻留在X上的非CG基因在MII卵母细胞中启动子DNA甲基化的保存性并不相似(图7F)。 X-Methdep CG在早期胚胎中的性别特异性印记和表达 研究表明,大多数配子携带的DNA甲基化标记(亲本印记基因上的DNA甲基化标记除外)在受精后会迅速消失[53]。在这里,我们试图找出我们发现特异性存在于卵母细胞中的 X 连锁 Methdep CG 基因上的 DNA 甲基化标记在胚胎受精后是否保留下来。如果情况确实如此,人们会期望在仅继承一条卵母细胞来源的母体 X 染色体的男性胚胎中,X 连锁的 Methdep CG 基因将比继承两条 X 染色体的女性胚胎保持更高水平的 DNA 甲基化,一条是母系的,另一条是父系的。为了解决这个问题,我们分析了从成熟的人类配子和受精后不同时间从植入前胚胎中分离出来的细胞生成的scBS-Seq数据集[52]。有趣的是,我们发现,从受精卵到囊胚阶段,X连锁的Methdep CG基因在雄性胚胎与雌性胚胎中表现出显着更高的启动子DNA甲基化水平(图8A),从而支持在早期胚胎发育过程中保存这些基因上的卵母细胞特异性DNA甲基化。植入后,X连锁的Methdep CG基因在雄性和雌性胚胎中均显示出广泛的从头DNA甲基化,尽管它们在雄性胚胎中保持着略高的启动子甲基化水平(图8A)。对单个X连锁Methdep CG基因的scBS-Seq数据的详细分析证实了植入前胚胎中男性偏向的DNA甲基化,并且还揭示了XX个女性胚胎中等位基因特异性DNA甲基化谱,很可能反映了父系来源的未甲基化等位基因和母系来源的甲基化等位基因的存在(图8B)。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图8. 植入前胚胎中 X 连锁 Methdep CG 基因的瞬时母体印记和性别特异性表达。 (A)分析生殖细胞和早期胚胎(男性或女性)的scBS-Seq数据,以评估X连锁Methdep CG基因的平均启动子DNA甲基化水平(仅那些最初显示MII卵母细胞中>33%甲基化的基因)。携带Y的精子细胞被排除在分析之外。韦尔奇的 t 检验。(B)雄性和雌性生殖细胞和植入前胚胎中代表性Methdep X连锁CG基因的详细scBS-Seq结果。(C)雄性和雌性囊胚的内细胞团(ICM)或滋养外胚层(TE)的单个细胞中X连锁Methdep CG基因的表达(TPM)。热图仅显示在任何类型的细胞中> 20% 中检测到的基因。Y 连锁基因显示为对照。(D)火山图,代表比较雌性和雄性囊胚细胞的全球差异表达分析的结果。 https://doi.org/10.1371/journal.pgen.1011734.g008 接下来,我们搜索以确定我们观察到的性别特异性 DNA 甲基化模式是否与雄性和雌性胚胎中 X 连锁 Methdep CG 基因的差异表达相关。事实上,可以预料的是,这些基因在 XY 男性胚胎中会保持沉默,XY 男性胚胎只继承了一条母体 X 染色体,并在其上被甲基化。另一方面,在女性胚胎中,父系 X 的存在应该允许它们表达。对来自人类两性囊胚的scRNA-Seq数据的分析[52]表明,大约40%的X连锁Methdep CG基因在女性胚胎中表现出优先表达,在来自内部细胞团和滋养外胚层的细胞中检测到更高水平的mRNA(图8C)。此外,全基因组差异表达分析表明,X连锁Methdep CG基因在雌性胚胎中的优先表达水平从所有其他基因中脱颖而出(图8D和S2)。值得注意的是,这种表达偏差不太可能完全归因于XX胚胎中的双基因剂量,因为X连锁的Methdep CG基因的女性偏向表达水平(倍数变化)明显高于X染色体上其他基因(图8D)。然而,一些未被归类为 CG 基因的 X 连锁基因(例如 GAGE12J、GAGE10、CSAG1)显示出较高的雌性优先表达。这些基因实际上属于描述良好的 CG 基因家族(GAGE、CSAG),但没有通过我们高度严格的纳入 CG 基因组的标准。总之,我们的分析揭示了人类 X 连锁 Methdep CG 基因的一个有趣的新特征,证明其中一些基因带有短暂的性别特异性印记,因此在早期胚胎中表现出女性偏向的表达。值得注意的是,对小鼠胚胎产生的scRNA-Seq数据的分析[54]表明,这种性别特异性表达在小鼠中不发生(S3图)。这可以通过小鼠中CG基因缺乏保守来解释(S3图),以及早期雌性小鼠胚胎中存在父系X染色体失活过程[55]。 讨论 我们创建了 CTexploreR,一个 R/Bioconductor 包,以生成描述 CG 基因的更新数据库。我们使用组学数据定义了 146 个 CG 基因的列表,根据严格的标准来选择在癌性病变中被激活但在睾丸生殖细胞中表现出高度限制表达的基因。这些基因及其主要特征列在构成 CTexploreR 核心的表格中。此外,还创建了特定的功能来方便访问本研究中提供的所有数据,使用户能够快速可视化(或提取)正常或肿瘤组织和细胞中任何 CG 基因的 mRNA 表达和 DNA 甲基化谱。值得注意的是,这些功能可以应用于任何人类基因的分析,将 CTexploreR 的实用性扩展到希望在任何转录组和甲基组数据集中测试他们最喜欢的基因的用户。 我们使用 CTexploreR 的主要目的是系统地分析 CG 基因,以研究在表达模式、表观遗传调控和染色体位置方面不同的基因亚群的存在。CG基因的一个有据可查的特征是它们依赖DNA甲基化作为体细胞组织抑制的主要机制[17,53]。然而,有证据表明,这可能不适用于所有CG基因[17,56]。本研究支持DNA甲基化确实参与了大多数CG基因(74%的Methdep CG基因)的调节的观点。然而,一小部分 CG 基因似乎不受 DNA 甲基化的直接控制(26% 的非 Methdep CG 基因)。与经常在肿瘤中共激活的 Methdep CG 基因相反,非 Methdep CG 基因在肿瘤样本中表现出分散的表达模式,这表明它们在肿瘤中的激活依赖于基因特异性调控机制,而不是共同的转录去抑制过程。 在 146 个 CG 基因列表中,48% 映射在 X 染色体上。这种富集与先前报道的观察结果一致,即具有睾丸特异性表达的基因通常在哺乳动物的X染色体上含量过高[57,58]。提出的解释依赖于性拮抗理论,该理论认为对男性有益和对女性有害的基因优先在X染色体上积累,因为男性的X半合子性允许隐性突变更有效地固定在这条染色体上[10,59]。令人惊讶的是,我们观察到 X 染色体上的富集仅涉及显示 DNA 甲基化依赖性的睾丸特异性基因。由于 DNA 甲基化以外的机制而产生睾丸特异性表达的基因显示出无偏倚的染色体分布。因此,X染色体上睾丸特异性基因的积累似乎不仅与雄性有益功能有关,还与其基于DNA甲基化的转录调控模式有关。其原因尚不清楚,但可能与X连锁CG基因的进化起源有关,其中许多基因以多基因家族的形式出现,这些家族是最近通过回文复制获得的[11,60\u201262]。与常染色体相比,X染色体显示回文重复的富集[63,64]。这可能是由于减数分裂重组过程中缺乏完全同源的配对伙伴,导致男性减数分裂过程中X染色体发生重排的倾向增加[63,65]。有趣的是,研究表明,重复的DNA片段通常显示出高水平的CpG甲基化[66,67],从而表明X连锁CG基因可能在形成时就获得了这些标记。预计在这种甲基化状态下,由于发育过程中种系中发生的基因组DNA去甲基化过程,X连锁CG基因在生殖细胞中自发地采用特异性表达[49,68,69]。简而言之,我们提出 X 染色体上的 CG 基因由于与 DNA 甲基化一致的复制过程而倍增,因此“默认”采用了由生殖细胞中全局表观遗传波动决定的睾丸特异性表达模式。 X 连锁 Methdep CG 基因从精母细胞阶段开始大部分被沉默。这与减数分裂性染色体失活(miiotic sexual chromosome inactivation, MSCI)过程相吻合,MSCI导致减数分裂1期间驻留在X染色体上的大多数基因发生DNA甲基化依赖性下调[45,46]。因此,Methdep CG 基因在 X 染色体上的位置似乎是限制其在精子发生前减数分裂和减数分裂 1 阶段表达的必要特征。这可能是这些基因在 X 染色体上富集的另一个促成因素。 与X连锁CG基因相比,常染色体上的CG基因大多是单拷贝的,没有表现出X染色体上的CG基因的进化新颖性[11,70]。我们的分析表明,一半的非 X CG 基因似乎不依赖于 DNA 甲基化来表达其组织特异性表达。这些非 Methdep CG 基因在成人睾丸中具有可变的激活谱,它们在精子发生的特定阶段显示出狭窄的表达窗口。如前所述,这种特定的表达谱可能是由特定的转录因子组强加的,这些转录因子在男性减数分裂之前和减数分裂期间依次被激活[71]。 尽管先前的研究报道了几种CG基因在卵子发生过程中的表达[48],但我们的研究表明,大约一半的CG基因在男性配子发生过程中仅表达。对于 X 连锁 Methdep CG 基因亚群尤其如此,并且与我们的观察一致,即虽然这些基因的启动子在男性胎儿生殖细胞中完全去甲基化,但它们在女性生殖细胞发育过程中抵抗 DNA 去甲基化。值得注意的是,女性生殖细胞中这些基因启动子上的持续DNA甲基化不能归因于X染色体失活,因为不活跃的X染色体在胚胎发生的早期阶段被重新激活[49]。因此,X连锁的Methdep CG基因属于发育中的雌性生殖细胞中逃脱全基因组DNA去甲基化过程的少数基因组序列[49,50,69]。允许 X 连锁 Methdep CG 基因在女性种系发育过程中抵抗 DNA 去甲基化的机制仍有待发现。重要的是,由于 X 连锁 Methdep CG 基因在女性卵子发生过程中逃脱了 DNA 甲基化重编程,因此它们可能有助于将表观遗传从母亲传递给其后代。 我们研究最有趣的发现是 X 连锁 Methdep CG 基因在早期胚胎中表现出女性偏向的表达。这是由于雄性和雌性种系发育过程中启动子DNA甲基化水平的差异波动,以及早期胚胎发育过程中母系遗传DNA甲基化标记的保留(图9)。因此,X 连锁的 Methdep CG 基因表现出短暂的母体印记,后来当父系等位基因在植入时也从头甲基化时,该印记就会消失。瞬时印记在早期胚胎中并不少见[72\u201276],但由于父母双方都存在表层等位基因形式,因此对常染色体上基因的mRNA水平有中等影响。当涉及位于 X 染色体上的基因时,瞬时母体印记的后果是完全不同的,因为 XY 雄性胚胎仅继承母体表观等位基因。这确实是我们在X连锁Methdep CG基因中观察到的,该基因在早期胚胎中表现出强烈的女性偏向表达(图9)。在早期胚胎中表现出性别差异表达的基因引起了人们的极大兴趣[75,77,78],因为它们挑战了性别分化仅在6th妊娠周,此时男性性腺分化(SRY)的主要调节因子开始表达[79,80]。我们在早期胚胎中的转录组学分析表明,X连锁的Methdep CG基因在所有基因中表现出最高的女性偏向表达,这表明它们可能对植入前性别二态性有重要影响。更值得注意的是,X连锁的Methdep CG基因在生殖细胞中表现出雄性偏向的表达,而不是在早期胚胎中表现出雌性偏向的表达(图9)。 thumbnail 下载: PPT的PowerPoint 幻灯片 巴布亚新几内亚大图 蒂夫原图 图9. 配子发生过程中 X 连锁 Methdep CG 基因的母体印记导致植入前胚胎中雌性特异性表达。 在植入前胚胎中遗传的染色体的亲本来源是:母本 (m)、父本 (p)。 https://doi.org/10.1371/journal.pgen.1011734.g009 很难预测 X 连锁 Methdep CG 基因如何影响早期胚胎生物学,因为它们的细胞功能仅在生精细胞和癌细胞中进行研究,并且在很大程度上仍然定义不明确。当我们比较雄性和雌性胚胎时,GAGE 基因家族的几个成员(GAGE1、GAGE2A、GAGE12J)是差异表达最多的基因之一。一项针对人类癌细胞的研究表明,GAGE蛋白,特别是GAGE12变体,在染色质上招募组蛋白脱乙酰化酶,并诱导局部解压以促进DNA修复[81]。因此,发现过表达GAGE基因的肿瘤细胞对放疗或化疗诱导的DNA损伤具有更强的抵抗力[81,82]。属于MAGE家族的基因(MAGEB2、B6和MAGEC2)在早期胚胎中也表现出大量的雌性偏向表达。先前在肿瘤细胞系中的实验表明,MAGE蛋白调节P53和AMPKα1的活性和/或稳定性,这两种主传感器分别控制细胞应激反应和代谢适应[83\u201285]。一致地,在小鼠中进行的基因耗竭实验表明,Mage蛋白在暴露于遗传毒性应激或长期饥饿的动物的生精细胞中发挥保护作用[86]。如果上述基因在早期胚胎发生过程中发挥类似的功能,人们可能会认为女性胚胎将比男性胚胎更好地免受环境压力的影响。因此,当怀孕发生在不利条件下时,这些CG基因可能会对发育中胚胎的性别比例产生影响。有趣的是,研究表明,忍受饥荒的母亲表现出性别比例,转向更多女性分娩,在实验性营养不良的妊娠动物中也观察到了同样的趋势[87,88]。 综上所述,我们的工作表明,根据DNA甲基化依赖性和染色体位置,CG基因可分为三个亚组,它们在肿瘤、生殖细胞和早期胚胎中的表达模式不同。我们还发现,众所周知的 X 染色体上睾丸特异性基因的过度表示特别适用于体细胞组织中依赖 DNA 甲基化进行沉默的基因,这导致需要重新考虑这种富集的进化基础。最后,我们表明,由于雄性和雌性配子发生过程中DNA甲基化重编程的差异,一组CG基因在早期胚胎中表现出性别偏向的表达。因此,旨在了解CG基因的功能及其对肿瘤发育的潜在贡献的研究不仅应考虑它们在精子发生中的作用,还应考虑它们对性别特异性胚胎发育的贡献。 材料和方法 CG基因的选择 使用来自正常组织的批量 RNA-Seq 数据选择睾丸特异性和睾丸优先基因。从GTEx门户[84](GTEx_Analysis_2017-06-05_v8_RNASeQCv1.1.9_gene_median_tpm.gct.gz)获得来自正常组织的RNA-Seq表达数据,用于识别睾丸特异性和睾丸优先基因。睾丸特异性基因被定义为在睾丸中表达的基因(TPM ≥ 1)但在体细胞组织中不表达(所有体细胞组织中的 TPM < 0.5),并且在睾丸中的表达值至少比任何体细胞组织高 10 倍。睾丸优先基因被定义为在睾丸中表达的基因(≥ 1 TPM),在至少 75% 的体细胞组织中沉默(TPM < 0.5),并且一定水平的表达(总是至少比睾丸中检测到的水平低 10 倍)在少数(小于 25%)的体细胞组织中被耐受。此外,在另一个正常组织数据集中测试了最初在 GTEx 数据库中检测不到的基因(所有组织中的 TPM < 1)。我们使用从 ENCODE [89] 下载的 18 个正常组织的 RNA-Seq fastq 文件(登录号列在 S3 表中),这些文件经过重新处理(如 RNA-Seq 处理部分所述),以在计数步骤中包含或不包含多映射读数。当对多映射读数进行计数时(至少比丢弃多映射读数时多 5 倍)在睾丸中变得可检测到(TPM ≥ 1),但在体细胞组织中保持较低(表达量至少比睾丸低 10 倍)的基因如果其 TPM 值在所有体细胞组织中都<为 1,则被归类为睾丸特异性基因,否则被归类为睾丸特异性基因。 使用来自正常组织的 scRNA-Seq 数据过滤种系特异性基因。人类蛋白质图谱[31]中的单细胞类型图谱分类(https://www.proteinatlas.org/download/proteinatlas.tsv.zip)用于从我们最初选择的睾丸特异性基因中排除那些被标记为任何体细胞类型特异性的基因,包括源自睾丸组织的体细胞。因在某些体细胞类型中表达低(比任何生殖细胞类型中检测到的水平低至少 10 倍)而被排除的基因被重新分类为睾丸优先基因。 选择肿瘤中激活的基因。使用TCGAbiolinks v2.25.3 [90]下载了来自癌症基因组图谱(TCGA)[85]的RNA-Seq数据,用于测试对应于7种不同肿瘤类型(SKCM、LUAD、LUSC、COAD、ESCA、BRCA和HNSC)的4141个肿瘤样本中选定基因的激活。选择在至少 1% 的肿瘤中检测到的基因(TPM > 1)并在至少一个肿瘤样本中显示表达值高于 5 TPM。为了确保任何表达确实起源于癌细胞而不是肿瘤微环境,我们还使用癌细胞系百科全书(CCLE)[86]中的RNA-Seq数据应用了相同的激活标准(数据和元数据是从 https://ndownloader.figshare.com/files/34989922 和 https://ndownloader.figshare.com/files/35020903).测试了来自 20 种不同组织类型的 1229 个癌细胞系。我们选择的 1% 激活阈值是合理的,因为在 1-3% 的肿瘤细胞系中仅检测到许多众所周知的 CG 基因。 额外过滤渗漏基因。TCGA 和 CCLE 数据还用于过滤掉通过我们睾丸特异性基因初始选择标准的渗漏基因。我们推断,在至少 20% 的肿瘤样本和癌细胞系中,一个不完全沉默的基因(TPM < 0.5)有组成型表达的风险,而不是由肿瘤相关的激活过程诱导的。这些基因被去除了。同样,我们利用 TCGA 数据中可用的正常肿瘤周围样本从我们选择的基因中去除那些已经在这些细胞的很大一部分中检测到的基因(超过 25% 的正常肿瘤周围组织中的 TPM > 0.5)。 手动管理。使用IGV(整合基因组查看器)[91]和睾丸的bam比对文件对所有选定的基因进行可视化。出乎意料的是,我们观察到,对于某些基因,读数在外显子上没有正确比对,而是分布在跨越基因的广泛基因组区域,这可能反映了定义不明确的转录。这些基因已从我们的选择中删除。 Y 染色体上的 CG 基因。位于 Y 染色体 (n = 10) 上的 CG 基因仅存在于男性个体中,在随后评估肿瘤、生殖细胞和产前阶段的表达和 DNA 甲基化模式的分析中被忽略了。 甲基化依赖性分析 从ENCODE[89]下载了13个正常组织的WGBS数据作为床文件(入藏号列在S3表中)。此外,从 SRA(登录 SRR15427118)下载精子 WGBS fastq 文件,并使用 Trim Galore v0.5.0 进行处理,以修剪适配器并删除低质量的读数。甲基化检定是用俾斯马克v0.20.0完成的[92]。对正向和反向测序的相同CpG相对应的甲基化值进行平均。启动子甲基化水平表示位于上游 1 kb 和下游每个转录起始位点 (TSS) 200 pb 的所有 CpG 的平均甲基化值。对于显示多个TSS的基因,我们使用使用biomaRt包v2.54.0从Ensembl数据库检索到的经典转录本的TSS [93]。 我们还使用了 8 个用 DNA 甲基化抑制剂 5-Aza-2'-脱氧胞苷 (5-AzadC) 处理或未处理的细胞系的 RNA-Seq fastq 文件,这些文件是从 SRA 下载的(登录号列在 S3 表中)。这些文件按照 RNA-Seq 处理部分中的描述进行处理,允许对多映射读数进行计数。使用DESeq2(v1.46.0)[94]在每个细胞系中进行差异表达分析,以识别5-AzadC显着上调的基因。 使用两个标准将基因分类为甲基化依赖性:首先,它们必须在 8 种细胞系中的至少一种中被去甲基化剂显着诱导(logFC > 2 和 p 调整值 < 0.1)。其次,它们的启动子必须在正常体细胞组织中高度甲基化(所有体细胞组织的平均甲基化> 50%)。当基因的 WGBS 数据缺失时,仅使用第二个标准进行分类。 CTexploreR 提供每个启动子内 CpG 密度的测量值(-1000 bp 至 +200 bp),表示为 CpG 数量/启动子长度 x 100 (CpG_density)。在此基础上,基因被分为三类启动子 CpG 密度 (CpG_promoter):“低”(CpG_density < 2)、“中间”(2 ≤ CpG_density < 4) 和“高”(CpG_density ≥ 4)。 RNA-Seq 处理 使用FastQC(v0.11.8)[95]评估fastq文件的质量,并使用Trimmomatics(v0.38)[96]删除低质量的读取和适配器。使用hisat2(v2.1.0)[97]在grch38基因组上对齐read,并使用Subread(v2.0.3)[98]和Homo_sapiens的featureCounts评估基因表达水平。GRCh38.105.chr.gtf.gz gtf 文件。这两种软件都是在默认设置下启动的,以丢弃多映射读取。为了允许多映射,hisat2 的 -k 参数设置为 20(以增加报告的主要对齐数量),并使用 -M 参数运行 featureCounts(以计算与多个位置对齐的读取)。 scRNA-Seq 数据集 来自人类成人睾丸和卵母细胞的scRNA-Seq数据从GEO(种质GSE112013和GSE154762)下载,胎儿性腺scRNAseq数据从(https://cellxgene.cziscience.com/collections/661a402a-2a5a-4c71-9b05-b346c57bc451Data)下载。作者提供的原始计数和注释被使用并存储为SingleCellExperiment对象[99]。使用scuttle包的logNormCounts函数对计数值进行归一化和对数转换[100]。使用来自囊胚的两个 scRNA-Seq 数据集来比较雄性和雌性胚胎(参见下面的差异表达分析部分)。对于第一个(来自[52]),由于原始计数不可用,fastq文件从SRA(登录SRP074598)下载并按照RNA-Seq处理部分中的描述进行重新处理。读数小于 7E + 06 且检测到的基因少于 7500 的细胞被视为异常值并被删除。第二个数据集(来自[101])的原始计数和元数据是从ArrayExpress(E-MTAB-3929)下载的。 scBS-Seq 数据集 胎儿生殖细胞的DNA甲基化数据作为床文件(hg19坐标)从GEO(登录GSE107714)下载。卵母细胞、精子和早期胚胎甲基化文件(hg19坐标)是从GEO(登录GSE81233)下载的。使用位于上游1 kb和每个TSS下游500 pb的所有CpG的甲基化值计算每个启动子在每个阶段或时间点的平均甲基化(其坐标使用liftOver转换为hg19组装[102])。 雄性和雌性胚胎的差异表达分析 使用scuttle包的summarizeAssayByGroup函数[52]对囊胚scRNA-Seq原始计数进行胚胎ID和细胞类型(ICM或TE衍生细胞)求和[100]。这导致了 5 个 ICM 衍生的伪散装样品(2 个男性和 3 个女性)和 5 个 TE 衍生的伪散装样品(2 个男性和 3 个女性)。使用DESeq2(v1.46.0)[94]进行差异表达分析,比较男性和女性样本,采用设计~性别+细胞类型。同样,第二个囊胚数据集(来自[101])用于生成S2图所示的火山图。E4 和 E7 之间的胚胎计数按胚胎 ID、天和谱系(外胚层、原始内胚层、滋养外胚层或不适用)汇总。取出细胞数少于3个的伪散装样品。DESeq2 (v1.46.0) [94] 使用设计 ~ + lineage + day 运行。 CTexploreR 包 CTexploreR(www.bioconductor.org/packages/release/bioc/html/CTexploreR.html)已被开发为一种探索性可视化工具,允许用户快速生成一系列正常和癌症样本中CG基因表达和甲基化的表示[98]。它是与配套包CTdata [103]一起开发的,该包存储了CTexploreR使用的所有数据集。CTexploreR 和 CTdata 都是经过审查的 R/Bioconductor 软件包。 Statistical analyses and graphical representations Data analyses were done using R programming language (v 4.4.0). Figures were generated with ggplot2 v3.5.1 [104], UpSetR [105] and ComplexHeatmap v2.22.0 [106]. The entire code used to generate figures in this article is available on the GitHub repository (https://github.com/UCLouvain-CBIO/2023-CTexploreR). In some figures, statistical significance is represented by asterisks (*/**/*** indicates p value < 0.05/0.01/0.001, respectively, ns indicates non-significant). Supporting information Enabling multimapping in RNA-Seq data analysis reveals members of multigene families that were otherwise invisible. Showing 1/6: pgen.1011734.s001.eps Skip to figshare navigation sorry, we can't preview this file 1 / 6 Download figshare S1 图。 在 RNA-Seq 数据分析中启用多图映射可以揭示原本不可见的多基因家族成员。 GTEx分析中缺失的CG基因,使用正常人体组织的原始RNA-Seq数据进行重新分析。热图根据在 RNA 读数计数期间是排除多图(左)还是允许(右)多图比较结果。将“睾丸特异性”基因归入CG基因组(S1表),而“睾丸优先”基因被考虑纳入“CG优先”基因组(S2表)。 https://doi.org/10.1371/journal.pgen.1011734.s001 (每股收益) S2 图。 比较女性与男性植入前胚胎细胞的差异表达分析的火山图。 该分析基于 Petropoulos 及其同事生成的 scRNA-Seq 数据(Petropoulos 等人,2016 年,细胞 165,1-15)。结果证实了图8D中的结果,该结果源自另一组进行的scRNA-Seq研究(Zhu等人,2017年,Nat Genet 50,12–19)。 https://doi.org/10.1371/journal.pgen.1011734.s002 (每股收益) S3 图。 小鼠中 X-Methdep CG 基因几乎没有保守和缺乏性别偏向表达。 (A)用BiomaRt分析集成数据集,以评估指定物种中不同类别人类CG基因的直系同源物的存在。将保守性与大部分 X 连锁或常染色体人类基因进行比较,并表示为指定类别中在物种中至少具有一个直系同源基因的人类基因的百分比,使用高置信度或低置信度 Ensembl 设置。(B)图8D火山图示意图突出显示有或没有小鼠直系同源物的人 X 连锁基因。该图显示,大多数性别偏向的 X-Methdep CG 基因没有小鼠直系同源物。(C)火山图,代表比较雌性和雄性小鼠胚胎(32细胞阶段,Borensztein等人,2017年)的全球差异表达分析结果。与人类 X-CG 基因直系同源的小鼠 X 连锁基因以红色突出显示,非直系同源基因以蓝色突出显示。浅灰色点对应于所有非X小鼠基因。Xist 的雌性偏向表达反映了小鼠早期雌性胚胎中发生的父系 X 染色体失活(但不在人类中)。 https://doi.org/10.1371/journal.pgen.1011734.s003 (每股收益) S1 表。 146 个 CG 基因列表。 https://doi.org/10.1371/journal.pgen.1011734.s004 (XLSX) S2 表。 134 个 CG-Preferential 基因列表。 https://doi.org/10.1371/journal.pgen.1011734.s005 (XLSX) S3 表。 CTexploreR 分析中使用的数据集列表。 https://doi.org/10.1371/journal.pgen.1011734.s006 (PDF格式) 引用 1.范德布鲁根 P、特拉弗萨里 C、乔梅兹 P、卢尔昆 C、德普兰 E、范登艾因德 B 等。编码人类黑色素瘤上细胞溶解性 T 淋巴细胞识别的抗原的基因。科学。1991;254(5038):1643–7.PMID:1840703 查看文章考研/NCBI谷歌学术 2.Jassim A、Ollier W、Payne A、Biro A、Oliver RT、Festenstein H. 人中生殖细胞上 HLA 抗原的分析。欧洲免疫学杂志。1989;19(7):1215–20.PMID:2527157 查看文章考研/NCBI谷歌学术 3.Marchand M、van Baren N、Weynants P、Brichard V、Dréno B、Tessier MH 等。在接受基因 MAGE-3 编码并由 HLA-A1 呈递的抗原肽治疗的转移性黑色素瘤患者中观察到肿瘤消退。国际癌症杂志。1999;80(2):219–30.PMID:9935203 查看文章考研/NCBI谷歌学术 4.Thomas R、Al-Khadairi G、Roelands J、Hendrickx W、Dermime S、Bedognetti D. 基于 NY-ESO-1 的癌症免疫疗法:当前观点。正面免疫。2018;9:947. 查看文章谷歌学术 5.斯库德拉里 M.对癌症靶点的疯狂寻找:对抗癌症没有灵丹妙药。但是,通过靶向几乎完全存在于肿瘤细胞和睾丸中的蛋白质,研究人员可能已经发现了迄今为止最接近的东西。梅根·斯库德拉里 (Megan Scudellari) 探讨了少数年轻调查员如何希望将魔法变为现实。国家医学 2011 年;17:916–9. 查看文章谷歌学术 6.Van Tongelen A、Loriot A、De Smet C. 通过激活癌症种系基因对 DNA 低甲基化的致癌作用。癌症莱特 2017 年;396:130–7.PMID:28342986 查看文章考研/NCBI谷歌学术 7.怀特赫斯特 AW。癌症/睾丸抗原激活的原因和后果。Annu Rev 药理学毒醇。2014;54:251–72.PMID:24160706 查看文章考研/NCBI谷歌学术 8.马克斯菲尔德 KE、陶斯 PJ、科克兰 K、伍顿 J、马西恩 J、周 Y 等。癌症睾丸抗原的综合功能表征定义了对癌症多个特征的强制参与。纳特公社。2015;6:8840.PMID:26567849 查看文章考研/NCBI谷歌学术 9.老 LJ。癌症/睾丸 (CT) 抗原 - 配子发生与癌症之间的新联系。癌症免疫。2001;1:1。PMID:12747762 查看文章考研/NCBI谷歌学术 10.大米 WR。性染色体和性别二态性的进化。演化。1984;38(4):735–42.PMID:28555827 查看文章考研/NCBI谷歌学术 11.Dobrynin P、Matyunina E、Malov SV、Kozlov AP。人类癌症/睾丸抗原编码基因在进化中的新颖性。国际基因组学杂志。2013;2013:105108.PMID:23691492 查看文章考研/NCBI谷歌学术 12.De Smet C, Loriot A. 癌症中种系特异性基因的 DNA 低甲基化和激活。Adv Exp Med Biol. 2013;754:149–66.PMID:22956500 查看文章考研/NCBI谷歌学术 13.James SR、Link PA、Karpf AR. DNMT1 和 DNMT3b. 癌基因对 X 连锁癌症/种系抗原基因的表观遗传调控。2006;25(52):6975–85.PMID:16715135 查看文章考研/NCBI谷歌学术 14.德·斯梅特 C、德·巴克 O、法拉奥尼 I、卢尔昆 C、布拉瑟尔 F、文 T。肿瘤细胞中人类基因 MAGE-1 的激活与全基因组去甲基化相关。Proc Natl Acad Sci U S A. 1996;93(14):7149–53.PMID:8692960 查看文章考研/NCBI谷歌学术 15.金田 A、冢本 T、高村恩也 T、渡边 N、上西 M、杉村 T 等。多个启动子 CpG 岛中频繁的低甲基化与整体低甲基化相关,但与频繁的启动子高甲基化无关。癌症科学 2004 年;95(1):58–64.PMID:14720328 查看文章考研/NCBI谷歌学术 16.De Smet C、Lurquin C、Lethé B、Martelange V、Boon T. DNA 甲基化是一组具有富含 CpG 的启动子的生殖系和肿瘤特异性基因的主要沉默机制。分子细胞生物学 1999 年; 19(11):7327–35. PMID:10523621 查看文章考研/NCBI谷歌学术 17.辛普森 AJG、卡巴列罗 OL、Jungbluth A、陈 YT、老 LJ。癌症/睾丸抗原、配子发生和癌症。Nat Rev 癌症。 2005; 5(8):615–25. PMID:16034368 查看文章考研/NCBI谷歌学术 18.Koslowski M、Bell C、Seitz G、Lehr HA、Roemer K、Müntefering H 等。人类癌症中生殖系基因的频繁非随机激活。癌症研究 2004 年; 64(17):5988–93. PMID:15342378 查看文章考研/NCBI谷歌学术 19.Nelson PT、Zhang PJ、Spagnoli GC、Tomaszewski JE、Pasha TL、Frosina D 等。癌症/睾丸 (CT) 抗原在胎儿卵巢中表达。癌症免疫。2007;7:1。PMID:17217256 查看文章考研/NCBI谷歌学术 20.Loriot A、Reister S、Parvizi GK、Lysy PA、De Smet C. 人类胚胎和成体干细胞中癌症种系基因的 DNA 甲基化相关抑制。 干细胞。 2009; 27(4):822–4. PMID:19350682 查看文章考研/NCBI谷歌学术 21.Loriot A、Parvizi GK、Reister S、De Smet C. 人类植入前胚胎中癌症种系基因的沉默:干细胞中活性从头 DNA 甲基化的证据。生化生物物理学研究通讯。 2012; 417(1):187–91. PMID:22155245 查看文章考研/NCBI谷歌学术 22.Almeida LG、Sakabe NJ、deOliveira AR、Silva MCC、Mundstein AS、Cohen T 等人CT数据库:癌症睾丸抗原高通量和精选数据的知识库。核酸研究 2009;37(数据库问题):D 816-9。PMID:18838390 查看文章考研/NCBI谷歌学术 23.Carter JA、Matta B、Battaglia J、Somerville C、Harris BD、LaPan M 等。泛癌/睾丸基因的鉴定和三阴性乳腺癌治疗靶向的验证:基于 Lin28a 和 Siglece 的疫苗接种可诱导抗肿瘤免疫并抑制转移。生物Rxiv。2023. PMID:37214884 查看文章考研/NCBI谷歌学术 24.王 C、顾 Y、张 K、谢 K、朱 M、戴 N 等。系统鉴定 19 种癌症类型中具有癌症-睾丸表达模式的基因。国家公社。 2016;7:10499. PMID:26813108 查看文章考研/NCBI谷歌学术 25.Jamin SP、Hikmet F、Mathieu R、Jégou B、Lindskog C、Chalmel F 等。联合 RNA/组织分析可识别新的癌症/睾丸基因。分子肿瘤。 2021; 15(11):3003–23. PMID:33426787 查看文章考研/NCBI谷歌学术 26.Bruggeman JW、Koster J、Lodder P、Repping S、Hamer G. 生殖细胞特异性基因的大量表达是癌症的标志,也是新疗法开发的潜在靶点。基因。2018;37(42):5694–700.PMID:29907769 查看文章考研/NCBI谷歌学术 27.德斯梅特 L,加托 ALJDADC。CTexploreR。生物导体;2023. doi: https://doi.org/10.18129/B9.BIOC.CTEXPLORER 28.GTEx 联盟。GTEx 联盟对人体组织的遗传调控效应图集。科学。2020;369(6509):1318–30.PMID:32913098 查看文章考研/NCBI谷歌学术 29.Karlsson M、Zhang C、Méar L、Zhong W、Digre A、Katona B 等。人体组织的单细胞型转录组学图谱。科学高级 2021;7(31):eabh2169。PMID:34321199 查看文章考研/NCBI谷歌学术 30.Uhlén M、Fagerberg L、Hallström BM、Lindskog C、Oksvold P、Mardinoglu A 等。基于组织的人类蛋白质组图谱。科学。2015;347(6220):1260419.PMID:25613900 查看文章考研/NCBI谷歌学术 31.癌症基因组图谱研究网络、Weinstein JN、Collisson EA、Mills GB、Shaw KRM、Ozenberger BA 等。癌症基因组图谱泛癌分析项目。纳特·热内特。2013;45(10):1113–20.PMID:24071849 查看文章考研/NCBI谷歌学术 32.Barretina J、Caponigro G、Stransky N、Venkatesan K、Margolin AA、Kim S 等。癌细胞系百科全书能够对抗癌药物敏感性进行预测建模。自然界。2012;483(7391):603–7.PMID:22460905 查看文章考研/NCBI谷歌学术 33.亨里奇 KO、本德 S、萨达蒂 M、德雷达克斯 D、加特尔格鲁伯 M、邵 C 等。综合基因组规模分析确定了不利神经母细胞瘤中转录失调的表观遗传机制。癌症研究 2016 年;76(18):5523–37.PMID:27635046 查看文章考研/NCBI谷歌学术 34.Piunti A、Smith ER、Morgan MAJ、Ugarenko M、Khaltyan N、Helmin KA 等人CATACOMB:一种内源性诱导基因,通过 H3K27M 样机制拮抗 Polycomb 抑制复合物 2 的 H3K27 甲基化活性。科学高级 2019;5(7):eaax2887。PMID:31281901 查看文章考研/NCBI谷歌学术 35.格兰丁 M、马托特 P、德维利 G、坐浴盆 Y、甘图斯 A、法夫罗特 C 等。抑制 DNA 甲基化可促进乳腺肿瘤对 netrin-1 干扰的敏感性。EMBO Mol Med. 2016;8(8):863–77.PMID:27378792 查看文章考研/NCBI谷歌学术 36.Park J-W、Sahm F、Steffl B、Arrillaga-Romany I、Cahill D、Monje M 等人 TERT 和 DNMT1 表达预测神经胶质瘤对地西他滨的敏感性。神经肿瘤。2021;23(1):76–87.PMID:32882013 查看文章考研/NCBI谷歌学术 37.德普兰 E、雅顿 K、特拉弗萨里 C、加福里奥 JJ、西科拉 JP、德斯梅特 C 等。MAGE家族12个基因的结构、染色体定位和表达。免疫遗传学。1994;40(5):360–9.PMID:7927540 查看文章考研/NCBI谷歌学术 38.韦伯 M、赫尔曼 I、施塔德勒 MB、拉莫斯 L、帕博 S、雷布恩 M 等。启动子 DNA 甲基化在人类基因组中的分布、沉默潜力和进化影响。纳特·热内特。2007;39(4):457–66.PMID:17334365 查看文章考研/NCBI谷歌学术 39.Loriot A, Boon T, De Smet C. 在精原细胞中表达的 12 个基因中鉴定出 5 个新的人类癌症种系基因。国际癌症杂志。2003;105(3):371–6.PMID:12704671 查看文章考研/NCBI谷歌学术 40.Woloszynska-Read A、Mhawech-Fauceglia P、Yu J、Odunsi K、Karpf AR. 肿瘤间和瘤内 NY-ESO-1 表达异质性与卵巢癌的启动子特异性和整体 DNA 甲基化状态相关。临床癌症研究 2008 年;14(11):3283–90.PMID:18519754 View ArticlePubMed/NCBIGoogle Scholar 41.Diacofotaki A、Loriot A、De Smet C. 肺腺癌中 DNA 去甲基化诱导的组织特异性基因簇的鉴定:超过种系基因。癌症(巴塞尔)。2022;14(4):1007.PMID:35205751 查看文章考研/NCBI谷歌学术 42.Babatunde KA、Najafi A、Salehipour P、Modarressi MH、Mobasheri MB。癌症/睾丸基因与精子生物学和功能有关。伊朗基础医学科学杂志,2017 年;20(9):967–74.PMID:29085590 查看文章考研/NCBI谷歌学术 43.Yan R、Gu C、You D、Huang Z、Qian J、Yang Q 等。使用单细胞多组学测序解码人类卵母细胞中的动态表观遗传景观。细胞干细胞。2021;28(9):1641-1656.e7。PMID:33957080 查看文章考研/NCBI谷歌学术 44.郭 J、Grow EJ、Mlcochova H、Maher GJ、Lindskog C、Nie X 等。成人人类睾丸转录细胞图谱。细胞研究 2018;28(12):1141–57.PMID:30315278 查看文章考研/NCBI谷歌学术 45.Singer-Sam J, Robinson MO, Bellvé AR, Simon MI, Riggs AD. 通过定量 PCR 测量小鼠精子发生过程中 HPRT、PGK-1、PGK-2、APRT、MTase 和 Zfy 基因转录物的变化。核酸研究 1990 年;18:1255–9. 查看文章谷歌学术 46.小鼠精子发生过程中 X 连锁基因表达的半定量分析:RT-PCR 产物的溴化乙锭染色。Genet 肛门技术应用 1992 年;9(4):117–23.PMID:1282026 查看文章考研/NCBI谷歌学术 47.Culty M. Gonocytes,生殖细胞谱系中被遗忘的细胞。出生缺陷影响了今天的 C 胚胎。2009;87(1):1–26.PMID:19306346 查看文章考研/NCBI谷歌学术 48.加西亚-阿隆索 L、洛伦齐 V、马泽奥 CI、阿尔维斯-洛佩斯 JP、罗伯茨 K、桑乔-塞拉 C 等。人类性腺发育的单细胞路线图。自然界。2022;607(7919):540–7.PMID:35794482 查看文章考研/NCBI谷歌学术 49.郭F、Yan L、郭H、李L、胡B、赵Y等。人类原始生殖细胞的转录组和 DNA 甲基化组景观。细胞。2015;161(6):1437–52.PMID:26046443 查看文章考研/NCBI谷歌学术 50.李 L、李 L、李 Q、刘 X、马 X、Yong J 等。以单细胞分辨率剖析人类胎儿生殖细胞发育的表观基因组动力学。细胞研究 2021;31(4):463–77.PMID:32884136 查看文章考研/NCBI谷歌学术 51.加斯克尔 TL、埃斯纳尔 A、罗宾逊 LLL、安德森 RA、桑德斯 PTK。人类胎儿睾丸内生殖细胞的免疫组织化学分析:三个亚群的鉴定。Biol Reprod. 2004;71(6):2012–21.PMID:15317684 查看文章考研/NCBI谷歌学术 52.朱 P、郭 H、任 Y、侯 Y、董 J、李 R 等。人类植入前胚胎的单细胞 DNA 甲基化组测序。纳特·热内特。2018;50(1):12–9.PMID:29255258 查看文章考研/NCBI谷歌学术 53.威尔金森 AL,佐赞 I,拉格-冈恩 PJ。人类早期胚胎发育的表观遗传调控。细胞干细胞。2023;30(12):1569–84.PMID:37858333 查看文章考研/NCBI谷歌学术 54.Borensztein M、Syx L、Ancelin K、Diabangouaya P、Picard C、Liu T 等。Xist 依赖性印记 X 失活及其失败的早期发育后果。Nat Struct Mol Biol. 2017;24(3):226–33.PMID:28134930 查看文章考研/NCBI谷歌学术 55.早期小鼠胚胎中预灭活父系 X 染色体的遗传。自然界。2003;426(6968):857–62.PMID:14661031 查看文章考研/NCBI谷歌学术 56.Kang Y, Hong JA, Chen GA, Nguyen DM, Schrump DS.包括 BORIS、CTCF 和 Sp1 在内的动态转录调节复合物调节肺癌细胞中 NY-ESO-1 的表达。基因。2007;26(30):4394–403.PMID:17260018 查看文章考研/NCBI谷歌学术 57.王 PJ、麦凯瑞 JR、杨 F、佩奇 DC。精原细胞中表达的丰富 X 连锁基因。纳特·热内特。2001;27(4):422–6.PMID:11279525 查看文章考研/NCBI谷歌学术 58.Gurbich TA, Bachtrog D. X 染色体上的基因含量进化。Curr Opin Genet Dev. 2008 年;18(6):493–8.PMID:18929654 查看文章考研/NCBI谷歌学术 59.Mank JE、Hultin-Rosenberg L、Zwahlen M、Ellegren H. 多效性约束阻碍了脊椎动物基因表达中性拮抗作用的解决。Am Nat. 2008;171(1):35–43.PMID:18171149 查看文章考研/NCBI谷歌学术 60.Katsura Y, Satta Y. 癌症免疫抗原 MAGE 基因家族的进化史。公共科学图书馆一号。2011;6(6):e20365。PMID:21695252 查看文章考研/NCBI谷歌学术 61.张 Q, Su B. 癌症/睾丸抗原基因家族的进化起源和人类特异性扩展。分子生物学进化。2014;31(9):2365–75.PMID:24916032 查看文章考研/NCBI谷歌学术 62.杰克逊 EK、贝洛特 DW、乔 TJ、斯卡莱茨基 H、休斯 JF、平蒂科娃 T 等。灵长类动物 X 染色体上的大回文通过自然选择保存下来。基因组研究 2021;31(8):1337–52.PMID:34290043 查看文章考研/NCBI谷歌学术 63.Porubsky D、Höps W、Ashraf H、Hsieh P、Rodriguez-Martin B、Yilmaz F 等。人类反复出现的倒置多态性与遗传不稳定和基因组疾病有关。细胞。2022;185(11):1986–2005.PMID:35525246 查看文章考研/NCBI谷歌学术 64.Warburton PE, Giordano J, Cheung F, Gelfand Y, Benson G. 人类基因组的倒置重复结构:X 染色体包含大量包含睾丸基因的大型、高度同源的倒置重复序列。基因组研究 2004;14(10A):1861-9。PMID:15466286 查看文章考研/NCBI谷歌学术 65.考皮 L、贾辛 M、基尼 S.减数分裂中重组 X 和 Y 染色体的棘手途径。Ann NY Acad Sci. 2012 年;1267:18–23.PMID:22954211 查看文章考研/NCBI谷歌学术 66.凯勒 TE,Yi SV。DNA 甲基化和重复基因的进化。Proc Natl Acad Sci U S A. 2014;111(16):5932–7.PMID:24711408 查看文章考研/NCBI谷歌学术 67.张 AY-F, 廖 B-Y.DNA 甲基化在哺乳动物基因复制后重新平衡基因剂量。分子生物学进化。2012;29(1):133–44.PMID:21821837 查看文章考研/NCBI谷歌学术 68.Gkountela S, Zhang KX, Shafiq TA, Liao W-W, Hargan-Calvopiña J, Chen P-Y, et al. 人类产前种系中的 DNA 去甲基化动力学。细胞。2015;161(6):1425–36.PMID:26004067 查看文章考研/NCBI谷歌学术 69.Tang WWC、Dietmann S、Irie N、Leitch HG、Floros VI、Bradshaw CR 等。独特的基因调控网络重置人类种系表观基因组以进行发育。细胞。2015;161(6):1453–67.PMID:26046444 查看文章考研/NCBI谷歌学术 70.史蒂文森 BJ、伊塞利 C、潘吉 S、扎恩-扎巴尔 M、海德 W、老 LJ 等。X 染色体上癌症/睾丸基因的快速进化。BMC 基因组学。2007;8:129.PMID:17521433 查看文章考研/NCBI谷歌学术 71.Han C. 哺乳动物精子发生中的基因表达程序。发展。2024;151(8):d ev202033。PMID:38691389 查看文章考研/NCBI谷歌学术 72.冈江 H、千叶 H、日浦 H、滨田 H、佐藤 A、宇都宫 T 等。人类早期发育过程中 DNA 甲基化动力学的全基因组分析。公共科学图书馆基因。2014;10(12):e1004868。PMID:25501653 查看文章考研/NCBI谷歌学术 73.桑切斯-德尔加多 M、法院 F、维达尔 E、梅德拉诺 J、蒙特亚古多-桑切斯 A、马丁-特鲁希略 A 等。人类卵母细胞来源的甲基化差异在胎盘中持续存在,揭示了广泛的短暂印记。公共科学图书馆基因。2016;12(11):e1006427。PMID:27835649 查看文章考研/NCBI谷歌学术 74.Proudhon C、Duffié R、Ajjan S、Cowley M、Iranzo J、Carbajosa G 等。防止从头甲基化有助于维持从配子遗传的亲本甲基化。摩尔细胞。2012;47(6):909–20.PMID:22902559 查看文章考研/NCBI谷歌学术 75.周Q, 王T, Leng L, 郑W, 黄J, 方F, et al.单细胞RNA-seq揭示了人类早期胚胎发生过程中性染色体的独特动态行为。Mol Reprod Dev. 2019;86(7):871–82.PMID:31094050 查看文章考研/NCBI谷歌学术 76.郭H、朱P、闫L、李R、胡B、连Y等。人类早期胚胎的 DNA 甲基化景观。自然界。2014;511(7511):606–10.PMID:25079557 查看文章考研/NCBI谷歌学术 77.理查森五世,恩格尔 N,库拉蒂纳尔 RJ。哺乳动物早期胚胎发生中性别偏向基因表达的比较发育基因组学。生物性别不同。2023;14(1):30.PMID:37208698 查看文章考研/NCBI谷歌学术 78.Engel N. 早期胚胎发生中的性别差异:染色体间调控为性别偏向的基因网络奠定了基础:性染色体和常染色体之间的对话在受精后不久就强加了性别认同。生物论文。2018;40(9):e1800073。PMID:29943439 查看文章考研/NCBI谷歌学术 79.古贝 J、科利尼翁 J、库普曼 P、卡佩尔 B、伊科诺穆 A、明斯特贝格 A 等。定位到小鼠 Y 染色体性别决定区域的基因是胚胎表达基因新家族的成员。自然界。1990;346(6281):245–50.PMID:2374589 查看文章考研/NCBI谷歌学术 80.辛克莱 AH、伯塔 P、帕尔默 MS、霍金斯 JR、格里菲斯 BL、史密斯 MJ 等。来自人类性别决定区的基因编码一种蛋白质,该蛋白质与保守的 DNA 结合基序具有同源性。自然界。1990;346(6281):240–4.PMID:1695712 查看文章考研/NCBI谷歌学术 81.Nin DS、Wujanto C、Tan TZ、Lim D、Damen JMA、Wu KY 等人 GAGE 通过调节染色质可及性介导宫颈癌的放射电抗性。细胞代表 2021 年;36(9):109621.PMID:34469741 查看文章考研/NCBI谷歌学术 82.Wollenzien H, Afeworki Tecleab Y, Szczepaniak-Sloane R, Restaino A, Kareta MS. 单细胞进化分析揭示了小细胞肺癌可塑性的驱动因素和化疗耐药的介质。摩尔癌症研究 2023;21(9):892–907.PMID:37256926 查看文章考研/NCBI谷歌学术 83.MAGE-A 肿瘤抗原通过组蛋白去乙酰化酶募集靶向 p53 反式激活功能,并赋予对化疗药物的耐药性。Proc Natl Acad Sci U S A. 2006;103(30):11160–5.PMID:16847267 查看文章考研/NCBI谷歌学术 84.Doyle JM、Gao J、Wang J、Yang M、Potts PR. MAGE-RING蛋白复合物包括E3泛素连接酶家族。摩尔细胞。2010;39(6):963–74.PMID:20864041 查看文章考研/NCBI谷歌学术 85.Pineda CT,Potts PR. 致癌 MAGEA-TRIM28 泛素连接酶通过泛素化和降解癌症中的 AMPK 来下调自噬。自 噬。2015;11(5):844–6.PMID:25945414 查看文章考研/NCBI谷歌学术 86.Fon Tacer K、Montoya MC、Oatley MJ、Lord T、Oatley JM、Klein J 等人MAGE 癌症睾丸抗原在环境胁迫下保护哺乳动物种系。科学高级 2019;5(5):eaav4832。PMID:31149633 查看文章考研/NCBI谷歌学术 87.宋 S.饥荒会影响出生时的性别比例吗?1959-1961年中国大跃进饥荒的证据。Proc Biol Sci. 2012;279(1739):2883–90.PMID:22456881 查看文章考研/NCBI谷歌学术 88.加德纳 DK,拉曼 MG,图阿斯佐治亚州。植入前胚胎的性别相关生理学。Mol Hum Reprod. 2010;16(8):539–47.PMID:20501630 查看文章考研/NCBI谷歌学术 89.ENCODE 项目联盟。人类基因组中 DNA 元素的综合百科全书。自然界。2012;489(7414):57–74.PMID:22955616 查看文章考研/NCBI谷歌学术 90.Colaprico A、Silva TC、Olsen C、Garofano L、Cava C、Garolini D 等。TCGAbiolinks:用于 TCGA 数据综合分析的 R/Bioconductor 包。核酸研究 2016;44(8):e71。PMID:26704973 查看文章考研/NCBI谷歌学术 91.Thorvaldsdóttir H、Robinson JT、Mesirov JP。Integrative Genomics Viewer (IGV):高性能基因组学数据可视化和探索。简要的生物信息。2013;14(2):178–92.PMID:22517427 查看文章考研/NCBI谷歌学术 92.Krueger F, Andrews SR. Bismark:用于亚硫酸氢盐-Seq 应用的柔性矫正器和甲基化调用器。生物信息学。2011;27(11):1571–2.PMID:21493656 查看文章考研/NCBI谷歌学术 93.Durinck S、Spellman PT、Birney E、Huber W. 用于将基因组数据集与 R/Bioconductor 包 biomaRt 集成的映射标识符。国家协议。2009;4(8):1184–91.PMID:19617889 查看文章考研/NCBI谷歌学术 94.Love MI、Huber W、Anders S. 使用 DESeq2 对 RNA-seq 数据的倍数变化和分散进行调节估计。基因组生物学 2014;15(12):550.PMID:25516281 查看文章考研/NCBI谷歌学术 95.FastQC:一种用于高通量序列数据的质量控制工具。访问日期:2025 年 3 月 21 日。https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ 96.Bolger AM、Lohse M、Usadel B. Trimmomatic:用于 Illumina 序列数据的灵活修剪器。生物信息学。2014;30(15):2114–20.PMID:24695404 查看文章考研/NCBI谷歌学术 97.Kim D、Paggi JM、Park C、Bennett C、Salzberg SL. 基于图的基因组比对和基因分型与 HISAT2 和 HISAT 基因型。国家生物技术。2019;37(8):907–15.PMID:31375807 查看文章考研/NCBI谷歌学术 98.Liao Y, Smyth GK, Shi W. featureCounts:一种高效的通用程序,用于将序列读数分配给基因组特征。生物信息学。2014;30(7):923–30.PMID:24227677 查看文章考研/NCBI谷歌学术 99.Amezquita RA、Lun ATL、Becht E、Carey VJ、Carpp LN、Geistlinger L 等。使用 Bioconductor 协调单细胞分析。Nat 方法。2020;17(2):137–45.PMID:31792435 查看文章考研/NCBI谷歌学术 100.麦卡锡 DJ、坎贝尔 KR、伦 ATL、威尔斯 QF。Scater:R. Bioinformatics 中单细胞 RNA-seq 数据的预处理、质量控制、归一化和可视化。2017;33(8):1179–86.PMID:28088763 查看文章考研/NCBI谷歌学术 101.Petropoulos S、Edsgärd D、Reinius B、邓 Q、Panula SP、Codeluppi S 等。单细胞 RNA-Seq 揭示了人类植入前胚胎的谱系和 X 染色体动力学。细胞。2016;167(1):285.PMID:27662094 查看文章考研/NCBI谷歌学术 102.生物导体包维护器。LiftOver:使用 rtracklayer 更改基因组坐标系。提升;2024. doi: https://doi.org/10.18129/B9.bioc.liftOver 103.德斯梅特 L,加托 ALJDADC。CT数据。生物导体;2023. doi: https://doi.org/10.18129/B9.BIOC.CTDATA 104.Wilkinson L. ggplot2:WICKHAM, H. Biometrics 用于数据分析的优雅图形。2011;67(2):678–9. 查看文章谷歌学术 105.Conway JR、Lex A、Gehlenborg N. UpSetR:用于可视化相交集及其属性的 R 包。生物信息学。2017;33(18):2938–40.PMID:28645171 查看文章考研/NCBI谷歌学术 106.Gu Z. 复杂的热图可视化。伊梅塔。2022;1(3):e43。PMID:38868715 查看文章考研/NCBI谷歌学术

 
上一篇:厦门免费医学论文发表-人类癌症-种系基因调查:连接早期胚胎中 X 染色体定位、DNA 甲

下一篇:最后一页
咨询方式

 ---->>学术源论文咨询发表网
 ---->>咨询QQ:854727998 
 ---->>电话:
   
13889158687(微信同号)

 ---->>邮箱:lunwen133@163.com
投稿写明所投期刊,3日内回复.五日未回复可电话咨询。

工作时间:8:00-17:00   周六值班、周日休息,国家法定假日休息

学术焦点 更多>>

《健康必读》省级医学月刊 当月发
《医药前沿》国家级医学月刊 ISS
《中国健康月刊》国家医学月刊-是
《才智》省级教育类月刊-CN22-13
《商情教育经济研究》省级教育类月
《考试周刊》省级教育类月刊/国内
《科教导刊》省级教育类旬刊 ISS
《文艺生活》省级教育类月刊 ISS
学术推荐 更多>>

《中小学电教

     《中小学电教》:省教育厅主管,省电教馆主办。国内统一刊号:C

《文艺生活》

     《文艺生活》杂志是经中华人民共和国新闻出版总署批准,由湖南省

《黑龙江科技

     《黑龙江科技信息》杂志是经国家科技部和国家新闻出版总署批准在
首页   -   关于我们   -   联系我们   -   发表流程   -   网站声明   -   在线投稿   -   友情链接

咨询电话 13889158687(微信同号)  QQ咨询:854727998


投稿邮箱:lunwen133@163.com
学术源论文发表咨询网 www.xueshuyuang.com  备案号:
闽ICP备2021001903号-2
版权所有  学术源论文发表咨询网