学术源论文发表咨询网 公告: 首页 - 网站声明 - 在线投稿 - 发表流程 - 联系我们 - 加入收藏
医学期刊
建筑期刊
教育综合
计算机类
教育期刊
新闻体育
学报刊物
水利/档案
核心期刊
农业/牧业
科技期刊
音乐/美术
工业期刊
煤炭/电力
经济期刊
其他刊物
您当前的位置:首页 > 其他类论文写作指导 > 正文
机器学习驱动的药物鉴定抑制细胞色素P450 2C9-厦门畜牧期刊杂志论文发表
发布时间:2022-01-28 15:14:47  来源:  【 】   浏览:
机器学习驱动的药物鉴定抑制细胞色素P450 2C9-厦门畜牧期刊杂志论文发表
 
埃洛迪·戈德瓦瑟,凯瑟琳•洛朗,娜塔莉•拉加德,西尔维·法布雷加,劳尔·奈,布鲁诺·维卢特莱,克里斯蒂安•耶尔施,阿诺德·B·尼科特,玛丽-安妮·洛里奥特 ,玛丽亚·米特瓦
出版日期: 2022年01月26日
 
 
抽象
细胞色素P450 2C9(CYP2C9)是一种主要的药物代谢酶,占肝CYPs的20%,负责15%药物的代谢。药物发现的一个普遍问题是避免CYP的抑制导致有毒药物积累和不良药物 - 药物相互作用。然而,由于其复杂性,CYP抑制的预测仍然具有挑战性。我们开发了一种原始的机器学习方法,用于预测抑制CYP2C9的药物样分子。我们通过整合CYP2C9蛋白质结构和动力学知识,CYP2C9抑制剂的原始物理化学性质选择以及机器学习建模,创建了新的预测模型。我们在公开数据上测试了机器学习模型,并证明我们的模型成功地预测了CYP2C9抑制剂,其准确性,灵敏度和特异性约为80%。我们通过实验验证了开发的方法,并首次鉴定了药物瓦替拉尼,吡啶酮,替格瑞洛和氯哌啶酮作为CYP2C9的强抑制剂,IC值<18μM,舍替吲,asapiprant,duvelisib和dasatinib作为中等抑制剂,IC50值在40至85μM之间。瓦他拉尼布被确定为最强的抑制剂,IC50值为0.067μM。代谢测定允许表征CYP2C9产生的abemaciclib,cloperidone,vatalanib和tarafenacin的特定代谢物。获得的结果表明,这种策略可以改善临床实践中药物间相互作用的预测,并可用于药物发现管道中候选药物的优先级。
 
作者简介
细胞色素P450(CYP)是含血红素的氧化酶的超家族,负责各种药物,异种生物和内源性分子的代谢。五种人类CYPs(1A2,2C9,2C19,2D6和3A4)参与∼95%的CYP介导的药物代谢,占药物代谢的∼75%。CYP抑制导致药物/化学物质消除减少,这是引起药物不良反应的药物间相互作用的主要原因。我们开发了一种原始的基于集成结构和机器学习的方法,用于预测CYP2C9抑制剂。它表现出优异的性能,其应用首次证明药物瓦他尼,吡啶酮,替格瑞洛和氯哌啶酮是CYP2C9的强抑制剂。
 
数字
Fig 5Fig 1Fig 2Table 1Table 2Table 3Table 4Fig 3Table 5Fig 4Fig 5Fig 1Fig 2Table 1
    
引文: Goldwaser E,Laurent C,Lagarde N,Fabrega S,Nay L,Villoutreix BO等人(2022)机器学习驱动的药物鉴定抑制细胞色素P450 2C9。PLoS Comput Biol 18(1):e1009820。https://doi.org/10.1371/journal.pcbi.1009820
 
编辑 器: Avner Schlessinger,美国西奈山伊坎医学院
 
收到: 七月 9, 2021;接受: 一月 10, 2022;发表: 一月 26, 2022
 
版权所有: © 2022 Goldwaser et al.这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用,分发和复制,前提是注明原始作者和来源。
 
数据可用性: 所有相关数据均在稿件及其支持信息文件中。
 
资金: 这项研究得到了法国ANR机构的支持,grant ToxME(M.A.M.,M.A.L.,C.J.,A.B.N)。。资助者在研究设计,数据收集和分析,出版决定或手稿准备方面没有任何作用。
 
相互竞争的利益: 作者宣布不存在相互竞争的利益。
 
这是一篇PLOS计算生物学方法论文。-厦门畜牧期刊杂志论文发表
 
介绍
细胞色素P450(CYP)是含血红素的氧化酶的超家族,负责各种药物,异种生物和内源性分子的代谢[1-4]。5种人CYP(1A2、2C9、2C19、2D6和3A4)参与约95%的CYP介导的药物代谢,占药物代谢的75%[5]。此外,CYPs 3A4和2C9的巨大贡献在很大程度上是由这两种酶在人肝和肠中的高表达水平及其广泛的底物特异性驱动的[6]。药物发现的一个普遍问题是避免抑制药物代谢的CYPs。CYP抑制可导致药物/化学物质消除减少,这是引起严重不良事件的药物间相互作用(DDI)的主要原因[3,7,8]。因此,确定CYP的潜在抑制对于药物开发和临床药物治疗至关重要。
 
已经开发了许多计算方法,试图预测CYP介导的代谢和抑制[9-11]。通过学术生物测定(例如PubChem和ChEMBL)积累的可公开访问的数据使得能够开发定量构效关系(QSAR)模型,用于CYP抑制的计算机预测,以及使用机器学习(ML)方法对几种CYP同种型的多类别分类模型[12-14]。这些模型使用了CYP抑制剂的结构规则[15]或分子描述符,而没有考虑它们与蛋白质结构的相互作用。总体而言,这些模型显示出良好的预测性能,但采用机械知识和该酶家族的3D结构已被证明非常有用[16-19]。例如,Joshi等人[20]通过基于配体的联合药效团和基于结构的虚拟筛选鉴定了有效和选择性的CYP1A1抑制剂。此外,与PDB中可用的各种底物和抑制剂结合的CYP的众多实验3D结构[21]表明CYP活性位点具有极强的可塑性,并且可以容纳不同大小的结构多样化的配体[22,23]。因此,CYP的灵活性在这些相互作用中起着重要作用[24,25]。此前,我们开发了一种机器学习方法,通过结合基于配体的扩展连接指纹和配体相互作用能来预测CYP2D6抑制,因为构建了对应于不同CYP2D6构象的不同模型[26]。
 
在这里,我们开发了一种基于机器学习的原始方法,可以预测CYP2C9的抑制剂。该酶约占肝CYPs总量的20%,代谢超过15%的临床给药药物[22,27,28]和几种内源性化合物[29]。最近,我们使用分子动力学(MD)模拟结合能量分析,探索了CYP2C9在载物和底物结合状态下构象空间的大面积区域,这使我们能够生成代表结合位点关键运动的蛋白质构象[30]。在这里,我们通过结合CYP2C9蛋白质结构和动力学知识,CYP2C9抑制剂的原始物理化学描述符以及ML支持向量机(SVM)和随机森林(RF)算法,建立了新颖的预测模型。对PubChem Bioassay和ChEMBL数据的验证表明,开发的SVM和RF模型成功地对CYP2C9的抑制剂和非抑制剂进行了分类。然后使用ML模型筛选4480种实验性和批准的药物。对18种化学多样性的药物进行体外CYP2C9抑制试验,并对其中一些药物进行代谢测定。我们首次证明,药物瓦他拉尼,吡喹酮,替格瑞洛和氯哌酮是CYP2C9的强抑制剂,并且由CYP2C9产生abemaciclib,cloperidone,vatalanib和tarafenacin的特异性代谢物。
 
结果和讨论
基于结构和机器学习的集成建模,预测CYP2C9的抑制作用
在这项研究中,我们开发了分类机器学习模型,用于预测CYP2C9抑制和鉴定抑制CYP2C9的新药(图1)。我们从ChEMBL [31]和PubChem数据库[32]收集了CYP2C9的已知抑制剂和非抑制剂,以构建用于ML建模的训练和外部测试数据集。为了创建具有适用性的预测模型,同时覆盖药物样分子,同时保持化学多样性,我们对收集的化合物进行了"软"药物样过滤[33]和多样性聚类(详见方法)。不同簇质心的过滤数据集包含CYP2C9的4840个抑制剂和3301个非抑制剂。其中,我们随机选择80%的活性和非活性化合物作为训练集,其余20%构成外部验证测试集,同时保持相同比例的抑制剂和非抑制剂。分子量(MW)与训练和外部测试集的抑制剂和非抑制剂的logP如图1所示。总体而言,训练和测试集化合物的MW和logP在相同的范围内。我们的模型适用于由"软"药物样过滤器阈值给出的领域(参见S1文本)。
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 1. 该研究的工作流程包括数据集制备,CYP2C9结构,动力学和配体结合分析,用于训练不同预测模型的机器学习以及CYP2C9新药抑制剂的体外鉴定。
https://doi.org/10.1371/journal.pcbi.1009820.g001
 
为了考虑CYP2C9的灵活性,我们根据最近的MD模拟考虑了CYP2C9的构象变化[30]。这些750 ns的MD模拟探索了野生型CYP2C9在载物或底物结合状态下的构象空间的大面积区域,用于酶的活性物种,其血红素存在于化合物I状态(Cpd I),这与催化反应一致。药物双氯芬酸和氯沙坦是CYP2C9的典型底物,在MD模拟期间以底物结合状态存在。在这项工作[30]中,我们对结合位点的所有原子使用至少1.0 Å的均方根偏差(RMSD)距离进行结构聚类。保留了为三个研究系统中的每个系统生成的填充最多的40个簇(对应于覆盖85%MD模拟的构象),CYP2C9 apo,CYP2C9双氯芬酸结合,CYP2C9氯沙坦结合。然后,将五种不同药物的分子对接,即已知的CYP2C9,华法林,双氯芬酸,格列美脲,氟比洛芬和氯沙坦的底物,进入保留的120个质心的MD构象集合体并进入CYP2C9的几个晶体结构。这些对接分析使我们能够鉴定出在活性位点中具有合格底物取向的最佳五种MD蛋白构象(MD1,MD2,MD3,MD4和MD5),以及两种晶体结构(PDB IDs 1R9O,5XXI)[34,35](见S2图和S1表)作为结合口袋区域关键运动的代表性构象[30].七个选定的CYP2C9结构显示出结合位点的重要构象变化,允许容纳不同的配体。在这里,使用AutoDock Vina软件[36]将各种CYP2C9抑制剂和非抑制剂的训练集对接到这两个晶体和五个MD蛋白结构中(有关详细信息,请参阅方法)。然后使用对接评分计算的相互作用能量(IE)(如S3图所示)作为机器学习模型的描述符,(2)作为预测CYP2C9抑制剂的附加过滤器。
 
使用MOE软件计算训练集分子的物理化学分子描述符[37]。最初,我们计算了354个2D和3D MOE描述符。删除了具有 Pearson 相关系数绝对值大于或等于 0.85 的高度相关描述符和具有接近零方差的描述符。此选择产生了 170 个描述符。将7个CYP2C9结构的计算IE添加为基于结构的描述符,解释蛋白质 - 配体相互作用。然后,为了避免过度拟合并提出一种缩短计算时间的计算机策略,我们根据它们在预测分子抑制特性中的相对重要性选择了最佳描述符。该选择包括在训练数据集上构建多个RF模型,并选择具有最高基尼重要性的描述符子集[38]。基尼系数(也称为基尼杂质指数)是根据数据集中的类分布随机标记的情况下,对数据集中随机选择的元素进行错误分类的概率的度量。因此,我们通过对ntree和mtry参数执行扫描,使用170 MOE和7 IE描述符运行RF计算(有关详细信息,请参阅方法)。然后,保持参数具有最佳性能,我们执行了2000次RF运行,以根据基尼系数的缩小计算177个描述符的平均重要性(S4图)。根据计算的描述符的重要性(如S4图所示),前10个描述符(仅包括MOE描述符)对模型性能至关重要。在前10个描述符和前43个描述符(包括36个MOE和7个IE)之间,重要性缓慢下降。因此,我们构建了具有最佳10,15,20,30和40 MOE描述符的初步RF模型,以找到描述符的最佳组合。他们的性能(S2表)表明,从15个最佳MOE描述符开始,实现了良好的内部准确性,灵敏度和特异性(>75%)。因此,我们进一步考虑了最好的15和20 MOE描述符。此外,还选择了前43个描述符,包括7个IE描述符,并显示重要性值>20,以进行进一步分析(S1表)。<20的重要性观察到一个平台(S4图),因此采用更多的描述符会在模型中添加噪声。7个IE>20和2个MD构象显示出重要性,一个晶体结构(PDB ID:1R9O)>30显示出重要性。就重要性而言,36个最佳MOE描述符可以在S1表中看到。最重要的描述符对应于亲脂性(2D),芳香键的数量(2D),部分电荷(2D),负范德华表面积(2D,3D)和形状(3D:对角化惯性矩张量的第一个对角线元素,面外势能和表面粗糙度)。看来亲脂性和具有负部分电荷的溶剂暴露原子强烈有助于CYP2C9的抑制。与我们之前为预测CYP2D6抑制而开发的方法相比,这种方法的一个主要优点是,在这里根据其重要性对描述符进行理性选择,从而减少由于描述符不能充分区分活性和非活性化合物而引起的噪声,并减少计算时间。
 
图2表示训练和外部测试集的化学空间。使用36个最佳MOE描述符进行主成分分析(PCA)。前两个组件用于绘图。可以看出,从ChEMBL数据集中提取的抑制剂与PudChem的抑制剂具有相同的化学空间,但是,ChEMBL数据增加了训练和测试集抑制剂的多样性(图2A和2B)。抑制剂和非抑制剂覆盖了不同的化学空间(图2C和2D以及S1)。
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 2. 训练和测试集的化学空间,如主成分分析(PCA)所述。
 
将显示前两个分量及其表示形式(占总方差的百分比)。(A). PubChem 的训练集抑制剂的 PCA 与ChEMBL 数据集。(B) PubChem的外部测试组抑制剂的PCA与ChEMBL 数据集。(三)训练和外部试验组抑制剂的PCA。(D)训练和外部测试组的非抑制剂的PCA。
 
https://doi.org/10.1371/journal.pcbi.1009820.g002
 
预测模型对训练和外部测试数据的性能
然后,我们使用以下RF和SVM模型(有关详细信息,请参阅方法):170 MOE + 7 IE描述符,36个最佳MOE + 7个IE描述符,20个最佳MOE + 7个IE描述符,以及15个最佳MOE + 7个IE描述符。交叉验证应用于RF和SVM建模。对于 RF 建模,训练数据集的多样性是通过使用多个决策树来实现的,这些决策树由来自训练数据的自举样本和随机选择的一小部分描述符组成,以便在树的每个节点上做出决策。经过最佳训练的 RF 和 SVM 模型的超参数显示在 S3 表中。根据其准确性,敏感性,特异性和Matthews相关系数(MCC)评估模型的性能(见S1文本)。表 1 和表 2 分别总结了为不同数量的 MOE 描述符创建并应用于训练和外部验证测试集的最佳 RF 和 SVM 模型的结果性能。结果表明,所有RF和SVM模型均具有良好的预测能力,并且所有模型都成功地对CYP2C9抑制剂进行了正区分。所有模型均具有87%至90%的出色灵敏度和74%至79%的高特异性。对于所有模型,敏感性均高于特异性,这表明CYP2C9抑制剂检测的可靠性。对于RF模型训练,该模型包括36个MOE和7个IE描述符,结果最佳,内部和外部精度分别为83.66%和85.55%,与模型(包括170个MOE和7个IE描述符(分别为84.12%和85.55%)的性能相当。
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 1. 在训练集(交叉验证 CV)和外部验证集上使用 MOE 和 IE 描述符的优化 RF 模型的性能。
https://doi.org/10.1371/journal.pcbi.1009820.t001
 
thumbnail 下载:
PPTPowerPoint slide
PNGlarger image
TIFForiginal image
Table 2. Performances of the optimized SVM models with MOE and IE descriptors on the training set (cross-validation CV) and the external validation set.
https://doi.org/10.1371/journal.pcbi.1009820.t002
 
使用不同数量的描述符创建的SVM模型的比较得出了相同的结论。该模型取得了最佳效果,包括170个MOE和7个IE描述符,分别获得了84.3%和86.22%的内部和外部精度。具有36个MOE和7个IE描述符的模型的内部和外部精度非常相似,分别为82.55%和84.76%。表1和表2所示的RF和SVM模型的性能略好于不包括7个IE的相应模型的性能(如S4表所示)。此外,IE预测提供了有关假定抑制剂与CYP2C9在原子水平上相互作用的直接信息。我们成功地采用了这种IE过滤器来鉴定CYP2C9的新抑制剂(见下文)。对于所有型号,外部测试集的性能均略优于内部性能。尽管训练的所有分子与外部测试集之间的多样性得到了保证,最大化学相似性为0.85,但由于随机选择外部集合的分子,这可能是由于随机选择外部集合,在最近的其他ML建模研究中也观察到了这一点[39,40]。使用36个最佳MOE和7个IE描述符获得的出色性能表明,这些RF和SVM模型可用于寻找新的CYP2C9抑制剂。因此,我们保留了这两个模型以进行进一步分析。
 
将我们两个最终RF和SVM模型的平衡准确性、灵敏度、特异性和MCC值与先前研究中报道的预测CYP2C9抑制的模型进行了比较[18,41–45]。S5 表中给出了文献中报告的不同数据集和模型性能的基准。为了直接比较我们的模型与其他最新模型的性能,我们在这里展示了我们的最终模型的性能以及Web服务器CYPlebrity [44]和ADMETlab [45]上可用的两个最先进的模型,这些模型在我们的外部验证测试集抑制剂和非抑制剂上(见表3)。总体而言,我们的模型比其他模型(表3和S5)表现更好,并且显示出显着更好的灵敏度,这对于检测抑制剂至关重要。我们的模型与CYPlebrity和ADMETlab模型之间的差异在统计上非常显着,如表4所示。为了确保我们模型的可靠性,我们进行了实验验证,并成功鉴定了新的CYP2C9药物抑制剂。
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 3. 在外部验证集上比较最终RF和SVM模型以及其他最新模型的性能。
https://doi.org/10.1371/journal.pcbi.1009820.t003
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 4. 我们的最终RF和SVM模型与外部验证集上其他最新模型之间的精度假设的统计显著性(p值)。
https://doi.org/10.1371/journal.pcbi.1009820.t004
 
预测模型在抑制CYP2C9新药鉴定中的应用
我们采用保留的ML模型来筛选从四个药物数据库[46]中收集的4480种批准和实验药物(参见S1文本中的制备),以确定抑制CYP2C9的新药。已经实验证明抑制CYP2C9的药物在这里没有被考虑。鉴于具有36个MOE + 7个IE描述符的最佳RF和SVM模型的性能,我们决定结合这两种方法来鉴定CYP2C9的未知药物抑制剂。计算了4480种药物的7种CYP2C9蛋白构象的MOE描述符和相互作用能。最佳RF和SVM模型的共识导致2139种常见药物被预测为CYP2C9抑制剂。为了确定最有效的CYP2C9药物抑制剂,我们对每个蛋白质构象应用了IE <-8.5 kcal / mol的额外过滤器,对应于在七种蛋白质构象中计算的训练组抑制剂IE评分的75%(S3图)。虽然Autodock Vina的评分函数只是自由结合能的近似值,但该范围被广泛接受用于预测强蛋白质 - 配体相互作用能[26,47]。先前曾采用结合集合对接和药效团的类似方法鉴定另一种药物代谢酶SULT1E1的新配体[26,47]。最后,720种药物符合RF,SVM和IE标准,并优先作为CYP2C9抑制剂。最近针对5种CYP同种型的大规模筛选结果表明,大多数化合物交叉抑制了几种同种型,而只有7%的化合物没有抑制任何同种型[48]。CYPs容易受到多种化合物的抑制,因此,这里预测的大量抑制CYP2C9的药物似乎是合理的。为了选择不同的药物进行体外验证,我们使用MACCS指纹和谷本相似性截止值0.80,使用MOE软件进行化学多样性聚类。所得的109个药物质心使用DataWarrior软件[49]进行了额外分类,其中FragFp结构描述符和相似性截止值为0.70。因此获得了24个簇,其中两个结合了结构FragFp相似性低于0.50的多种药物(簇3包含18个分子,簇24包含37个分子)。
 
CYP2C9酶抑制的体外检测-厦门畜牧期刊杂志论文发表
在计算机筛选后,使用从24个多样性类别中选择的18个候选分子(表5)进行抑制测定。为了获得CYP2C9酶的潜在抑制剂和底物的代表性选择,我们从市售库获得时,每个簇服用一种药物,对于最大的簇3和24,我们分别选择了两种和三种不同的药物。据我们所知,这18种化合物尚未在文献或公开数据库中报告为CYP2C9的实验验证抑制剂。它们的分子结构如S6表所示。
 
首先使用表达CYP2C9酶高活性的HepG2细胞进行抑制测定。在一系列浓度下测试了18个研究分子,以评估反映CYP2C9催化位点的竞争性抑制机制的剂量依赖性抑制作用。数据表明,18个分子中有12个与CYP2C9抑制作用相关,其中9种化合物观察到浓度依赖性抑制。这些结果强烈提示酶抑制的竞争机制,并支持这些药物是CYP2C9的潜在抑制剂和/或底物的假设(图3和表5)。其余三种化合物(Pf-562271,西洛拉嗪,塔拉芬那辛)的抑制类型尚未确定。然而,随后对塔拉非那新对超体的分析(见下文)显示,该化合物是CYP2C9的底物,具有较弱的抑制作用。
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 3. 舍替吲、氯哌啶酮、阿普瑞坦、替格瑞洛、杜维利西、达沙替尼、比非洛芬和吡喹酮对表达人CYP2C9的HepG2细胞的抑制作用。
 
与对照相关的酶活性显示为药物浓度的函数。用指定浓度的药物处理HepG2细胞24小时。在三个独立实验中观察到类似的结果。条形图是使用GraphPadPrism v. 5.03获得的,表示一式三份测定的平均±SD。
 
https://doi.org/10.1371/journal.pcbi.1009820.g003
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
表 5.18种测试化合物的体外抑制测定。
https://doi.org/10.1371/journal.pcbi.1009820.t005
 
有趣的是,我们还观察到在与具有CYP2C9活性的HepG2细胞孵育后,18种化合物中的12种化合物的细胞毒性增加。这些结果与CYP2C9产生的代谢物的细胞毒性一致,并加强了与酶相互作用的假设。最后,在18种研究化合物(sivelestat,entinostat和muraglitazar)中,只有3种在我们的体外验证测定中使用的浓度范围内没有显示出任何影响(抑制CYP2C9活性和/或细胞毒性对表达CYP2C9的HepG2细胞)。
 
使用CYP2C9超体进行抑制测定,以估计IC50值(除任何细胞毒性效应外评估酶抑制作用)使用10个选定的分子进行。他们被选中进行额外的分析,因为其中8个显示出剂量依赖性抑制(舍替吲,氯哌酮,阿西普仑,瓦他尼,替格瑞洛,duvelisib,达沙替尼和吡啶酮),其中3个在与具有CYP2C9活性的HepG2细胞(abemaciclib,vatalanib和tarafenacin)孵育后表现出强烈的细胞毒性。使用CYP2C9超小体获得的抑制数据(表5和S5图)与体外观察到的具有HepG2细胞的十个测试分子的结果一致。对abemaciclib的分析显示,超小体中没有直接抑制CYP2C9,与HepG2细胞获得的结果相似。这些结果表明,两种方法(表达CYP2C9和CYP2C9超体的HepG2细胞系)对所研究的化合物产生了类似的解释。
 
我们的抑制结果表明,相对"小"或"大"的药物可以抑制CYP2C9活性。CYP2C9的大结合口袋由两个较小的空腔组成:所谓的"华法林结合位点"(PDB ID 1OG5)[50]和靠近血红素辅因子的催化位点空腔。有趣的是,氯沙坦可以在两个空腔中同时结合,正如在CYP2C9与共结晶氯沙坦(PDB ID 5XXI)的晶体结构中观察到的那样。具有不同大小并强烈抑制CYP2C9的药物vatalanib和替格瑞洛的预测结合位置如图4所示。根据三个得分最高的姿势的预测相互作用能量选择最佳姿势。左侧的药物对应于华法林结合位点,右侧的药物对应于催化位点。对接结果表明,两种药物可以在催化位点(图4A,4B和4D)或华法林结合位点(图4A和4C)中结合。图4A中所示的两个对接姿势表明,两个瓦他拉尼分子可能同时容纳在两个空腔中,就像氯沙坦的情况一样。预计较笨重的替格瑞洛仅被容纳在具有更开放的结合口袋的MD结构中(图4D)。这些结果强调了考虑CYP2C9的灵活性对于适当的抑制预测和配体相互作用解释的重要性。
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 4. VATALANIB和替格瑞洛的对接构象在CYP2C9的结合口袋中。
 
(A)两个假象的瓦他拉尼(鲑鱼)对接在CYP2C9(PDB ID 5XXI)和氯沙坦的两个共结晶分子(PDB ID 5XXI)的晶体结构中(黄色)。(B)瓦他拉尼(鲑鱼)的最佳姿势与CYP2C9的MD5结构和PDB ID 5XXI的氯沙坦的叠加共结晶结构(黄色)对接。(C)替格瑞洛(在鲑鱼中)的最佳姿势对接到CYP2C9 PDB ID 5XXI的晶体结构和氯沙坦的两个共结晶分子之一(PDB ID 5XXI)(黄色)。(D)替格瑞洛(在鲑鱼中)的最佳姿势与CYP2C9的MD4结构和CYP2C9抑制剂2QJ(PDB ID 4NZ2)的叠加共结晶结构(灰色)对接。注意到CYP2C9的螺旋F和I。MD4和MD5结构对应于分别与氯沙坦和apo CYP2C9结合的CYP2C9的MD模拟产生的CYP2C9构象。
 
https://doi.org/10.1371/journal.pcbi.1009820.g004
 
CYP2C9产生的代谢物的表征
我们用四种分子(abemaciclib,cloperidone,vatalanib和tarafenacin)进行了代谢测定,这些分子是根据它们与表达CYP2C9的HepG2细胞孵育后的细胞毒性来选择的。这些测定允许鉴定CYP2C9酶特异性产生的代谢物(图5和S6)。用CYP2C9超体孵育四种候选底物/抑制剂后的代谢测定允许表征特定代谢物并提出其化学结构,这些发现支持CYP2C9酶生物转化的假设。有趣的是,发现瓦他尼和氯哌啶酮强烈抑制并被CYP2C9代谢,证实了机制的复杂性。CYPs的抑制/代谢可以对应于活性位点的竞争性抑制,活性位点和酶外之间的底物或代谢物通量的修饰或药物本身或其代谢物的抑制(时间依赖性抑制)[7]。Abemaciclib和tarafenacin在与表达CYP2C9的HepG2细胞孵育后显示出高细胞毒性。它们被CYP2C9代谢,这表明产生了有毒代谢物。对abemaciclib没有观察到任何抑制作用。如上所述,塔拉非那新显示出较弱的抑制作用。Vatalanib和氯哌啶酮对表达CYP2C9的HepG2细胞的细胞毒性也增加,同时强烈抑制CYP2C9。
 
thumbnail 下载:
个人电脑幻灯片
巴新放大图片
断续器原始图像
图 5. 代谢测定使用重组CYP2C9超小体鉴定CYP2C9产生的代谢物。
 
显示了阿贝马克利,塔拉非那辛,氯哌酮和瓦他拉尼布的建议代谢物结构。
 
https://doi.org/10.1371/journal.pcbi.1009820.g005
 
然后,我们分析了四种药物中潜在毒性基团的存在及其检测到的代谢物(图5)。Abemaciclib及其三种代谢物M1、M2和M3含有卤代嘧啶基团,卤嘧啶基团是一种亲电功能性毒团,通常已知通过共价结合具有蛋白质反应性[51]。尽管CYP3A被称为负责ABEmaciclib及其代谢物的大部分CYP介导代谢的酶[52],但最近的其他研究表明,abemaciclib对癌症患者CYP1A2,CYP2C9,CYP2D6和CYP3A4底物的药代动力学没有临床意义的影响[53]。所有已鉴定的氯哌啶酮代谢产物(M1、M2、M3、M4、M6、M7、M8)中存在的苯酚官能团的氧化代谢可导致反应性儿茶酚/醌/醌-亚胺中间体的形成[33,54]。我们没有发现CYP2C9中常见的毒性基团产生塔拉芬那新和瓦塔拉尼的代谢物。广泛的肝脏代谢主要由CYP3A4介导,已知为瓦他尼[55]。有趣的是,最近一项关于抗癌药物舒尼替尼和帕唑帕尼使用能够模仿CYP型氧化的化学催化系统进行氧化的研究允许鉴定这两种药物的反应性/毒性代谢物[56]。检测到低量的醛衍生物,这些代谢物以前尚未通过NMR光谱鉴定。这种衍生物醛被预期会迅速与胺反应,并且可以被认为是潜在的毒性。正如[56]中所建议的,这种甲醛代谢物由于其高反应性而可以在代谢物研究中逃脱检测,但它们可能是解释舒尼替尼和帕唑帕尼肝毒性的中间体。人们可能会推测,这两种药物以及abemaciclib和vatalanib的某些子结构存在的化学相似性表明可能产生高反应性醛中间体,而我们的代谢物测定未检测到这些中间体。
 
结论
我们开发并验证了一种新的ML方法,用于预测CYP2C9抑制。我们通过结合CYP2C9抑制剂的原始物理化学描述符,CYP2C9蛋白质结构和动力学知识以及机器学习SVM和RF建模来构建预测模型。对PubChem和ChEMBL数据的验证表明,我们的模型成功地预测了CYP2C9抑制剂,其准确性,敏感性和特异性约为80%。该方法的应用允许提出18种药物用于CYP2C9抑制的体外验证。我们在这里首次鉴定了药物瓦他拉尼,吡啶酮,替格瑞洛和氯哌啶酮作为CYP2C9的强抑制剂,IC值<18μM,舍替吲,无脂剂,杜维利西和达沙替尼作为中等抑制剂,IC50值在40至85μM之间。瓦他拉尼布被确定为最强的抑制剂,IC50值为0.067μM。代谢测定允许表征CYP2C9产生的abemaciclib,cloperidone,vatalanib和tarafenacin的特定代谢物。获得的结果表明,这种策略可以改善临床实践中药物间相互作用的预测,并可用于药物发现管道中候选药物的优先级。
 
方法
训练和外部测试数据集准备
我们使用CYP2C9 AID 883和1851的PubChem生物测定数据集,其中包含CYP2C9抑制27463化合物的数据。此外,我们从ChEMBL中收集了5114种化合物,这些化合物经过CYP2C9测试(ChEMBL ID在S1文本中给出)。我们保留了来自PubChem和ChEMBL数据的8851种最活跃的抑制剂,AC50(或IC50)值≤10μM(AC50,"活性浓度50"是指引发半最大效应所需的浓度),PubChem的6056种非抑制剂在50μM的浓度下显示出小于10%的抑制作用。使用Web服务器FAF-Drugs4 [33]和内部开发的用于物理化学性质的"软"药物样过滤器过滤该集合的重复物(参见S1文本),而不去除有毒/反应性/ PAINS(Pan测定干扰)化合物,因为有毒或PAINS化合物也可能是CYP抑制剂。3D化合物结构是使用免费提供的Web服务器Frog2 [57]生成的,并且使用ChemAxon计算器插件(www.chemaxon.com)的主要宏种选项在pH 7.4下对化合物进行质子化。Gasteiger原子电荷是使用AutoDockTools包添加的[58]。使用OSIRIS DataWarrior软件[49]执行结构聚类,具有FragFp结构描述符,相似性截止值为0.85。仅采集了簇质心,最终过滤和多样化的数据集包含4840个抑制剂和3301个非抑制剂。训练集是由随机选择最终数据集的80%的活性和非活性化合物构建的。其余20%的分子用作外部测试装置。
 
集成对接
从蛋白质数据库(PDB)获得两种X射线CYP2C9结构:5XXI与氯沙坦[34]共结晶,1R9O[35]与氟比洛芬共结晶。MD结构是从先前执行的MD模拟中生成的[30]。使用PCE网络服务器使用FDPB方法计算CYP2C9可滴定基团的pKa值[59]。这些费用是使用AutoDockTools软件包[58]分配的。血红素保持在中间Cpd I状态[60],因为我们的初步测试显示使用Cpd I或铁血红素计算的相似对接分数。我们使用成熟的免费软件AutoDock Vina [36]对数据集化合物进行了虚拟筛选和对接,该软件采用基于梯度的构象对接和经验评分函数来预测蛋白质 - 配体结合能(以kcal / mol为单位)。网格分辨率设置为 1 Å,最大输出绑定模式数固定为 10,穷举性级别设置为 8。网格包括细胞色素CYP2C9的整个结合口袋。使用的网格中心坐标为 8.208、32.219、-1.923,根据 PDB ID 1R9O,搜索空间的大小设置为 25 Å×25 Å×25 Å。保留了每种蛋白质构象的最佳对接评分。通过预先将氟比洛芬对接到与氟比洛芬共结晶的CYP2C9结构(PDB ID 1R9O)中,检查了Autodock Vina用于CYP2C9的对接性能。
 
机器学习分类建模
随机森林。
RF分类[61]是使用统计软件包R的Random Forest R库[62]执行的,使用来自训练数据的自举样本构建了多个决策树。为了引入RF树之间的多样性,随机选择一小部分描述符,以便在每个树的每个节点上做出决策。分类是通过多数票对所有树木的结果获得的。为了根据不同的描述符数量为每个模型找到森林的最佳大小(ntree是树的数量)和描述符的数量(mtry是所选描述符的数量),我们运行了RF计算扫描ntree(25-500)和mtry(5-13)参数(有关详细信息,请参阅SI)。根据广泛接受的概念,mtry的最大值设置为13,即mtry的值应等于√p,其中p是变量的总数[63]。对于每个模型,我们选择了 ntree 和 mtry 参数的组合,这些参数在保持可接受的最低 ntree 的同时产生了最佳的内部精度(参见 S3 表)。重复五次的十倍交叉验证过程。
 
支持向量机。
SVM基于统计学习理论的最小化原理,并通过核函数将数据放入超空间中,以便将其分离到数据集中以进行分类或回归建模[64]。对于非线性可分离的情况,核函数允许SVM将数据点传输到可以线性分离的高维空间中。为了构建分类模型,我们使用 R 包中实现的 SVM 算法以及插入记字符号库 [65]。描述符以均值 0 为中心,并缩放到等于 1 的方差。我们选择了径向基函数核(SVM-Rad)。成本参数在 2 范围内进行了优化−2–27通过重复五次的十倍交叉验证程序。超参数成本和缩放函数 sigma 的最佳组合如 S3 表所示。
 
实验材料和方法
化学品和试剂
包含在抑制测定筛选中的化合物显示在S6表中。用于体外测试的化合物在实验室接收时溶解在DMSO中。根据分子及其在DMSO中的溶解度,制备浓度范围为8mM至25mM的储备溶液等分试样(50μl)。储备溶液储存在-20°C,直到实验当天使用。
 
细胞培养和质粒
HepG2细胞(ATCC-HB-8065;批次/批次:70007613)保持在37°C和5%CO2在含有10%胎牛血清(HyClone GE Healthcare)的最小必需培养基(Gibco,Life Technologies)中,并补充青霉素(200 UI / mL),链霉素(50μg/ mL),L-谷氨酰胺(0.3mg / mL)和丙酮酸钠(1mM)。对细胞进行支原体检测(支原体PCR检测试剂盒,默克)。CYP2C9 cDNA的克隆,体外诱变和测序(序列参考:NM_000771)由Eurofins Genomics(德国)进行。
 
选择表达高CYP2C9酶活性的稳定HepG2克隆
HepG2细胞感染了2.5x109TU / mL慢病毒(pLentiIII-EF1alpha)含有由«Plateforme Vecteurs viraux et Transfert de gènes»(巴黎大学)生产的CYP2C9野生型序列。将慢病毒构建体转导到HepG2细胞系后,感染(MOIs)的倍增性范围为10,30和50(每5 x 10个2,6和10μL慢病毒颗粒)5cell)用于确定最佳转导效率,并且通过P450-Glo CYP2C9测定(法国Promega)测量的CYP2C9酶的最高活性获得MOI为30。在存在2 μ的情况下选择重组克隆 g.mL-1然后扩增至CYP2C9酶活性测定。
 
细胞毒性测定和研究化合物浓度范围的选择-厦门畜牧期刊杂志论文发表
为了评估细胞活力,将"野生型"(wt)HepG2细胞(不含CYP2C9)和表达CYP2C9酶的HepG2细胞与所选分子的连续稀释液(浓度为10nM至100μM)一起孵育。简而言之,将HepG2细胞在96孔板(2.5x 10)中孵育4细胞/mL),活细胞的数量由MTS测定根据制造商推荐的方案(Promega,法国)确定。对于每种化合物,在选定的浓度范围内进行抑制测试,使得最高浓度产生大于80%的细胞活力,以尽量减少由于CYP2C9产生的母体化合物或其潜在代谢物的直接细胞毒性而对结果的任何偏倚解释。
 
CYP2C9酶活性和抑制试验
P450-Glo活性。
使用荧光素-H试剂盒(法国Promega)测定P450-Glo CYP2C9测定用于测量细胞色素P450 2C9活性。荧光素H是前绿素,是甲虫荧光素的衍生物。这种衍生物被CYP2C9酶转化为荧光素产品。D-荧光素通过与荧光素检测试剂的第二反应形成和检测。第二反应中产生的光量与CYP活性成正比。将不含萤光素酶的水添加到保留用于背景发光的井中。孵育4小时后,通过加入50μl荧光素检测试剂停止酶反应,该试剂还含有产生发光信号所需的酯酶。在每个板中,包括标准范围的甲虫荧光素(从8 nM到224 nM)。最后将板在室温下在黑暗中孵育30分钟以稳定发光信号,这是使用EnSpire板读取器(Perkin Elmer)测量的。
 
表达CYP2C9的HepG2细胞的抑制试验的动力学。
通过根据可行性测试制备从0.5(最小)到50μM(最大)所选化合物的五步稀释系列,并通过将每个稀释的12.5μl转移到测定板中来进行浓度依赖性CYP2C9抑制测定。确定CYP2C9活性(如上所述),并与单独用DMSO缓冲液孵育的未处理对照进行比较。在抑制测定中一式三份测试每种化合物稀释度,并在三个不同的日期独立重复实验。使用GraphPad Prism 5.03版软件分析了数据。
 
致发光信号的定量。
从EnSpire读板器获得的原始数据通过使用以下公式计算总发光(未处理对照的百分比)进行处理:原始数据−(背景发光)* 100/未处理对照的平均值。所有值都归一化为使用Pierce RIPA缓冲液从新鲜细胞中提取的蛋白质量(Thermo Scientific,法国)。CYP2C9酶活性以 D-luciferin.mg-1蛋白质的最小值-1.
 
CYP2C9对重组超小体的抑制及IC50的计算
CYP2C9特异性底物(双氯芬酸)和重组超小体与研究化合物一起孵育或不与研究化合物一起孵育(根据服务提供商Admescope(芬兰)优化的方案)。研究化合物的浓度为0.3,1,3,10,20,30,50,60,70,90和100μM。抑制试验中使用的CYP2C9底物是5 μM的双氯芬酸,产生的特异性代谢物是4-羟基化的双氯芬酸。选择性CYP2C9抑制剂磺胺苯那唑作为反应中的对照(IC50值估计在0.2和0.4μM之间)。分析中使用的时间点分别为 0、10、20、40 和 60 分钟。酶促反应在预孵育6分钟后通过加入NADPH开始,并在15分钟后通过加入冰冷的乙腈终止。收集上清液并离心进行分析。通过LC / MS-MS分析样品,以确定在候选分子不存在和存在的情况下代谢物的水平。未使用加标标准样品,但根据相对峰面积进行定量(溶剂对照= 100%)。将消失评估为相对LC / MS峰区域,并将0分钟时间点标记为100%。使用消失率计算半衰期和体外清除率。有关该方法的详细信息,请参阅 S2 文本。
 
鉴定CYP2C9产生的所研究化合物的代谢物
代谢物是根据Admescope(芬兰)开发的方案鉴定的。简而言之,将研究的化合物与重组CYP2C9超体孵育。选择性CYP2C9底物双氯芬酸在1μM下用作对照。分析采用的时间点分别为0、10、20、40、60 min,用UPLC/HR-MS对采集的样品进行分析,监测底物耗竭。将收集的样品储存在-20°C直至解冻,离心并通过UPLC / HR-MS分析底物耗尽,并使用母体化合物优化分析方法,以实现适合目的的色谱特性(峰形和保留)和质谱电离。
 
支持信息
机器学习方法的详细信息。
 
显示 1/14: pcbi.1009820.s001.pdf
 
跳到无花果导航
机器学习方法的详细信息中英布尔检测身份证使用用于训练和测试集:化学宝1010069, CHEMBL1013136,化学机械1030555,化学股份1034783,化学BL1042607,化学BL1066806,化学股份1072025,化学BL1073470,化学机械1103798,化学机械1103804,化学机械1104622,化学工业集团1117614,化学BL1167157,化学股份1167163,化工产品1219167,化学机械1219236,化工产品1219458,化学BL1246349,化学BL1259939,化工产品1274769,化工1293079,化学宝1646003, CHEMBL1646061,化学BL1647680,化工产品1768199,化学股份1768380,化工产品1768381,化学机械1780619,CHEMBL1816327,化学机械1827183,化学BL1827531,化学机械1833284,化工股份1837191,化工产品1840132,化工股份1920118,化学机械1924559,化学股份1925277,CHEMBL1942058,化学股份1958502,化工股份2019954,化学制药2025322,化学股份2026797,化学股份2033875,化学股份2038382,化学股份2045911,断续器EMBL2050711,化工2161926,化学BL2162551,化学股份2183961,化学BL2317466,化学股份2319720,化工产品2320894,化学BL2327408,化学BL2327764,化学机械2340395,化工2341174,化工产品2343699,化学BL2346258,化学BL2350016,化学制药2350100,化学BL2384500,化学BL2384506,化学BL2432690,化学BL2432691,化学BL2445671,化学宝3095185,化工产品3095759,化工3128584,化工产品3266924,化工3268321,化工产品3268923,化学BL3294170,化学BL3364721,化学BL3366947,化学机械3372275,化工产品3373958,化工产品3375953,化学BL3382240,化工3383256,CHEMBL3389065,化学宝3390677,化学3404109,化学BL3404692,化学3411304,化学机械3414225,化学宝3420147,化工3508953,化工3508954,化工3508955,化学机械3535106,化工3599702,化工3611646,化工3611884,化工3616248,化学BL914447,化学宝919483,车MBL927600,化学工业927601,化学BL927774,化学股份930918,化学工业933754,CHEMBL942002,化学BL954327,化学工业961565,化学股份971583,化学宝971594软药-像过滤器:一个在-房子-开发"软"药-像物理化学过滤器性能在 web 服务器中实现法夫-药物4用于过滤收集的数据集抑制剂和非-基于以下规则的CYP2C9抑制剂:分子量≥1000 Da,H数-债券捐赠者≤8、H数-债券接受者≤12、可旋转债券≤20、logP(XlogP3)和logD之间-7 和 10,以及杂原子≤15.T缺氧和疼痛S组未从中删除化合物数据集.随机福雷斯特扫描参数:以下值ntree使用了:25, 75, 125, 175,200、225、250、275、300、400 和 500。以下值mtry分别使用了: 5,7,9, 11,和13 个参数。评估模型的质量:为了评估模型的预测能力,以下属性是计算:-敏感度是所有正分类实例中真阳性的比例(真阳性率),计算公式如下:灵敏度 = TP/(TP+FN)。-特异性是真正的阴性率,计算公式为特异性 = TN/(TN+FP)-精度是真结果,或者真阳性或真阴性,并且是计算如下:精度=(TP+TN)/(TP+TN+FP+FN)
-计算Matthew相关系数(MCC)以测量二进制的质量classifica具体如下:MCC = (TP*TN-FP*FN)/((TP+FP) * (TP+FN) * (TN+FP) * (TN*FN))"TP"和"TN"分别是真阳性和真负数,"FP"和"FN"分别是假阳性和假阴性实例。一个值为 0表明随机和100个完美预测)。制备4480种筛查药物使用四个化合物数据库来生成本研究中使用的药物库以进行筛选对于CYP2C9抑制剂:ChEMBL数据库的"药物"子集[1],"已批准"sDrugBank的副股[2],DrugCentral数据库[3]和"批准"的SuperDrug2数据库[4].法夫-药物4[5]用于去除同位素、无机物、混合物、盐和杜普licates.关于这些分子的制备的其他评论由Largarde et al.[6].使用主要宏种在pH 7.4下对化合物进行质子化ChemAxon计算器插件(www.chemaxon.com)的选项。科里纳经典(分子网络,www.mn-am.com) 用于 3D 构象生成如保存现有的立体中心。加斯泰格原子电荷是使用自动拨码工具包。我们去除了缺少MOE描述符的化合物计算以及药物其中实验数据为刺激CYP2C9的抑制作用我们在文献中重新发现。最后,仍有4480种药物用于筛查。引用1.高尔顿,一个.,赫西,一个.,诺沃特卡,M.,便当,一个.P.,室J.,门德兹D.,穆托沃,P.,阿特金森F.,贝利斯,L.J.,西布里安-乌哈尔特,E.,戴维斯M.,戴德曼,N.,卡尔松,一个.,马加里诺斯,M.P.,奥弗灵顿,J.P.,帕帕达托斯,G.,斯密特,我.,和滤灰槽一个.R.(2017) 这中英布尔数据库在2017,核酸回复45,D946型-D953.2.维萨特,D.S.,诺克斯C.,郭,一个.C.,什里瓦斯塔瓦,S.,哈桑纳利,M.,斯多哈德,P.,场Z.,和伍尔希J.(2006) 药物银行:一个全面资源为在电子药发现和勘探核酸研究34,D667-D671.3.乌尔苏,O.,福尔摩斯J.,诺克尔,J.,博洛加,C.G.,阳J.J.,马蒂亚斯S.L.,纳尔逊S.J.,和奥普雷亚,T.我.(2016) 药物中心:在线药汇编核酸研究45,D931-D938.4.西拉姆谢蒂,V.B.,埃克特,O.一个.,高尔克,B.O.,歌德,一个.,陈Q.,德瓦拉孔达,P.,普雷斯纳,S.,和普雷斯纳,R.(2018) 超级药物2:一个一停资源为批准/销售药物.,核酸回复.46(D1),D1136-D1142.5.拉戈尔斯,D.,布斯拉马,L.,贝科特,J.,米特瓦,M.一个.,和维洛特雷克斯,B.O.(2017) 法夫-药物4:自由ADME-毒性滤波计算为化学的生物学和早阶段药发现.,生物信息学33,3658-3660.6.拉加德,N.,雷伊J.,久尔汗丹尼扬,一个.,塔菲里,P.,米特瓦,M.一个.,和维洛特雷克斯,B.O.(2018) 在线结构-基于筛分之可购买批准药物和自然的化合物:回顾的例子之药定位上癌症目标.,Oncotarget9,32346-32361.
1 / 14
 
 
下载
无花果
S1 文本。 机器学习方法的详细信息。
https://doi.org/10.1371/journal.pcbi.1009820.s001
 
(英文)
 
S2 文本。 使用CYP2C9超小体进行抑制试验的分析方法的详细信息。
https://doi.org/10.1371/journal.pcbi.1009820.s002
 
(英文)
 
S1 图 训练和外部测试装置的化学空间。
https://doi.org/10.1371/journal.pcbi.1009820.s003
 
(英文)
 
S2 图 用于 ML 建模的 MD 和晶体 CYP2C9 结构。
https://doi.org/10.1371/journal.pcbi.1009820.s004
 
(英文)
 
S3 图 训练集抑制剂和非抑制剂的Autodock Vina评分根据七种不同的CYP2C9构象计算。
https://doi.org/10.1371/journal.pcbi.1009820.s005
 
(英文)
 
S4 图 用于训练 ML 模型的 177 个描述符的平均重要性。
https://doi.org/10.1371/journal.pcbi.1009820.s006
 
(英文)
 
S5 图 观察到CYP2C9超小体研究化合物的抑制动力学。
https://doi.org/10.1371/journal.pcbi.1009820.s007
 
(英文)
 
S6 图 用于鉴定CYP2C9产生的代谢物的代谢测定的详细信息。
https://doi.org/10.1371/journal.pcbi.1009820.s008-厦门畜牧期刊杂志论文发表
 
(英文)
 
S1 表。 用于训练 ML 模型的最佳 36 个物理化学描述符和 7 个 IE 的平均重要性。
https://doi.org/10.1371/journal.pcbi.1009820.s009
 
(英文)
 
S2 表。 训练集上带有 MOE 描述符的初步 RF 模型的性能。
https://doi.org/10.1371/journal.pcbi.1009820.s010
 
(英文)
 
S3 表。 优化的最佳射频和SVM模型的参数。
https://doi.org/10.1371/journal.pcbi.1009820.s011
 
(英文)
 
S4 表。 在外部验证集上使用 MOE 描述符的优化 RF 和 SVM 模型的性能。
https://doi.org/10.1371/journal.pcbi.1009820.s012
 
(英文)
 
S5 表。 比较文献中报告的所用数据集和模型的性能。
https://doi.org/10.1371/journal.pcbi.1009820.s013
 
(英文)
 
S6 表。 实验测试药物清单。
https://doi.org/10.1371/journal.pcbi.1009820.s014
 
(英文)
 
确认
作者承认巴黎大学INSERM研究所和结构Fédérative de Recherche Necker的基因转移病毒载体核心设施。作者还感谢Bagdad博士的有益讨论。
 
引用
1.Guengerich FP. 细胞色素p450和化学毒理学。化学反应毒理。2008;21(1):70–83.pmid:18052394.
查看文章PubMed/NCBI谷歌学术搜索
2.Johansson I,Ingelman-Sundberg M.遗传多态性和毒理学 - 重点是细胞色素p450。毒理学 2011;120(1):1–13.pmid:21149643.
查看文章PubMed/NCBI谷歌学术搜索
3.Singh D, Kashyap A, Pandey RV, Saini KS.细胞色素P450研究的新进展。今日毒品迪斯科。2011;16(17–18):793–9.下午:21864709。
查看文章PubMed/NCBI谷歌学术搜索
4.Nguyen-Vo TH, Trinh QH, Nguyen L, Nguyen-Hoang PU, Nguyen TN, Nguyen DT, et al. iCYP-MFE: 使用多任务学习和分子指纹嵌入编码J Chem Inf模型鉴定人类细胞色素P450抑制剂。2021. 下午:34672553
查看文章PubMed/NCBI谷歌学术搜索
5.Williams JA, Hyland R, Jones BC, Smith DA, Hurst S, Goosen TC, et al.UDP-葡萄糖醛酸基转移酶底物的药物-药物相互作用:典型观察到的低暴露(AUCi / AUC)比的药代动力学解释。药物梅塔布处置。2004;32:1201–8.pmid:15304429
查看文章PubMed/NCBI谷歌学术搜索
6.Guengerich FP. 人细胞色素 P450 酶。在:OdM P.,编辑。细胞色素P450施普林格;2015. p. 523–785
7.博德 C.复杂的药物 - 药物相互作用的令人讨厌的惊喜。今日毒品迪斯科。2010;15(9–10):391–5.pmid:20211755.
查看文章PubMed/NCBI谷歌学术搜索
8.Ivanov S,Lagunin A,Filimonov D,Poroikov V.通过对自发报告和预测药物 - 靶标相互作用的综合分析来评估药物 - 药物相互作用的心血管不良反应PLoS Comput Biol. 2019; 15:e1006851。pmid:31323029
查看文章PubMed/NCBI谷歌学术搜索
9.Kirchmair J, Williamson MJ, Tyzack JD, Tan L, Bond PJ, Bender A, et al.代谢的计算预测:位点,产物,SAR,P450酶动力学和机制。J 化学英夫模型。2012;52(3):617–48.pmid:22339582;PubMed Central PMCID: PMC3317594.
查看文章PubMed/NCBI谷歌学术搜索
10.Kirchmair J, Goller AH, Lang D, Kunze J, Testa B, Wilson ID, et al.预测药物代谢:实验和/或计算?Nat Rev Drug Discov.2015;14:387–404.pmid:25907346
查看文章PubMed/NCBI谷歌学术搜索
11.Lonsdale R, Rouse SL, Sansom MSP, Mulholland AJ.一种通过膜结合细胞色素P450酶模拟药物代谢的多尺度方法。PLoS Comput Biol. 2014;10:e1003714.下午:25033460
查看文章PubMed/NCBI谷歌学术搜索
12.Novotarskyi S, Sushko I, Korner R, Pandey AK, Tetko IV.比较了不同QSAR方法对CYP450 1A2抑制进行建模。J 化学英夫模型。2011;51(6):1271–80.pmid:21598906.
查看文章PubMed/NCBI谷歌学术搜索
13.李俊华, 贝西思, 崔明, 金斌, 崔淑在计算机预测中,细胞色素P450抑制剂和非抑制剂的多类别分类模型使用机器学习方法。SAR QSAR Environ Res. 2017;28:863–74.pmid:29183231
查看文章PubMed/NCBI谷歌学术搜索
14.Banerjee P, Dunkel M, Kemmler E, Preissner R. SuperCYPsPred——一个用于预测细胞色素活性的网络服务器。核酸研究 2020;48:W580–W5.pmid:32182358
查看文章PubMed/NCBI谷歌学术搜索
15.邵铉, 苏斌, 涂玉, 林超, 林OA, 曾永军.CypRules:基于规则的P450抑制预测服务器。生物信息学。2015;31(11):1869–71.pmid:25617412.
查看文章PubMed/NCBI谷歌学术搜索
16.Varma MV, Pang KS, Isoherranen N, Zhao P. 处理复杂的药物间相互作用:走向机制模型。生物制药药物处置。2015;36(2):71–92.pmid:25545151.
查看文章PubMed/NCBI谷歌学术搜索
17.瓦格纳C, 潘毅, 许伟, 贾格里洛, 张磊, 雷诺兹KS, 等.预测细胞色素P450抑制剂对底物药物的影响:分析向美国食品和药物管理局提交的基于生理的药代动力学建模。克林药代动力学。2015;54(1):117–27.pmid:25260695.
查看文章PubMed/NCBI谷歌学术搜索
18.Racz A,Keseru GM.通过基于机器学习的共识建模对细胞色素P450 2C9介导的药物相互作用潜力进行大规模评估。J Comput Aided Mol Des. 2020;34:831–9.pmid:32221780
查看文章PubMed/NCBI谷歌学术搜索
19.Adeshina YO,Deeds EJ,Karanicolas J.机器学习分类可以减少基于结构的虚拟筛选中的误报。美国国家科学院院士。2020;4:18477–88.pmid:32669436
查看文章PubMed/NCBI谷歌学术搜索
20.Joshi P,McCann GJP,Sonawane VR,Vishwakarma RA,Chaudhuri B,Bharate SB.通过基于配体和结构的联合虚拟筛选鉴定有效和选择性CYP1A1抑制剂及其在Sacchrosomes和活人细胞中的体外验证。J 化学英夫模型。2017;57:1309–20.pmid:28489395
查看文章PubMed/NCBI谷歌学术搜索
21.Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, et al.蛋白质数据库。核酸研究. 2000;28(1):235–42.pmid:10592235;PubMed Central PMCID: PMC102472.
查看文章PubMed/NCBI谷歌学术搜索
22.Moroy G, Martiny VY, Vayer P, Villoutreix BO, Miteva MA.在药物发现中基于计算机结构的ADMET预测中迈进。今日毒品迪斯科。2012;17(1–2):44–55.pmid:22056716.
查看文章PubMed/NCBI谷歌学术搜索
23.王A, Stout CD, 张琦, 约翰逊EF.离子相互作用和蛋白质动力学对细胞色素P450 2D6(CYP2D6)底物和抑制剂结合的贡献。生物化学学报. 2015;290(8):5092–104.pmid:25555909;PubMed Central PMCID: PMC4335244.
查看文章PubMed/NCBI谷歌学术搜索
24.Branden G, Sjogren T, Schnecke V, Xue Y. 基于结构的配体设计,以克服药物发现项目中的CYP抑制。今日毒品迪斯科。2014;19(7):905–11.下午:24642031。
查看文章PubMed/NCBI谷歌学术搜索
25.Stoll F,Goller AH,Hillisch A.蛋白质结构在克服ADMET相关药物样化合物问题中的效用。今日毒品迪斯科。2011;16(11–12):530–8.pmid:21554979.
查看文章PubMed/NCBI谷歌学术搜索-厦门畜牧期刊杂志论文发表
26.Martiny VY, Carbonell P, Chevillard F, Moroy G, Nicot AB, Vayer P, et al.基于集成结构和配体的硅片方法可预测细胞色素P450 2D6的抑制作用。生物信息学。2015;31(24):3930–7.pmid:26315915.
查看文章PubMed/NCBI谷歌学术搜索
27.Hirota T,Eguchi S,Ieiri I.CYP2C9和CYP2C19中遗传多态性对临床用药药代动力学的影响。药物 Metab Pharmacokinet 2013;28:28–37.下午:23165865
查看文章PubMed/NCBI谷歌学术搜索
28.Isvoran A, Louet M, Vladoiu DL, Craciun D, Loriot MA, Villoutreix BO, et al.细胞色素P450 2C家族的药物基因组学:氨基酸变异对药物代谢的影响。今日毒品迪斯科。2017;22(2):366–76.pmid:27693711.
查看文章PubMed/NCBI谷歌学术搜索
29.Dai D, Zeldin DC, Blaisdell JA, Chanas B, Coulter SJ, Ghanayem BI, et al.人CYP2C8中的多态性降低了抗癌药物紫杉醇和花生四烯酸的代谢。药物遗传学。2001;11(7):597–607.pmid:11668219.
查看文章PubMed/NCBI谷歌学术搜索
30.Louet M, Labbe CM, Fagnen C, Aono CM, Homem-de-Mello P, Villoutreix BO, et al.探讨人CYP2C9*30药物代谢功能障碍的分子机制.PLoS One.2018;13(5):e0197249.Epub 格式 2018/05/11.pmid:29746595;PubMed Central PMCID: PMC5944999.
查看文章PubMed/NCBI谷歌学术搜索
31.Gaulton A, Hersey A, Nowotka M, Bento AP, Chambers J, Mendez D, et al.2017年的ChEMBL数据库。核酸研究 2017;45(D1):D 945–D54.Epub 格式 2016/12/03.pmid:27899562;PubMed Central PMCID: PMC5210557.
查看文章PubMed/NCBI谷歌学术搜索
32.Wang Y, Bryant SH, Cheng T, Wang J, Gindulyte A, Shoemaker BA, et al. PubChem BioAssay: 2017 update.核酸研究 2017;45(D1):D 955–D63.Epub 格式 2016/12/03.pmid:27899599;PubMed Central PMCID: PMC5210581.
查看文章PubMed/NCBI谷歌学术搜索
33.Lagorce D, Bouslama L, Becot J, Miteva MA, Villoutreix BO.FAF-Drugs4:用于化学生物学和早期药物发现的免费ADME-tox过滤计算。生物信息学。2017;33:3658–60.pmid:28961788
查看文章PubMed/NCBI谷歌学术搜索
34.Maekawa K, Adachi M, Matsuzawa Y, Zhang Q, Kuroki R, Saito Y, et al. 细胞色素P450 2C9中单核苷酸多态性的结构基础.生物化学。2017;56(41):5476–80.Epub 格式 2017/10/04.pmid:28972767.
查看文章PubMed/NCBI谷歌学术搜索
35.Wester MR, Yano JK, Schoch GA, Yang C, Griffin KJ, Stout CD, et al.人细胞色素P450 2C9的结构与氟比洛芬复合,分辨率为2.0-A。生物化学学报. 2004;279(34):35630–7.Epub 格式 2004/06/08.pmid:15181000.
查看文章PubMed/NCBI谷歌学术搜索
36.Trott O, Olson AJ.软件新闻和更新 AutoDock Vina:通过新的评分功能、高效优化和多线程处理提高对接的速度和准确性。计算化学学报.2010;31(2):455–61.WOS:000273412900020.pmid:19499576
查看文章PubMed/NCBI谷歌学术搜索
37.(教育部)教育部。Chemical Computing Group Inc., 1010 Sherbooke St. West, Montreal, QC, Canada, H3A 2R7.2016.
38.Kantardzic M. Data Mining: Concepts, Models, Methods, and Algorithms: Wiley;2020. pmid:33044003
查看文章PubMed/NCBI谷歌学术搜索
39.Bosc N, Muller C, Hoffer L, Lagorce D, Bourg S, Derviaux C, et al. Fr-PPIChem: 一个致力于蛋白质-蛋白质相互作用的学术化合物库。ACS化学生物学 2020;15:1566–74.pmid:32320205
查看文章PubMed/NCBI谷歌学术搜索
40.Green AJ, Mohlenkamp MJ, Das J, Chaudhari M, Truong L, Tanguay RL, et al.利用高通量筛选数据、深度神经网络和条件生成对抗网络来推进预测毒理学。PLoS Comput Biol. 2021.https://doi.org/10.1371/journal.pcbi.1009135。
查看文章谷歌学术搜索
41.程峰, 于毅, 沈军, 杨磊, 李伟, 刘刚, 等.使用组合分类器对细胞色素P450抑制剂和非抑制因子进行分类。化学研究所模型 2011;51:996–1011.下午:21491913
查看文章PubMed/NCBI谷歌学术搜索
42.李晓霞,徐燕,赖磊,裴J.使用多任务深度自动编码器神经网络预测人细胞色素P450抑制。Mol Pharm 2018;15:4336–45.pmid:29775322
查看文章PubMed/NCBI谷歌学术搜索
43.吴志,雷涛,沈超,王志,曹德,侯T.ADMET在药物发现中的评价。19. 使用人工智能方法可靠地预测人类细胞色素P450抑制。J 化学英夫模型。2019;59:4587–601.pmid:31644282
查看文章PubMed/NCBI谷歌学术搜索
44.Plonka W,Stork C,Sícho M,Kirchmair J. CYPlebrity:用于预测细胞色素P450酶抑制剂的机器学习模型。生物医学化学. 2021;46:116388.下午:34488021
查看文章PubMed/NCBI谷歌学术搜索
45.熊刚, 吴志, 易军, 傅磊, 杨志, 谢春, 等. ADMETlab 2.0:一个用于准确、全面预测ADMET属性的集成在线平台。核酸研究 2021 49(W1):W5–W14.pmid:33893803
查看文章PubMed/NCBI谷歌学术搜索
46.拉加德N,雷伊J,久尔坎丹尼扬A,图菲里P,米特瓦马,维鲁特雷克斯BO。基于在线结构的可购买批准药物和天然化合物筛选:癌症靶标药物重新定位的回顾性示例。Oncotarget.2018;9(64):32346–61.下午:30190791
查看文章PubMed/NCBI谷歌学术搜索
47.Rakers C, Schumacher F, Meinl W, Glatt H, Kleuser B, Wolber G.在分子动力学模拟中,由药效团引导的人类磺转移酶1E1活性的Silico预测中。生物化学学报. 2016;291:58–71.pmid:26542807
查看文章PubMed/NCBI谷歌学术搜索
48.Veith H, Southall N, Huang R, James T, Fayne D, Artemenko N, et al.跨化学文库的细胞色素P450同工酶选择性的全面表征。纳特生物技术。2009;27(11):1050–5.pmid:19855396;PubMed Central PMCID: PMC2783980.
查看文章PubMed/NCBI谷歌学术搜索
49.Sander T, Freyss J, von Korff M, Rufener C. DataWarrior:一个用于化学感知数据可视化和分析的开源程序。J 化学英夫模型。2015;55(2):460–73.pmid:25558886.
查看文章PubMed/NCBI谷歌学术搜索
50.威廉姆斯PA,Cosme J,Ward A,Angove HC,Vinković DM,Jhoti H.与结合华法林的人细胞色素P450 2C9的晶体结构。自然界。2003;424:464–8.pmid:12861225
查看文章PubMed/NCBI谷歌学术搜索
51.Rishton GM. 生化筛选中的非铅相似性和铅样性 今日药物Discov。2003;8:86–96.下午:12565011
查看文章PubMed/NCBI谷歌学术搜索
52.Kulanthaivel P, Mahadevan D, Turner PK, Royalty J, Teck Ng W, Yi P, et al.摘要 CT153:阿贝马克利布与CYP3A诱导剂和抑制剂之间的药代动力学相互作用。癌症研究 2016;76:CT153.
查看文章谷歌学术搜索
53.Turner PK, Hall SD, Chapman SC, Rehmel J, Royalty J, Guo Y, et al. Abemaciclib对癌症患者CYP1A2,CYP2C9,CYP2D6和CYP3A4底物的药代动力学没有临床意义的影响。药物代谢和处置。2020;48:796–803.pmid:32581049
查看文章PubMed/NCBI谷歌学术搜索
54.Stepan AF, Walker DP, Bauman J, Price DA, Baillie TA, Kalgutkar AS, et al. 结构警报/反应性代谢物概念应用于药物化学以降低特异质药物毒性的风险:基于对美国市场前200种药物趋势的批判性检查的观点。化学反应毒理。2011;24:1345–410.pmid:21702456
查看文章PubMed/NCBI谷歌学术搜索-厦门畜牧期刊杂志论文发表
55.Jost LM, Gschwind HP, Jalava T, Wang Y, Guenther C, Souppart C, et al.伐他拉尼(PTK787 / ZK-222584)在癌症患者中的代谢和处置药物Metab处置。2006;34:1817–28.pmid:16882767
查看文章PubMed/NCBI谷歌学术搜索
56.Paludetto MN,Bijani C,Puisset F,Bernardes-Genisson V,Arellano C,Robert A.金属卟啉催化氧化苏尼替尼和帕唑帕尼,两种抗癌酪氨酸激酶抑制剂:新的潜在毒性代谢物的证据。医学化学杂志 2018;61:7849–60.pmid:30102538
查看文章PubMed/NCBI谷歌学术搜索
57.Miteva MA,Guyon F,Tuffery P. Frog2:用于小化合物的高效3D构象集成发生器。核酸研究。2010;38(suppl_2):W622–W7.pmid:20444874
查看文章PubMed/NCBI谷歌学术搜索
58.Morris GM, Huey R, Lindstrom W, Sanner MF, Belew RK, Goodsell DS, et al.AutoDock4 和 AutoDockTools4:具有选择性受体灵活性的自动对接。计算机化学学报. 2009;30(16):2785–91.Epub 格式 2009/04/29.pmid:19399780;PubMed Central PMCID: PMC2760638.
查看文章PubMed/NCBI谷歌学术搜索
59.Miteva MA, Tuffery P, Villoutreix BO.PCE:用于计算蛋白质连续介质静电的 Web 工具。核酸研究. 2005;33:2005.pmid:15980492
查看文章PubMed/NCBI谷歌学术搜索
60.Bathelt CM, Zurek J, Mulholland AJ, Harvey JN.来自QM / MM建模的细胞色素P450人亚型中化合物I的电子结构。化学学报 2005;127:12900–8.pmid:16159284
查看文章PubMed/NCBI谷歌学术搜索
61.布雷曼 L. 随机森林。机器学习。2001;45(1):5–32.
查看文章谷歌学术搜索
62.Liaw A,Wiener M. Classification and Regression by RandomForest 2001。
查看文章谷歌学术搜索
63.普罗布斯特P,赖特明尼苏达州,布勒斯泰克斯A-L。随机林的超参数和优化策略。WIRE 数据挖掘和知识发现。2019;9(3):e1301.
查看文章谷歌学术搜索
64.Cortes C, Vapnik V. Support-Vector Networks.机器学习。1995;20(3):273–97.
查看文章谷歌学术搜索
65.Kuhn M. 使用插入记号包在 R 中构建预测模型。统计软件学报.2008;28:1–26.下午:27774042
查看文章PubMed/NCBI谷歌学术搜索-厦门畜牧期刊杂志论文发表
 
上一篇:《电源技术北大核心CSCDCSTPCD》-厦门畜牧期刊杂志论文发表

下一篇:脯氨酸特异性氨基肽酶P可防止复制相关的基因组不稳定-厦门畜牧期刊杂志论文发表
咨询方式

 ---->>学术源论文咨询发表网
 ---->>咨询QQ:854727998 
 ---->>电话:
   
13889158687(微信同号)

 ---->>邮箱:lunwen133@163.com
投稿写明所投期刊,3日内回复.五日未回复可电话咨询。

工作时间:8:00-17:00   周六值班、周日休息,国家法定假日休息

学术焦点 更多>>

《健康必读》省级医学月刊 当月发
《医药前沿》国家级医学月刊 ISS
《中国健康月刊》国家医学月刊-是
《才智》省级教育类月刊-CN22-13
《商情教育经济研究》省级教育类月
《考试周刊》省级教育类月刊/国内
《科教导刊》省级教育类旬刊 ISS
《文艺生活》省级教育类月刊 ISS
学术推荐 更多>>

《中小学电教

     《中小学电教》:省教育厅主管,省电教馆主办。国内统一刊号:C

《文艺生活》

     《文艺生活》杂志是经中华人民共和国新闻出版总署批准,由湖南省

《黑龙江科技

     《黑龙江科技信息》杂志是经国家科技部和国家新闻出版总署批准在
首页   -   关于我们   -   联系我们   -   发表流程   -   网站声明   -   在线投稿   -   友情链接

咨询电话 13889158687(微信同号)  QQ咨询:854727998


投稿邮箱:lunwen133@163.com
学术源论文发表咨询网 www.xueshuyuang.com  备案号:
闽ICP备2021001903号-2
版权所有  学术源论文发表咨询网