免费医学论文发表-电子健康记录中纵向临床测量的无监督聚类
阿尔希亚·玛丽亚姆,哈米德·贾维迪,艾米莉·扎博尔,赵冉,托马斯·拉迪沃耶维奇,丹尼尔·罗特罗夫
抽象
纵向电子健康记录 (EHR) 可用于识别现实世界中疾病发展和进展的模式。无监督的时间匹配算法正在从信号处理和蛋白质序列比对任务中重新用于 EHR,它们在深入了解疾病方面显示出巨大的前景。这些算法对 EHR 临床数据进行分类的稳健性仍有待确定。根据临床测量(例如血压)汇编的时间序列在采样和缺失方面比开发这些算法的数据要多得多,因此需要对这些方法进行系统评估。我们将 30 种最先进的无监督机器学习算法应用于 6,912 个系统生成的模拟临床数据集,涉及 5 个参数。这些算法包括 8 种时间匹配算法,具有 14 种分区聚类和 8 种模糊聚类方法。Nemenyi 检验用于使用调整后的 Rand 指数 (ARI) 确定准确性的差异。动态时间扭曲及其下限变体在所有队列中的准确性最高 (中位数 ARI>0.70)。与轨迹形状的差异相比,所有 30 种方法都更擅长区分量级不同的类别。缺失仅在类因轨迹形状而异时影响准确性。然后使用 ARI 最高的方法对大型儿科代谢综合征 (MetS) 队列 (N = 43,426) 进行聚类。我们确定了三种独特的儿童 BMI 模式,平均聚类共识高 (>70%)。该算法确定了一个 BMI 持续较高的集群,该集群的 MetS 风险最大,与之前的文献一致 (OR = 4.87,95% CI:3.93–6.12)。虽然这些算法已被证明在常规时间序列中具有相似的准确性,但它们在临床应用中的准确性在区分形状差异方面差异很大,尤其是在中度至高度缺失 (>10%) 的情况下。这项系统评估还表明,这里测试的最强大的算法可以从纵向临床数据中获得有意义的见解。
作者总结
医疗机构定期将临床数据记录在患者的健康记录中,并且越来越多地用于研究以确定具有临床意义的亚组,这有助于推动精准医疗的发展。来自其他领域的聚类方法(例如音频信号处理)正在重新用于这些任务,但是,临床数据具有其独特的特征,例如缺失数据和特定的相关结构,这可能会影响某些聚类方法的性能。在这里,使用我们从真实患者数据开发的大型模拟数据集,我们的目标是确定哪些方法最适合使用纵向临床数据对患者进行分层。我们将动态时间扭曲 (DTW) 及其下限变体确定为高度稳健的聚类算法,在根据轨迹形状和轨迹幅度的变化对患者进行分类方面表现出令人印象深刻的性能。我们还使用 >43,000 名儿科患者的真实队列证明,DTW 可以对 BMI 轨迹进行分类,以识别患儿科代谢综合征风险升高的患者。我们的研究为算法的稳健性及其在临床领域识别新模式的用途提供了见解。
数字
Fig 6图 7图 1图 2图 3图 4图5表 1图 6图 7图 1图 2图 3
引文: Mariam A, Javidi H, Zabor EC, Zhao R, Radivoyevitch T, Rotroff DM (2024) 电子健康记录中纵向临床测量的无监督聚类。PLOS 数字健康 3(10): e0000628. https://doi.org/10.1371/journal.pdig.0000628
编辑 器: Henry Horng-Shing Lu,国立阳明交通大学,台湾
收到: 2024 年 1 月 10 日;接受: 2024 年 8 月 30 日;发表: 10月 15, 2024
版权所有: © 2024 Mariam 等人。这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。
数据可用性: 当前研究期间使用和分析的数据集可在 figshare (DOI: 10.6084/m9.figshare.24790284) 上找到。
资金: 这项工作部分得到了 NIH 资助的支持:1R61NS113258-01A1 (DMR)。资助者在研究设计、数据收集、数据分析和解释或本手稿的撰写中没有发挥任何作用。
利益争夺: D.M.R. 拥有 Clarified Precision Medicine 和 Genovation Health, LLC 的股权。D.M.R. 已获得诺和诺德的研究支持。D.M.R. 拥有与 2 型糖尿病、慢性肝病和肝癌检测相关的知识产权。
介绍
将无监督机器学习算法应用于纵向电子健康记录 (EHR) 为识别临床生物标志物的模式提供了前所未有的机会,这些模式可以改善健康状况并从现实世界的队列中获得对疾病进展的新见解 [1–6]。从历史上看,时间序列匹配算法,如动态时间规整(DTW),在时间序列间隔规则的地方显示出巨大的潜力,如语音识别、音频信号处理和蛋白质序列比对[7–10]。时间序列匹配算法可用于衡量患者纵向数据之间的相似性。然后,这些相似性测量可用于识别具有相似轨迹的患者集群,从而获得新的临床见解 [11,12]。但是,EHR 中捕获的纵向数据与传统上用于评估这些方法的数据类型有很大不同。例如,患者的临床数据受许多因素的影响很大 [5,6],导致非随机数据缺失和不规则抽样,这在用于开发这些方法的其他数据类型中并不常见。需要使用真实世界的临床实验室测量对这些算法进行系统研究,以确定哪些方法最准确、最稳健,可以得出具有临床意义的见解 [13]。
使用真实数据进行比较方法的挑战在于无法知道真实信号,因此我们永远无法真正知道患者在聚类时实际属于哪个类别。使用模拟数据集的价值在于我们可以识别和调制真实信号,从而能够系统地比较不同实验条件下的聚类算法。但是,模拟数据集需要代表真实世界的观察结果,才能使其发现具有通用性。在这里,我们从真实世界的常规临床测量中生成了模拟数据集——体重指数 (BMI)、收缩压 (SBP) 和随机葡萄糖。这种方法的优势在于,可以使用在真实 EHR 数据中观察到的相关结构和其他关键方面来推导出模拟队列,并使我们能够 1) 评估各种参数对聚类算法稳健性的影响,以及 2) 确定最适合在 EHR 数据中发现临床见解的算法[13]。
无监督聚类算法旨在根据数据中的相似性查找聚类,而不是尝试根据一组预先标记的观测值来学习聚类的监督方法。这些无监督算法可以分为基于质心的方法和分层方法,两者都需要计算时间序列之间的相似性指标。在这里,我们重点介绍了基于质心的方法,因为分层方法需要更多的计算时间和资源,从而限制了它们的扩展能力 [14]。无监督聚类算法可以分为三个主要部分:i) 分配方法:将患者分配到一个聚类(分区聚类)或具有不同概率的所有聚类(模糊聚类),ii) 质心计算:迭代更新聚类质心的方法,以及 iii) 距离度量:计算质心和时间序列之间距离的方法 [14]].我们评估了分配类型、质心计算和距离测量的不同变化,以形成 30 种独特的聚类算法,利用 8 种最先进的时间序列匹配算法作为距离测量,并将这些应用于模拟数据集,以确定最适合纵向 EHR 数据的算法。
然后,我们测试了最稳健算法的效用,以检查与大型真实世界儿科队列中代谢综合征 (MetS) 风险概况相关的儿童 BMI 模式(图 1)。MetS 是多种健康状况的组合,其合并症与动脉粥样硬化、冠心病和中风的风险增加有关 [15]。肥胖是这种情况的主要驱动因素,随着儿童肥胖的增加,MetS 需要更加警惕 [16]。先前的研究已经确定,BMI 值高的受试者被诊断为 MetS 的风险增加,但 BMI 轨迹如何导致这种风险尚不清楚 [15]。在这里,我们探讨了使用最准确和稳健的算法进行聚类在多大程度上与早期研究一致,并且能够揭示与 MetS 相关的新儿童 BMI 模式。
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
国际电影节原始图像
图 1. 研究设计。
临床数据是从患者的电子健康记录 (EHR) 数据中随机选择的,并用作模拟的基础。将无监督机器学习算法应用于模拟数据集,并对其准确性进行排名。然后将最合适的算法应用于真实世界的儿科队列,以识别具有不同代谢综合征 (MetS) 风险的 BMI 模式。
https://doi.org/10.1371/journal.pdig.0000628.g001
结果
总体结果
30 种聚类算法是由 2 种聚类分配方法、6 种质心计算方法和 8 种距离测量组合而成的。补充信息 (S1 文本) 中详细介绍了每种方法。通过计算调整后的兰德指数 (ARI) 来评估聚类算法的准确性,该指数的范围从 -1 到 1,值越接近零表示随机排序。大多数算法的中位 ARI 接近 1,表明集群分配比随机机会更好(图 2)。
在所有模拟数据集中,具有分区聚类的算法的排名高于模糊聚类(图 2A)。计算质心的方法包括专门为时间序列开发的方法(例如,DTW 重心平均 (DBA))和用于许多数据类型的通用方法(例如,围绕中心点进行分区 (PAM))。令人惊讶的是,PAM 被用于排名前五的算法中的三种,优于专为时间序列开发的方法。
DTW 下界 (LB) 和 LB 改进距离指标并列第一(平均等级 = 4.19,P > .05 )(图 2A-2B)。DTW 排名第三 (平均排名 = 5.53,Ps < .05)。 当数据集按临床测量类型 (即 BMI、随机葡萄糖、SBP) 进行子集时,前三名属于相同的三种算法,即 DTW-LB、LB-Improved 和具有 PAM 质心的 DTW(S8、S15 和 S22 图)。
正如预期的那样,随着模拟队列中缺失率的增加,准确性降低(图 2B)。此外,随着类别之间重叠的增加,受离散度和效应大小的控制,所有算法的 ARI 都呈下降趋势(图 2E)。与具有轨迹形状差异的队列相比,所有五种算法都更擅长在具有轨迹大小差异的队列中找到真实模式(图 3 和图 4)。当模拟队列有 2 、 3 和 4 个真实类别时,方法的排名是一致的(图 5A)。几乎,所有距离测量都使用 PAM 质心的排名高于其他质心,唯一的例外是 Soft-DTW,它与 Soft-DTW 质心一起使用时最稳健(图 5B)。
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
TIFForiginal image
图 2. 基于量级和形状队列结果的算法排名。
(A-B) 和 (C-D) 分别显示所有队列中所有 30 种算法的平均排名和调整后的兰德指数 (ARI)。通过使用 R 包 mlr3benchmark 中的 Nemenyi 测试比较所有算法来获得平均排名,平均排名较低表示性能越好。ARI 量表的范围介于 -1 到 1 之间,接近零的值表示与随机分配相当的分类。(A) 和 (B) 显示平均排名。具有相似精度的算法在(A)中由黑条(虚线和实线)连接。这些指标是 (B)、(C) 和 (D) 中缺失的进一步子集。(C) 和 (D) 显示了模拟数据集的 ARI 分布,没有缺失和缺失> 10%。
https://doi.org/10.1371/journal.pdig.0000628.g002
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
国际电影节原始图像
图 3. magnitude cohorts 的算法排名。
(A-B) 和 (C-D) 分别显示了跨量级队列的所有 30 种算法的平均排名和调整后的兰德指数 (ARI)。通过使用 R 包 mlr3benchmark 中的 Nemenyi 测试比较所有算法来获得平均排名,平均排名较低表示性能越好。ARI 量表的范围介于 -1 到 1 之间,接近零的值表示与随机分配相当的分类。(A) 和 (B) 显示平均排名。具有相似精度的算法在(A)中由黑条(虚线和实线)连接。这些指标是 (B)、(C) 和 (D) 中缺失的进一步子集。(C) 和 (D) 显示了模拟数据集的 ARI 分布,没有缺失和缺失> 10%。
https://doi.org/10.1371/journal.pdig.0000628.g003
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
国际电影节原始图像
图 4. 形状队列的算法排名。
(A-B) 和 (C-D) 分别显示形状队列中所有 30 种算法的平均排名和调整后的兰德指数 (ARI)。通过使用 R 包 mlr3benchmark 中的 Nemenyi 测试比较所有算法来获得平均排名,平均排名较低表示性能越好。ARI 量表的范围介于 -1 到 1 之间,接近零的值表示与随机分配相当的分类。(A) 和 (B) 显示平均排名。具有相似精度的算法在(A)中由黑条(虚线和实线)连接。这些指标是 (B)、(C) 和 (D) 中缺失的进一步子集。(C) 和 (D) 显示了模拟数据集的 ARI 分布,没有缺失和缺失> 10%。
https://doi.org/10.1371/journal.pdig.0000628.g004
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
国际电影节原始图像
图 5. 队列类型和类数对算法的影响。
使用 R 包 mlr3benchmark 中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 和 (C) 中的黑条显示。(A) 算法在所有数据集中的平均排名由类的数量表示。(B) 所用质心和距离测量组合的平均排名。(C-D)幅度和形状队列之间中位 ARI 的差异。ΔARI>0 表示形状队列的中位精度高于量级队列。ΔARI 按 (C) 中的类数进行分层。如果组合在量级队列中的排名明显较高,则 (D) 注释为“M”,如果组合在形状队列中的排名显著较高,则用“S”注释,如果量级和形状队列之间的排名没有差异,则用“B”注释。
https://doi.org/10.1371/journal.pdig.0000628.g005
幅度仿真结果
虽然在总体结果中观察到前五种算法的准确性存在差异,但量级队列中的前五种算法同样准确(平均排名 = 4.78–5.10)(Ps > .05)(图 3)。按平均等级排序,使用 PAM 质心的 DTW、LB-Improved 和 DTW-LB 距离测量是三种最准确的方法。LB-Keogh 在幅度队列中比在形状队列中要稳健得多 (ΔARI < -0.4)(图 5C)。随后的第四和第五等级是 Soft-DTW(平均等级 = 6.13)和 LB-Keogh(平均等级 = 6.32),后者具有 PAM 质心。值得注意的是,这两种算法的性能各不相同,因此它们也与具有 DBA 质心的 LB-Improved 并列(平均秩 = 6.43)(Ps > .05)。缺失率的增加不会影响这些算法中任何一种的平均准确性(图 3B)。
形状仿真结果
算法的稳健性在形状队列中差异很大(图 4A-4D)。总体而言,算法在每个参数的形状队列中的准确率低于量级队列,这表明基于形状差异的聚类比基于量级差异的聚类更具挑战性(图 4C)。与量级相比,缺失对区分形状的准确性也有更大的影响(图 4B 和 4D),没有算法在缺失率为 >10% 的形状队列上表现良好。
具有 PAM 质心的 DTW-LB 和 LB-Improved (Mean ranks = 3.29) 距离在形状队列中具有最高的平均精度(图 4A-4D)。具有 PAM 质心的 DTW 紧随其后(平均秩 = 6.26,Ps<0.05)。相同的三个时间序列匹配算法占据了 DBA 质心接下来的四个等级中的三个。与幅度队列相比,基于形状的 DTW (SBD) 是唯一在形状队列中具有更高准确性的算法(图 5D),但其总体排名较低。
来自 MetS 队列的真实世界儿科 BMI 轨迹的聚类
经过预处理,该队列由 43,426 名年龄在 2000 年 1 月 1 日至 2020 年 12 月 31 日期间在克利夫兰诊所就诊的 2 至 18 名儿童组成,其中至少一项 BMI 超过 95thpercentile,基于年龄的肥胖标准。该队列主要是男性 (55.7%) 和高加索人 (73.9%) (表 1)。大约 3.4% (N = 1,474) 的队列符合 MetS 标准或被诊断患有 MetS。该队列的平均随访时间为 8.47 年 (SD = 3.60),MetS 患儿和无 MetS 患儿之间差异显著 (7.17 vs. 8.52,P < .001) (S3 表)。 然而,这些差异仅限于最终随访年龄,这表明有和没有 MetS 的儿童在年轻时一直被随访 (P = .81) (S3 表)。在世界卫生组织宣布 2019 年冠状病毒病 (COVID-19) 为国际关注的突发公共卫生事件后,观察到 47.7% 和 41.5% 的未使用 MetS 和患有 MetS 的儿童进行体重测量。然而,2019 年和 2020 年诊断的 MetS 病例百分比没有显著差异 (4.2% vs. 3.6%,P = 0.61)。
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
国际电影节原始图像
表 1. 儿科代谢综合征队列的描述性统计。
https://doi.org/10.1371/journal.pdig.0000628.t001
以 DTW 作为距离测量和 PAM 质心的分区聚类被应用于儿科 BMI 轨迹,因为 i) 与 LB-Improved 一起,它是整体测试、幅度测试和形状测试中三种最准确的算法之一,并且 ii) 与 LB-Improved 不同,它对轨迹长度的方差具有鲁棒性。由于队列中底层集群的真实数量未知,我们利用内部验证指标来确定最佳集群数量(详见方法)。选择由三个内部验证指标中的至少一个确定为最佳且平均成对一致性大于 70% 的聚类用于后续风险分析。Dunn 指数将 5 确定为最佳聚类数 (k)。在 k = 5 时,三个集群(即 C1-C3)的平均重采样一致性为 >70%(图 6A)。C4 和 C5 的平均一致性较低,表明缺乏驱动集群形成的系统模式。
C5 儿童在年龄范围内保持更稳定的 BMI,在较大年龄范围内略有下降轨迹 (方差 = 101.13)。相比之下,C3 组儿童的 BMI 始终高于其他集群中的儿童,并且该集群患 MetS 的风险也最大(OR = 4.87,95% CI:与 C5 相比为 3.93-6.12),与既往文献一致 [17,18]。与 C5 中 BMI 稳定较低的儿童相比,BMI 随年龄增长而增加(如 C1 和 C2 所示)患 MetS 的风险也更高(图 5B-5D)。与 C5 相比,C1 和 C2 发生 MetS 的比值比分别为 2.44 (95% CI: 1.92-3.13) 和 2.60 (95% CI: 2.05-3.33)。与 C5 相比,C4 患 MetS 的风险也更高(OR = 1.35,95% CI:1.05-1.75),并且 C4 表现出更大的 BMI 变化(方差 = 437.41)(图 6B)。
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
国际电影节原始图像
图 6. MetS 集群。
(A) 不同数量集群的平均集群一致性。(B) 每个集群按年龄划分的体重指数 (BMI) 百分位数分布。水平箱线图显示集群中 MetS 诊断的年龄分布。(C) 使用 C5 作为参考的 logistic 回归获得的每个聚类的比值比。(D) 与 MetS 关联的 logistic 回归模型的结果。
https://doi.org/10.1371/journal.pdig.0000628.g006
讨论
无监督机器学习算法有可能在疾病发展、进展和治疗反应方面获得新的见解 [11,12]。成熟的时间序列匹配算法在信号处理等领域显示出前景,人们对它们在临床数据中的应用的兴趣正在增长。然而,这些算法在临床数据中的准确性和稳健性尚未得到系统研究。因此,我们的目标是利用从几种常见的临床测量(即 BMI、SBP、随机葡萄糖)开发的模拟数据集来评估 30 种无监督聚类算法,这些算法部分由 8 种最先进的时间序列匹配算法组成。DTW 是公认的时间序列分类的黄金标准 [19,20]。我们的研究结果支持 DTW 及其变体(即 LB-Improved 和 DTW-LB)可以比此处评估的其他方法更准确地识别临床测量中的潜在纵向模式。在所有模拟队列中,前三名被带有 PAM 质心的距离测量占据。尽管 DBA 最初被设计为使用 DTW [21] 计算代表性质心,但使用 DBA 质心的距离测量并不优于使用 PAM 质心的相同距离测量(图 4B)。对于所有距离测量和质心类型,分区方法的排名高于模糊方法。我们使用 ARI 进行硬分区集群,使用软 ARI 进行模糊集群。虽然在完美分类和随机分配的极端情况下,两种 ARI 方法相同,但随着类别之间重叠的增加,软 ARI 往往较低 [22,23]。但是,模糊聚类中的算法排名发生了变化,这表明质心类型也影响了算法性能。虽然我们没有评估质心类型在分配和重叠程度对软 ARI 估计的贡献,但在这些算法的未来应用中应考虑它们的影响。
与具有不同形状模式的聚类相比,所有算法在查找具有不同幅度模式的聚类时都更准确。值得注意的是,在形状队列中使用 PAM 和 DBA 质心时,LB-Improved、DTW 和 DTW-LB 是唯一具有高准确性的算法(图 4A)。DTW-LB 利用 LB-Improved 对时间序列之间的相似性进行初步估计,然后用 DTW 计算时间序列之间的相似性 [24]。LB-Keogh 是唯一一种对形状队列中的两个质心具有相似精度的算法(图 4D)。在大小和形状数据集的测试中,使用 DBA 质心的 LB-Improved 具有中等到高度的准确性(图 2)。DTW-LB 和 LB-Improved 成为两种最准确的分类算法,适用于形状不同的类。然而,它们从 EHR 中获得新见解的能力可能受到限制,因为这些算法无法适应不同长度的轨迹 [24]。
由于医疗保健利用和社会决定因素不同而导致的非随机缺失数据是 EHR 纵向数据分析的常见挑战 [5,6]。我们的研究结果表明,低至 10% 的缺失会大大降低这些方法在临床数据中的准确性,其中形状差异是类别之间唯一的差异,未来在无监督框架中使用这些方法的研究应优先考虑具有窄幅度范围的完整数据。然而,在旨在预测类别的情况下,可以使用监督深度学习模型,因为已经发现这些模型对高达 50% 的数据缺失具有鲁棒性 [13]。除了分区和模糊聚类方法外,分层聚类方法还经常与时间匹配算法结合使用[21]。研究报道,具有凝聚分层聚类的 DTW 非常准确 [12,25]。分层聚类方法是计算密集型的,因为它们需要对轨迹进行完整的成对比较。这些算法相对于分区和模糊方法的效用仍有待研究。
MetS 导致生活质量大幅下降和医疗保健成本增加,其发病率随着儿童肥胖发病率的上升而增加 [15]。在这里,我们专注于识别具有 MetS 高风险的儿童 BMI 模式。由于 BMI 测量值在临床实践中定期记录,因此这些模式可能有助于告知体重管理干预的必要性。我们确定了三种适合在临床数据中应用的算法。具有 PAM 质心的 DTW 反复成为三种最准确的算法之一,并因其处理不均匀轨迹长度的能力而被应用于儿科 MetS 队列。它在 5 个集群上进行了优化,其中 3 个集群代表不同的 BMI 轨迹(平均集群共识 >70%)(图 5A)。与之前的工作一致 [18],我们还发现在持续高 BMI (C3) 的集群中,MetS 的风险升高(图 6B-6D)。虽然我们没有观察到患有 MetS 和没有 MetS 的儿童之间开始出现轨迹的年龄差异(S3 表),但 C3 中 BMI 轨迹开始的平均年龄较晚(平均值 = 6.29 岁,SD = 3.90),表明该集群可能比其他集群更晚开始获得医疗保健。女性 MetS 的患病率估计往往高于男性 [18]。与其他集群相比,C3 的女性比例也最高 (N = 5,479, 50%) (S4 表)。虽然 C3 的非白人个体比例也更高,但对于非白人 MetS 病例,该集群的比例并未过高 (P = 0.06)(S5 表)。C4 和 C5 的 BMI 水平相似;然而,C4 具有更高的 MetS 风险 (OR = 1.35,95% CI:1.05-1.75)。这可能是由于 C4 中较高的 BMI 变异性,这从集群的低平均一致性和高平均方差中可以看出(图 6)。除 C5 外,所有集群都有 8 岁之前由医生诊断的 MetS 病例(图 6B)。最低和更晚的 MetS 风险与 C5 集群相关,随着时间的推移,BMI 百分位数稳定较低。由于 MetS 的诊断方式相对模糊,因此研究 MetS 具有挑战性。我们不仅依赖 ICD 代码,还结合了实验室测量以减少由于诊断不足而导致的偏差。然而,我们的队列中可能仍有未确诊的病例,因为一旦怀疑 MetS 或其他潜在疾病,就可能要求进行实验室测量 [15]。如果每年在 EHR 中记录 BMI 测量值,则包括儿科 BMI 轨迹,但这会丰富总体健康负担高于普通儿科人群的儿童队列,从而引入潜在的选择偏倚。我们对 MetS 风险改变的 BMI 模式的调查仅利用纵向数据。这些模式对于 MetS 和某些人口统计变量(例如性别)都进行了丰富,这表明 BMI 历史和人口统计之间的相互作用为研究 MetS 的发展提供了有价值的信息。未来的研究应考虑人口统计学和既往病史,以便进行更全面的风险分析。先前的研究已将此信息用于开发成人 MetS 模型。这些模型使用遗传和/或临床信息来准确区分 65% 至 93% 的个体 [26,27]。这些模型中的重要变量包括 MetS 诊断前血脂异常和高血压的标志物。然而,需要注意的是,与儿科病史相比,这些指标在成人病史中更常见 [15]。在这里,我们的实际应用对于证明 BMI 的纵向模式是 MetS 的重要指标非常重要,在我们附属的深度学习工作中,我们表明将这些纵向特征纳入预测模型可以大大提高模型的准确性 [13\u201228]。
我们随机选择了每种临床测量类型的 6 个轨迹,作为在我们的模拟工作流程中系统地操纵信号和噪声的基础。这使我们能够比较算法在各种情况下的性能,其中保留了底层 EHR 特定的相关结构并且知道基本事实,但是,重要的是要注意,这些轨迹并不代表在 EHR 中观察到的所有相关结构,算法性能在其他情况下可能会有所不同,例如不同的临床实验室测量。然而,重要的是要注意,在我们的分析中,顶级算法性能排名在临床测量类型(即BMI、随机葡萄糖和SBP)中保持一致(图2,S8,S15和S22)。 许多算法(例如 DTW-LB)也要求所有轨迹具有相同的时间间隔,我们使用了一种更简单的插补方法,即 mean,在我们的模拟分析中满足这一要求。更复杂的插补方法可能会提高这些算法在现实世界轨迹中的能力。虽然我们通过用 5 个随机种子拟合这些算法来解释由于质心随机初始化引起的变化,但我们没有调查算法准确性的初始条件的影响。应在未来的研究中评估初始条件和类重叠之间交互作用的影响。我们通过对儿科 MetS 队列中的分区达成共识来解释初始条件。我们的模拟包括三种常见且具有代表性的临床测量(BMI、葡萄糖、SBP),但这些方法在其他临床测量中的表现可能不同。
我们系统地模拟了跨多个参数的数据集,以表征 30 种无监督聚类算法识别聚类的能力。然后,我们将确定的最强大的算法之一应用于真实世界的数据集,以生成对日益重要的儿科疾病的新见解。由于在真实数据中不知道真正的类成员身份,因此利用在类似的模拟数据集中证明稳健分类准确性的方法为在临床队列中查找神秘的子结构提供了额外的信心。
方法
数据
从 EHR 中提取 2000 年至 2020 年间在克利夫兰诊所就诊的患者的数据,并用于生成模拟数据集和提取儿科 MetS 队列(图 1)。我们从 BMI 、 SBP 和随机葡萄糖测试中汇编了时间序列,并从每种测量类型的 6 名患者中随机选择时间序列来生成模拟数据集(图 1)。这三种不同类型的测量被用作模拟的基础,以确保表示在真实临床环境中观察到的不同纵向模式。仅为儿科 MetS 队列编制了 BMI 时间序列。模拟数据集和 MetS 队列的详细信息如下所示。
模拟数据集
我们为每种类型的临床实验室类型随机选择了 6 条轨迹作为形状队列和幅度模拟的基础(图 7)。这些临床实验室类型是根据它们用于筛查高血压和糖尿病等心脏代谢疾病的常规用途来选择的 [15]。BMI 是根据相遇期间捕获的常规体重和身高测量值计算得出的。在遭遇期间还捕获了收缩压测量值。LOINC 代码 2339-0 用于检索全血中测量的随机葡萄糖水平。使用缺失值之前和之后的平均值估算缺失测量值,导致每个轨迹的年度测量值跨越 16 年。这确保了在模拟中明确操纵缺失的影响,如下所述。正如 Javidi 等人 [13] 之前所描述的,类别之间的差异基于震级,同时保持轨迹形状不变(震级队列)或形状,同时保持震级不变(形状队列)。通过从量级的正态分布中随机采样来引入量级的变化。形状的变化是通过从确定为最重要形状参数的正态分布中随机采样而引入的。最重要的形状参数是通过对每个轨迹进行多项式回归来确定的。然后用置换值替换回归参数,以确定轨迹和多项式回归之间的标准误差。影响形状的最重要参数被确定为排列时标准误差最大的参数。用于标识最重要的形状参数的代码已可用:https://github.com/rotroff-lab/unsupervised_EHR_clustering。
我们还改变了数据集中真实类别的数量 (n = 3)、基于具有预先指定平均值的正态分布的效应大小 (n = 4) 和基于标准差的离散度 (n = 4),这也导致了类别之间重叠比例的差异(图 7)。对于具有较大分散性和较小效应大小的类,重叠度更高。重叠的计算方法是属于多个类别的轨迹数除以数据集中的轨迹总数,并作为一个单独的参数进行评估。效应量范围为 0.60 至 1.65,分散度为 0.75、1.25、1.75 和 2.25。通过模拟缺失率为 0% 、 10% 、 25% 和 50% 的数据来评估缺失对 ARI 的影响。所有不同参数的组合导致每位患者 384 个数据集,或每种测量类型 (即 BMI、SBP 和葡萄糖) 2,304 个数据集。模拟数据集的总数为 6,912 个。
缩略图 下载:
PPT的PowerPoint 幻灯片
PNG放大图片
国际电影节原始图像
图 7. Simulation 工作流程。
为每种类型的临床测量随机选择六条轨迹,即体重指数 (BMI) 、收缩压 (SBP) 和随机葡萄糖测试。中间面板显示了一个真实轨迹的模拟数据集的生成。模拟轨迹是通过分别修改其形状和大小从原始轨迹得出的。效应大小调节了原始类分布和模拟类分布的均值之间的差异。效应大小以及均值周围的离散度调节了这些类别之间的重叠。还模拟了类的数量和数据缺失。这导致每个随机选择的轨迹有 384 个模拟数据集。
https://doi.org/10.1371/journal.pdig.0000628.g007
儿科代谢综合征 (MetS) 数据集
真实世界队列包括 2000 年 1 月 1 日至 2020 年 12 月 31 日期间在克利夫兰诊所就诊的儿科患者(2-18 岁),他们的 BMI 至少为 >95th百分位数,代表肥胖。BMI 轨迹用于真实世界分析,因为肥胖是 MetS 的主要已知驱动因素,而 BMI 是肥胖的标志物,通常在儿童的 EHR 中捕获。纳入每岁至少测量一次体重和/或身高的儿童,并使用 R 包 growthcleanr 计算和预处理 BMI 百分位数 [29]。然后,对于没有 MetS 的患者,从 2 岁到 18 岁,对于 MetS 患者,从 2 岁到诊断年龄,编制了精选的 BMI 测量值。拟合样条以平滑 BMI 轨迹并获得每半岁年龄的 BMI 百分位数注释。在平滑之前,队列中与体重测量的不同遭遇的中位数为 30 (四分位距 = 18-47)。根据标准指南,至少有 3 个以下危险因素的儿童(>8 岁)患有 MetS:i) 肥胖,ii) 血压升高,iii) 低 HDL-C,iv) 高甘油三酯水平和 v) 血糖控制不佳 [15,30]。在这项研究中,如果 i) 医生诊断患者患有 ICD-9 代码 277.7 或 ICD-10 代码 E88.81,无论年龄大小,或 ii) 在 8 岁以上的健康记录中满足五种情况中的三种,则病例具有 MetS。S1 表中列出了这些条件的测量变量和标准。这项研究得到了克利夫兰诊所机构审查委员会 (IRB # 20–135) 的批准。
无监督机器学习
基于质心的方法包括分区聚类和模糊聚类方法。分区聚类为特定聚类分配轨迹,而模糊聚类产生属于所有聚类的轨迹的概率 [14]。有多种方法用于计算质心(例如 PAM、DBA)和时间序列与质心的距离(例如 DTW、DTW-LB)。这些方法在 S2 表中定义。通过组合 2 种分区类型、8 种距离测量和 6 种质心计算类型,总共将 29 种聚类方法应用于每个模拟数据集。如果为特定距离测量开发了质心计算方法,则它仅与该距离测量结合使用。R 包 dtwclust 用于实现这些方法 [24]。补充方法(S1 文本)中提供了其他详细信息。
根据聚类方法的排名确定最稳健的算法
通过计算分区聚类的调整 Rand 指数 (ARI) 和模糊聚类的软 ARI 来评估算法的准确性。ARI 和软 ARI 的范围都是 -1 到 1,值接近零表示算法与随机分配相当。在完美分类和随机分配的情况下,ARI 和软 ARI 往往相同 [22]。使用 Nemenyi 测试比较每对算法的 ARI 在模拟数据集中的 ARI 分布,并对性能进行排名。Nemenyi 检验 [31] 假设所比较方法的准确度之间没有差异。在所有模拟数据集中以及分别在幅度和形状模拟数据集中比较了方法。Benjamini Hochberg 方法用于调整多重比较的 P 值 [32]。FDR 校正 P 值< .05 表示存在显著差异。进行了测试,并使用 R 包 mlr3benchmark [33] 计算了基于关键差异的平均排名。然后将具有持续较高 ARI 的算法应用于儿科 BMI 轨迹的真实世界队列,以识别与 MetS 风险增加相关的模式。
儿科 MetS 数据集中的实际应用
在模拟数据集中确定的最稳健的算法应用于儿科 MetS 数据集。与模拟数据集不同,真实世界队列中的类是未知的,并且由于 ARI 需要真实类的知识,因此它被实际应用的内部验证指标所取代。数据集用 5 个随机种子进行聚类。使用以下内部验证指标确定最佳聚类数 (k):Dunn 指数、Ibai Gurrutxaga (COP) 指数和 Silhouette 指数。内部验证指标仅根据集群数据评估集群分区,目的是最终确定紧凑集群,同时最大化它们之间的差异。计算基于共识的指标(即平均聚类共识)以评估聚类的稳定性 [34]。在每个 k 处,还计算了两个个体在五个随机种子中聚集在一起的平均次数,并将 K 模式应用于最终的聚类分配。我们选择了至少一个内部验证指标支持的聚类数量最多且平均成对共识大于 70% 的聚类。使用 logistic 回归研究每个簇中 MetS 的富集。
支持信息
补充方法。
显示 1/34: pdig.0000628.s001.docx
跳至 fig分享导航
很抱歉,我们无法加载您的数据。
1 / 34
下载
无花果分享
S1 文本。 补充方法。
https://doi.org/10.1371/journal.pdig.0000628.s001
(DOCX)
S1 表。 代谢综合征标准。
https://doi.org/10.1371/journal.pdig.0000628.s002
(DOCX)
S2 表。 应用于模拟数据集的算法。
https://doi.org/10.1371/journal.pdig.0000628.s003
(DOCX)
S3 表。 按 MetS 状态划分的描述性统计数据。
https://doi.org/10.1371/journal.pdig.0000628.s004
(DOCX)
S4 表。 在 MetS 队列中发现的集群的描述性统计。
https://doi.org/10.1371/journal.pdig.0000628.s005
(DOCX)
S5 表。 仅 MetS 案例中集群的描述性统计。
https://doi.org/10.1371/journal.pdig.0000628.s006
(DOCX)
S1 图 调整了所有队列算法的 Rand 指数分布。
https://doi.org/10.1371/journal.pdig.0000628.s007
(DOCX)
S2 图 所有量级队列的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s008
(DOCX)
S3 图 队列类型和类数对所有量级队列的算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s009
(DOCX)
S4 图 调整了所有量级队列的算法的 Rand 指数分布。
https://doi.org/10.1371/journal.pdig.0000628.s010
(DOCX)
S5 图 所有形状队列的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s011
(DOCX)
S6 图 队列类型和类数对所有形状队列的算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s012
(DOCX)
S7 图 调整了所有形状队列的算法的 Rand 指数分布。
https://doi.org/10.1371/journal.pdig.0000628.s013
(DOCX)
S8 图 BMI 的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s014
(DOCX)
S9 图 队列类型和类数对 BMI 算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s015
(DOCX)
S10 图 按 BMI 的队列类型和类数划分的算法准确性差异。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。(A) 和 (B) 显示了幅度和形状队列之间中位数 ARI 的差异。ΔARI>0 表示形状队列的中位精度高于量级队列。ΔARI 按 (A) 中的类数分层。(B) 显示了所用质心和距离测量组合的 ΔARI。注释 B、M 和 S 分别表示算法组合在 magnitude only 和 shape only 队列中排名较高。
https://doi.org/10.1371/journal.pdig.0000628.s016
(DOCX)
S11 图 BMI 量级队列的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s017
(DOCX)
S12 图 队列类型和类数对 BMI 幅度队列算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s018
(DOCX)
S13 图 BMI 形状队列的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s019
(DOCX)
S14 图 队列类型和类数对 BMI 形状队列算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s020
(DOCX)
S15 图 随机葡萄糖测量的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s021
(DOCX)
S16 图 队列类型和类数对随机血糖测量算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s022
(DOCX)
S17 图 随机葡萄糖测量的队列类型和类别数的算法准确性差异。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。(A) 和 (B) 显示了幅度和形状队列之间中位数 ARI 的差异。ΔARI>0 表示形状队列的中位精度高于量级队列。ΔARI 按 (A) 中的类数分层。(B) 显示了所用质心和距离测量组合的 ΔARI。注释 B、M 和 S 分别表示算法组合在 magnitude only 和 shape only 队列中排名较高。
https://doi.org/10.1371/journal.pdig.0000628.s023
(DOCX)
S18 图 随机血糖测量幅度队列的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s024
(DOCX)
S19 图 队列类型和类数对随机血糖测量幅度队列算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s025
(DOCX)
S20 图 随机葡萄糖测量的算法排名塑造了队列。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s026
(DOCX)
S21 图 队列类型和类别数量对随机血糖测量算法的影响塑造了队列。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s027
(DOCX)
S22 图。 SBP 的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s028
(DOCX)
S23 图。 队列类型和类数对 SBP 算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s029
(DOCX)
S24 图 SBP 的队列类型和类数的算法准确性差异。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。(A) 和 (B) 显示了幅度和形状队列之间中位数 ARI 的差异。ΔARI>0 表示形状队列的中位精度高于量级队列。ΔARI 按 (A) 中的类数分层。(B) 显示了所用质心和距离测量组合的 ΔARI。注释 B、M 和 S 分别表示算法组合在 magnitude only 和 shape only 队列中排名较高。
https://doi.org/10.1371/journal.pdig.0000628.s030
(DOCX)
S25 图。 SBP 幅度队列的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s031
(DOCX)
S26 图 队列类型和类数对 SBP 幅度队列算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条表示。
https://doi.org/10.1371/journal.pdig.0000628.s032
(DOCX)
S27 图 SBP 形状队列的算法排名。
(A) 显示了算法的平均排名。使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法排名。具有相似精度的算法由 (A) 中的黑条表示。虚线条和实线之间没有区别。(B) 显示按缺失级别划分的算法的平均排名。(C) 显示无缺失的队列的 ARI 分布 (D) 显示有缺失的队列的 ARI 分布。
https://doi.org/10.1371/journal.pdig.0000628.s033
(DOCX)
S28 图 队列类型和类数对 SBP 形状队列算法的影响。
使用 R mlr3benchmark 包中的 Nemenyi 测试比较算法准确性。具有相似精度的算法由 (A) 中的黑条显示
https://doi.org/10.1371/journal.pdig.0000628.s034
(DOCX)
引用
1.Chen DP、Weber SC、Constantinou PS、Ferris TA、Lowe HJ、Butte AJ。从电子健康记录构建的实验室测量临床阵列或“Clinarrays”支持按严重程度进行疾病亚型。AMIA 年度研讨会论文集。2007;2007:115.PMID:18693809
查看文章PubMed/NCBI谷歌学术
2.Panahiazar M, Taslimitehrani V, Pereira NL, Pathak J. 使用多维患者相似性分析使用 EHR 进行心力衰竭治疗推荐。Stud Health Technol 通知。2015;210:369.PMID:25991168
查看文章PubMed/NCBI谷歌学术
3.Giannoula A, Gutierrez-Sacristán A, Bravo Á, Sanz F, Furlong LI. 使用动态时间扭曲识别患者疾病轨迹中的时间模式:一项基于人群的研究。Sci Rep. 2018 年 12 月 1 日;8(1).PMID:29523868
查看文章PubMed/NCBI谷歌学术
4.Doshi-Velez F, Ge Y, Kohane I. 自闭症谱系障碍中的合并症集群:电子健康记录时间序列分析。小儿科。2014;133(1):e54。PMID:24323995
查看文章PubMed/NCBI谷歌学术
5.Wei WQ,Denny JC。从电子健康记录中提取研究级表型以支持精准医疗。基因组医学 2015 年 4 月 30 日;7(1).PMID:25937834
查看文章PubMed/NCBI谷歌学术
6.张 J、Kowsari K、Harrison JH、Lobo JM、Barnes LE。Patient2Vec:纵向电子健康记录的个性化可解释深度表示。IEEE 访问。2018;6:65333–46.
查看文章谷歌学术
7.Müller M. 动态时间扭曲。音乐和动作的信息检索。2007;69–84.
查看文章谷歌学术
8.Niennattrakul V, Ratanamahatana CA.使用 k-means 和动态时间扭曲对多媒体时间序列数据进行聚类。论文集 - 2007 多媒体与泛在工程国际会议,MUE 2007。2007;733–8.
查看文章谷歌学术
9.侯伟, 潘 Q, 彭 Q, 何 M.一种使用动态时间扭曲分析蛋白质序列相似性的新方法。基因组学。2017 年 3 月 1 日;109(2):123–30.PMID:27974244
查看文章PubMed/NCBI谷歌学术
10.伊斯梅尔 A、阿卜杜勒拉泽克 S、埃尔-赫纳维 IM。基于支持向量机和动态时间扭曲的语音识别的智能医疗系统开发。可持续发展 2020,第 12 卷,第 2403 页。2020 年 3 月 19 日;12(6):2403.
查看文章谷歌学术
11.Mariam A、Miller-Atkins G、Pantalone KM、Zimmerman RS、Barnard J、Kattan MW 等。对 ACCORD 强化血糖治疗有反应的 2 型糖尿病亚型。糖尿病护理。2021 年 4 月 16 日;44(6):1410–8.PMID:33863751
查看文章PubMed/NCBI谷歌学术
12.Hebbrecht K, Stuivenga M, Birkenhäger T, Morrens M, Fried EI, Sabbe B, et al. Understanding personalized dynamics to inform precision medicine: a dynamic time warp analysis of 255 depressed inpatients. BMC Med. 2020 Dec 1;18(1):1–15.
View ArticleGoogle Scholar
13.Javidi H, Mariam A, Khademi G, Zabor EC, Zhao R, Radivoyevitch T, et al. Identification of robust deep neural network models of longitudinal clinical measurements. npj Digital Medicine 2022 5:1. 2022 Jul 27;5(1):1–11.
View ArticleGoogle Scholar
14.Sardá-Espinosa A. Comparing Time-Series Clustering Algorithms in R Using the dtwclust Package.
View ArticleGoogle Scholar
15.Kim EGR, Kaelber DC. Phenotypic prevalence of obesity and metabolic syndrome among an underdiagnosed and underscreened population of over 50 million children and adults. Front Genet. 2022 Sep 6;13. pmid:36147487
View ArticlePubMed/NCBIGoogle Scholar
16.Chiarelli F, Singer K, Cohen R, Weiss R, Gepstein V. Obesity as the Main Risk Factor for Metabolic Syndrome in Children. Frontiers in Endocrinology | www.frontiersin.org. 2019;1:568.
View ArticleGoogle Scholar
17.Weiss R、Dziura J、Burgert TS、Tamborlane W V、Taksali SE、Yeckel CW 等人。儿童和青少年的肥胖和代谢综合征。N Engl J Med. 2004 年;350:2362–74.PMID:15175438
查看文章PubMed/NCBI谷歌学术
18.Ahrens W, Moreno LA, Mårild S, Molnár D, Siani A, De Henauw S, et al.幼儿代谢综合征:IDEFICS 研究的定义和结果。国际 J 肥胖。2014;38:4–14.PMID:25376220
查看文章PubMed/NCBI谷歌学术
19.Petitjean F, Forestier G, Webb GI, Nicholson AE, Chen Y, Keogh E. 更快、更准确的时间序列分类算法。Knowl Inf Syst. 2016;47(1):1–26.
查看文章谷歌学术
20.巴格纳尔 A,线路 J,博斯特罗姆 A,大 J,基奥 E。伟大的时间序列分类烘焙:对最新算法进展的回顾和实验评估。Data Min Knowl Discov.2017 年 5 月 1 日;31(3):606–60.PMID:30930678
查看文章PubMed/NCBI谷歌学术
21.Petitjean F, Ketterlin A, Gançarski P.一种用于动态时间扭曲的全局平均方法,适用于集群。模式识别。2011;44(3):678–93.
查看文章谷歌学术
22.Flynt A, Dean N, Nugent R. sARI:一种包含分配概率的类划分的软一致性度量。Adv Data Anal Classif [互联网].2019 年 3 月 8 日 [引用日期:2024 年 8 月 4 日];13(1):303–23.可从: https://link.springer.com/article/10.1007/s11634-018-0346-x
查看文章谷歌学术
23.Sardá-Espinosa A. 使用 dtwclust 包在 R 中进行时间序列聚类。R 期刊。2019 年 6 月 1 日;11(1).
查看文章谷歌学术
24.Sardá-Espinosa A. 使用 dtwclust 包在 R 中进行时间序列聚类。R 期刊。2019 年 6 月 1 日;11(1).
查看文章谷歌学术
25.Almahamid F, Grolinger K. 用于家庭负荷曲线聚类的具有动态时间扭曲的凝聚分层聚类;用于家庭负荷曲线聚类的具有动态时间扭曲的凝聚分层聚类。2022 年 IEEE 加拿大电气与计算机工程会议 (CCECE)。2022;
查看文章谷歌学术
26.Sghaireen MG, Al-Smadi Y, Al-Qerem A, Srivastava KC, Ganji KK, Alam MK, et al. 使用基于可解释数据增强的分类进行代谢综合征诊断的机器学习方法。诊断。2022 年 12 月 1 日;12(12).PMID:36553124
查看文章PubMed/NCBI谷歌学术
27.Choe EK, Rhee H, Lee S, Shin E, Oh SW, Lee JE, et al. 使用机器学习模型和来自非肥胖健康人群的遗传和临床信息进行代谢综合征预测。基因组学信息。2018 年 12 月 31 日;16(4):e31。PMID:30602092
查看文章PubMed/NCBI谷歌学术
28.Javidi H、Mariam A、Alkhaled L、Pantalone KM、Rotroff DM。用于儿科代谢疾病的可解释预测深度学习平台。美国医学信息学协会杂志。2024 年 3 月 18 日;OCAE049.PMID:38497983
查看文章PubMed/NCBI谷歌学术
29.Daymont C, Ross ME, Localio AR, Fiks AG, Wasserman RC, WGrundmeier R. 自动识别儿科电子健康记录中生长数据中难以置信的值。美国医学信息学协会杂志。2017 年 11 月 1 日;24(6):1080–7.PMID:28453637
查看文章PubMed/NCBI谷歌学术
30.儿童和青少年心血管健康和降低风险综合指南专家小组 摘要报告 儿童和青少年心血管健康和降低风险综合指南专家小组 摘要 国家心肺血液研究所。2012;
31.Demšar J. 多个数据集上分类器的统计比较。机器学习研究杂志。2006;7:1–30.
查看文章谷歌学术
32.Benjamini Y, Hochberg Y. 控制错误发现率:一种实用而强大的多重测试方法。皇家统计学会杂志:B 系列(方法论)。1995 年 1 月 1 日;57(1):289–300.
查看文章谷歌学术
33.Raphael S, Florian P. mlr3benchmark:基准实验的分析和可视化。2023.
查看文章谷歌学术
34.Monti S, Tamayo P, Mesirov J, Golub T. 共识聚类:一种基于重采样的基因表达微阵列数据的类别发现和可视化方法。马赫学习。2003 年 7 月;52(1–2):91–118.
查看文章谷歌学术