徐沁团队:揭示无创早期筛查子宫内膜癌新方法
2024年7月29日, 福建省肿瘤医院徐沁团队在期刊《BMC Medicine》上发表了题为“Early detection of uterine corpus endometrial carcinoma utilizing plasma cfDNA fragmentomics”的研究论文。本研究提出了一种使用cfDNA片段组学和机器学习,进行UCEC早期检测的新方法,显示出有希望的灵敏度和特异性。在临床实践中,使用这种模型,可以显著改善UCEC的管理和控制,从而实现早期干预和更好的患者结果。
研究背景
子宫体子宫内膜癌(Uterine corpus endometrial carcinoma, UCEC)是一种常见的妇科恶性肿瘤,也是女性癌症相关发病的主要原因。诊断为I/II期子宫内膜癌的患者,5年生存率通常在82%-90%之间;而诊断为III/IV期的患者,5年生存率显著下降至34%-42%。因此,准确的初步诊断和及时治疗,是子宫内膜癌治疗的关键。早期发现UCEC允许利用微创手术技术,减少辅助治疗的必要性,从而降低医疗成本、发病率和死亡率。 然而,目前还没有足够准确和可靠的UCEC早期检测,可以应用于疑似UCEC的高危女性。因此,开发一种精确、无创的子宫内膜癌诊断方法,具有重要意义。
外周血采集是一种微创手术,其作为一种通过提供循环肿瘤标志物的遗传信息,早期检测多种实体恶性肿瘤的新方法,已经浮出水面。然而,关于子宫内膜癌的早期诊断,仅通过对血液中循环肿瘤成分的基因测序来诊断这种疾病的技术,尚未得到充分开发和优化。
目前,血浆cfDNA片段组学已应用于许多实体恶性肿瘤,以提高诊断精度。近期,研究的重点集中在cfDNA的核小体足迹上,其成功地鉴定了患者特异性和肿瘤特异性模式,具有相当高的准确性。
在本研究中,团队开发了一个强大的机器学习模型,该模型利用低覆盖率的全基因组测序和源自cfDNA片段组学的广泛全基因组特征,来区分UCEC和健康状况。本研究的主要目的,是为UCEC检测提供一种高度敏感且具有成本效益的模型,这可能在UCEC的管理和控制方面,产生巨大的临床优势。
研究进展
片段组学模式在UCEC癌症中的生物学意义
团队研究了片段组学模式,在UCEC癌症中的生物学意义。团队观察到,拷贝数变异(CNV)特征的全基因组变异。值得注意的是,这些CNV特征中,有很大一部分表现出统计学上的显著差异(调整后的P值为0.05<)。片段大小分布(FSD)分析,揭示了片段长度模式,即使在染色体臂水平上也具有显著的分辨率。FSD特征指出染色体臂上的分布,存在显著差异,染色体 1、10、6、11 和 17 有显著改变。这些染色体与TCGA-UCEC数据库中突变频率较高的前10条染色体中的5条,有趣地对齐。这种相关性暗示了UCEC中,被破坏的核小体组织与易突变的基因组区域之间,可能存在的相互作用。
此外,团队共选择了104个在UCEC患者与健康对照组中,表现出不同特征的NF特征。与健康参与者相比,在UCEC患者中,发现了许多与癌症和免疫反应相关的途径,例如,癌症中的转录失调、病毒或化学致癌作用,以及Th17细胞分化。与癌症和免疫反应相关的通路的富集,在UCEC的各个阶段是一致的;表明无论疾病进展如何,某些关键的致病过程,都会持续被破坏。这些发现强调了研究中使用的NF特征的生物学相关性,表明所识别的碎片组学模式不仅仅是数字抽象,而是深深植根于癌症发展和进展的复杂生物学基础。
A UCEC患者和健康对照组中,1 Mb bins中CNV的比率。B 小提琴图显示了UCEC和健康参与者中,每个染色体臂的FSD分布差异。C KEGG通路富集分析对应于NF特征的基因,这些基因在UCEC患者与健康对照组中表现出不同的特征。
评估癌症检测的分析前和生理变量
团队还评估了血液采集和分析前,生理变量对分类器结果的影响。对健康和受癌症影响的参与者,进行重复采血,始终产生可重复的结果。PPA非常稳定,为100.0%,95%置信区间在统计学上,介于67.6%和100.0%之间。在健康参与者的情况下,样本的运输条件(无论是在24小时、48小时,还是72小时内运输,无论它们是在室温下储存还是用冰袋储存),都不会影响检测结果。所有样品均与参考条件一致,定义为收集后2小时内的状态。这反映在PPA为100.0%,95%置信区间范围为51.0至100.0%。此外,不同时间(3天、7天、1个月)冷冻的样品与参考条件的一致性程度,与非冷冻样品相同,PPA为100.0%,95%置信区间为56.6%至100.0%。然而,冷冻6个月的样本偏离了这种模式,显示出更高的风险评分,从而成为一个积极的信号。这些样品的PPA为60.0%,95%置信区间范围为23.1%至88.2%。其生理状况,包括餐前和餐后,以及运动前后的状态,对检测结果没有影响。这些条件下的所有样品,均与参考条件一致,PPA为100.0%,95%置信区间范围为51%至100%。这表明无论各种生理和分析前条件如何,检测结果都具有高水平的稳健性和可靠性。
A UCEC和健康参与者的重复测试分数。B 各种运输条件对健康参与者测试结果的影响。C 冻结时间对健康参与者测试结果的影响。D 生理状况(饭前和饭后以及运动前后的状态)对测试结果的影响。
研究结论
在本研究中,团队首先开发并评估了一种使用cfDNA片段组学特征,检测UCEC的分类器。它可以有效地区分癌症患者和健康受试者,假阳性率较低,比传统的经阴道超声检查,具有明显更高的特异性,并且比循环肿瘤DNA方法,具有更高的敏感性。与健康个体相比,在UCEC患者中观察到的癌症评分显著更高,这进一步支持了分类器的稳健性和准确性。重要的是,该分类器在早期检测UCEC方面表现出显著的灵敏度,在I期患者中的灵敏度为96.4%。此外,对UCEC诊断阶段变化的预测表明,该模型可以识别大约20%的早期UCEC患者,有望提高患者的5年生存率。
在本研究中,该测试旨在以5X的平均测序深度为目标,同时,考虑了实际应用中的成本效益和数据均匀性。为了确保所有样本的一致性,并确保模型基于遗传数据而不是测序过程的伪影(即测序覆盖率的变化)进行预测,团队选择对覆盖率高于5 ×的任何样本进行下采样,固定深度为5 ×。值得注意的是,在不同的原始测序深度下,使用数据训练的模型在更高的深度上,并没有显示出性能的提高。即使在低于此阈值的测序深度下,也有可能获得可靠的结果。具体来说,虽然FSD和NF等单个模型在测序深度降低时,表现出变异性和性能下降,但团队的集成模型表现出卓越的弹性,始终保持可靠的检测。
该方法可以提高早期UCEC的检出率,与标准护理下晚期疾病的检出率相比,有望将5年生存率从84%提高到95%。然而,这些发现是推测性的,并且基于数学模型,而不是临床结果。因此,该模型对患者结果的影响,需要在更大、更多样化的临床环境中,进行彻底的验证。为了解决样本处理和测序变化,可能导致的批次效应,团队建立了一个基于患者入组和样本采集时间的独立验证集。这一措施对于减少混杂影响,并确保模型在时间不同的数据集上,进行训练和验证至关重要,这些数据集更准确地反映了临床环境中存在的可变性。多中心研究设计,将是未来研究的理想选择,可以为该模型的性能提供更多样化和全面的评估。
声明:本文版权归原作者所有,转载文章仅为传播更多信息,如作者信息标记有误,或侵犯您的版权,请联系我们,我们将在及时修改或删除内容,联系邮箱:marketing@360worldcare.com