科研动态

Dynamics

首页 >  科研动态 > 新闻  >  详情

《柳叶刀》子刊发布实验室最新成果:基于病理图像的空间图神经网络预测癌症多分子结果

10月26日,上海人工智能实验室智慧医疗研究中心与合作伙伴公布了最新研究成果——基于病理图像的空间图神经网络预测癌症多分子结果,聚焦“AI+医疗”交叉领域。研究论文《Spatially aware graph neural networks and cross-level molecular profile prediction in colon cancer histopathology: a retrospective multi-cohort study》发表于最新一期国际学术顶级期刊《柳叶刀》(The Lancet)子刊《柳叶刀-数字医疗》(The Lancet Digital Health)(IF: 36.615)。此项研究为癌症多尺度数据整合和临床结果预测提供了新路径。

ded392634f2952f9caa79c54fb787e5.png

论文刊登页面

多尺度生物信息的收集、分析和验证为更好理解癌症演变和药物治疗提供了关键信息。通过AI模型的分析,科研人员有望发现针对癌症的关键标志物特征及预测多项临床的关键结果。根据世界卫生组织发布的数据,直结肠癌(Colon cancer)是全球最常见三大癌症之一,占2020年所有新发现癌症的10%和所有癌症死因的约9.4%。该疾病与关键分子的变异、组织病理学变化有密切关系,例如基因突变和蛋白质组表达。数字化的病理切片为评估癌症微环境的空间背景提供了独特渠道。如何探索这些空间特征是当前相关研究的重要课题之一。组织病理学中空间和拓扑结构广泛存在与癌症临床研究中,但很少在定量的机器学习背景下进行探索。通过新的图网络模型能够挖掘基于空间的图像特征,有望更深刻地识别癌症分子层的变化并加深科研人员对癌症生物学的理解。

420b3837f860dffd22b8e7c37ab08b1.png

(a)展示TCGA和CPTAC病理公开数据集。(b)展示对应的癌症基因突变数据集。(c)针对病理切片图像,该方法建立基于肿瘤区域的图模型(tumor tile)。(d)模型分析路线包括空间图建立,GNN模型分析,多类别肿瘤分子预测任务建立和结果分析。

针对以上问题,该研究提出了一种基于图的神经网络方法,通过肿瘤的病理切片的区域相互关联来探索肿瘤微环境的空间信息。研究强调空间背景以构建肿瘤区域并连接图来表示组织病理学数据,而无需明确的病理切片标注,提供有效的解决肿瘤内空间异质性的方法,这对于了解结肠癌患者的预后至关重要。研究结果发现,一系列的癌症分子和组织病理学关联,其结果能用来(i)推断预后价值(例如,KRAS和TP53突变),(ii)评估细胞进展(例如,PLAGL2和POFUT1拷贝数改变),以及(iii)确定结肠癌中的靶向疗法(例如,EGFR蛋白表达)。

1beaee865ff789c9e5d57c191780fca.png

(a)-(c)展示在结肠癌上的分子突变结果,基因组拷贝数预测结果,蛋白组学活动预测结果。(d)-(f)展示对应的p值分布。(g)-(i)展示在直肠癌上的分子突变结果,基因组拷贝数预测结果,蛋白组学活动预测结果。(j)-(l)展示对应的p值分布。

从结果上来看,基于空间的图模型能够预测结肠癌(TCGA-COAD)的多项分子变量(例如基因突变、CNA基因和蛋白质表达)和直肠癌的验证结果(TCGA-READ)。该算法在多种基因突变中展现良好的预测效果(比如FAT3,ZFHX4,CSMD1,FLG),并在蛋白表达的预测上也展现出预测能力(比如HER3,PTEN,BRAF)。其中高表达的HER3分子在不同癌症中广泛存在,包括大肠癌、乳腺癌、头颈癌等。挖掘基于网络图的肿瘤的相关空间信息和传统CNN模型下的特征抓取有显著区别。该研究一共收集了超过89万张肿瘤片区的病理数据。同时收集了每个病人的基因突变、DNA分子突变和蛋白活动指标信息。

6b9d124d4147a07d61ade0a92165ddd.png

图模型在TCGA-COAD上的TP53基因突变的预测结果。(a)代表具有TP53突变结果的原始病理切片图像。(b)显示了五个子图模型标记的突出区域。不同的颜色代表子图模型中不同的关键肿瘤区域。(c)-(g)显示了从五个子图模型中识别出的前10个肿瘤区的放大视图,这些图块按其重要性分数以降序排列。从肿瘤病理学的角度来看,模型2和模型3的可视化结果中常见大面积坏死,而模型1,模型4和模型5中较少见。此外,单细胞坏死在模型1的图像中很常见,而在模型5中很少见。(h)显示了五个子图之间的图测量的平均统计结果。

在应用价值层面,本研究为癌症多尺度数据整合和临床结果预测提供了新路径。不同癌症的联合分析将进一步挖掘该方法的临床价值,并帮助病理学家获得识别结肠癌分子特征及管理其他癌症。该研究也发现,分子的类别不平衡在癌症中很常见,这使得训练样本不足成为优化模型开发的主要挑战之一。例如,TM9SF4、TPX2、TSPY26P和WWOX这样的拷贝数改变基因在队列中仅具有约7.69%的突变率,尽管它们在结肠分子病理学中代表了有意义的临床相关性。通过评估跨癌症类型的模型一致性,将基于图的分析扩展到多癌症环境也很有意义。癌症的分子、病理学和预测研究的前景正在迅速演变,对分子类别长尾特征建模的持续研究将揭示更多的癌症中基因组-病理学关联。本论文作者为美国北卡罗来纳大学计算机系博士生丁可昕,上海人工智能实验室智慧医疗研究中心顾问、美国罗格斯大学计算机系访问教授Mu Zhou,美国耶鲁大学医学院病理专业教授He Wang,通讯作者为上海人工智能实验室智慧医疗研究中心教授张少霆和美国罗格斯大学计算机系教授Dimitris Metaxas。如需申请或了解课题组更多信息,请发邮件至 zhangshaoting@pjlab.org.cn,抄送jilu@pjlab.org.cn。


【上海人工智能实验室智慧医疗研究中心】

旨在通过人工智能与医学的深度交叉融合,赋能医疗健康,打造国际一流的智慧医疗研究团队,突破人工智能相关理论和关键技术,建立疾病预警、早筛、诊断、治疗与疗效评价的智能化技术体系,形成具有广泛国际影响力的智慧医疗成果应用及推广体系。

中心正面向全球招募领军人才、青年研究员、博士后、工程师及产品经理等岗位,欢迎登陆上海人工智能实验室官方网站(www.shlab.org.cn),点击导航栏“加入我们”,在该页面搜索框输入“智慧医疗”查看岗位并进行投递。

comm@pjlab.org.cn

上海市徐汇区云锦路701号西岸国际人工智能中心37-38层

沪ICP备2021009351号-1