机器学习破解疾病影响人体的密码

哈佛医学院研究者利用机器学习算法加速疾病诊断与药物开发,通过治疗数据共享平台整合全球生物医学数据,在罕见病诊断和新冠药物重定位方面取得突破性进展,显著提升医疗研究效率。

破解疾病影响人体的密码:机器学习在生物医学领域的突破

基因预测的成功开端

计算机科学家Marinka Zitnik早期面临一个生物医学难题:在12,000个基因中,哪些基因在模式生物对细菌感染的反应中起作用?当她将生物医学数据输入自己设计的机器学习算法时,算法预测出8个最可能相关的基因。实验室测试证实其中6个基因确实与感染有关,这种方法显示出惊人的成功率。

跨学科研究之路

Zitnik目前担任哈佛医学院生物信息学助理教授,获得某机构研究奖项支持,通过在线平台"治疗数据共享库(TDC)“推动全球范围内AI增强药物发现的潜力。她的研究重点是如何利用机器学习实现准确诊断以及开发新的治疗方法和疗法。

治疗数据共享平台

TDC是一个开源数据集和最先进机器学习模型的集合,专注于药物发现和开发。该平台包含:

  • 匿名化电子健康记录
  • 医学影像数据
  • 基因组学数据
  • 临床试验数据

平台与多家研究机构合作,覆盖从识别潜在治疗分子到优化和规划实验室实验的整个药物研发过程,已被全球超过20万科学家使用。

罕见病诊断创新

针对全球7,000多种罕见疾病,研究团队将医学原理和先验科学知识(包括生物相互作用、化学、遗传学、患者症状和药物相互作用)整合到模型的神经架构中。这种方法使得只需少量标记患者数据就能训练复杂的深度学习模型。

与哈佛领导的"未诊断疾病网络(UDN)“合作显示,该模型对465名患者的医疗数据进行预测时,对于四分之三的患者,致病基因都在模型的前五个预测之中。

云计算与AI加速药物发现

利用某机构弹性计算云(EC2)和ML部署工具,研究者能够:

  • 训练需要大量计算的模型
  • 确保模型在不同患者群体和化学结构上的良好性能
  • 将研究时间从数年压缩到数月

在COVID-19疫情期间,团队使用几何深度学习模型筛选7,500多种现有药物,最终发现6种能够减少病毒感染的药物,其中4种原则上可重新用于治疗COVID-19。

网络级联效应的发现

除了识别与SARS-CoV-2靶向相同蛋白质的药物外,模型还发现了76种通过间接系统效应成功减少病毒感染的"网络药物”。这些发现展示了图神经网络等算法在生物医学知识基础上进行间接观察和推理的能力。

未来展望

生物医学AI为发现提供了新途径,这些工具具有为特定细胞、疾病和患者生成更准确科学假设的潜力,有助于弥合实验室与临床环境之间的差距。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计