机器学习在心理健康领域的创新应用
马里兰大学计算语言学家Philip Resnik正在利用机器学习技术分析社交媒体数据,旨在预测心理健康的重要方面,包括自杀风险。这项研究获得了某机构机器学习研究奖的支持。
社交媒体数据的价值
传统的心理健康机器学习研究通常依赖健康记录和临床访谈等数据。但Resnik发现,社交媒体提供了额外的信息层,能够展现患者在非评估状态下的日常体验。研究团队设想建立一个系统,让正在接受心理健康治疗的患者可以选择同意将其社交媒体数据用于监测目的。
“与人们每天在社交媒体上分享生活经历相比,能够识别问题的医疗访问相对稀少,“Resnik说。该技术旨在利用社交媒体数据发现预测模式,例如精神分裂症患者出现精神病发作,或抑郁症患者出现自杀危机的迹象。
监督学习的技术实现
这些预测通过监督学习实现。在该场景中,模型使用由社交媒体帖子组成的数据集,通过学习大量正确示例来识别模式或属性以进行预测。
研究团队使用来自"OurDataHelps"和Reddit等网站的志愿者捐赠的社交媒体数据。所有工作都经过严格的伦理审查,并采取额外步骤匿名化用户,例如自动屏蔽任何类似姓名或位置的信息。
从分类到优先级的转变
先前使用机器学习进行心理健康预测的研究通常旨在进行二元区分。然而,Resnik团队认为简单地标记可能需要关注的人是不够的。
在美国,超过1.2亿人生活在心理健康服务提供者短缺的地区。Resnik指出:“这意味着即使他们知道自己需要心理健康问题的帮助,也可能很难见到心理健康服务提供者,因为提供者数量不足。”
因此,研究团队将重点从简单分类转向优先级排序。在一个方法中,医疗服务提供者将被告知哪些患者风险更高,需要最立即的关注。系统不仅会对最高风险个体进行排名,还会为每个人排名哪些社交媒体帖子最能反映其心理状态。
多阶段评估系统
研究团队还在开发另一种患者优先级排序方法,该系统将依赖多阶段患者评估。例如:
- 第一阶段:非侵入性地评估患者的社交媒体数据
- 第二阶段:邀请部分个体进入交互阶段,如通过自动系统回答问题
- 第三阶段:将面临最直接或严重风险的个体引导至涉及人工评估的阶段
“这是一个管道,在评估患者的每个阶段都可能进行适当的干预,“Resnik说,“目标是在整个人群中找到合适的护理水平,而不是简单地进行二元区分。”
安全数据环境的构建
之前的MLRA资助还帮助赞助了一个安全计算环境的开发,用于存储心理健康数据。这是推进心理健康机器学习研究的重要步骤,因为该领域的主要障碍之一就是获取这种非常敏感的数据。
这个由马里兰大学和某独立研究机构联合项目的成果——心理健康数据飞地,托管在某云服务上,旨在让合格的研究人员从自己的计算机远程访问数据集,并在安全环境中工作,而无法将数据复制或发送到其他地方。
该飞地将用于计算语言学和临床心理学研讨会的练习,届时不同团队将在飞地内处理敏感的心理健康数据集来解决问题。
Resnik表示:“我将这视为一个概念验证,希望这能成为持久的范式,我们使用安全环境让社区以共享的方式处理敏感数据。几十年来,其他研究领域正是通过这种方式取得实际进展的。”