背景
临床程序通常在门诊诊所进行,未在行政层面提前安排,且程序记录仅存在于自由文本临床电子笔记中。自然语言处理(NLP),特别是命名实体识别(NER),可能提供从自由文本电子笔记中提取程序数据的解决方案。
方法
从某机构的电子临床记录中收集了3个月内的门诊眼科就诊自由文本笔记。使用Prodigy低代码标注工具创建标注数据集并训练用于临床程序的自定义NER模型。从全部临床笔记中提取临床程序。
结果
研究期间共提取了5,098份门诊笔记;使用1,923份门诊笔记构建NER模型,其中包括总共231个人工标注。NER模型的F值为0.767,精确度为0.810,召回率为0.729。最常见的执行程序包括治疗性物质的玻璃体内注射、角膜异物去除和角膜溃疡的上皮清创。
结论
使用低代码标注软件工具可以快速创建自定义标注数据集,以训练NER模型识别存储在自由文本电子临床笔记中的临床程序。这使得临床医生能够快速收集以前未识别的程序数据,用于质量改进和审计目的。低代码标注工具可以减少临床医生参与NLP研究的时间和编码障碍。
关键词
标注工具、命名实体识别、自然语言处理、电子健康记录、低代码、工作流