PRODIGY v1.10: 依赖关系、音视频、扩展NER和图像标注等多项新功能
PRODIGY(https://prodi.gy)是一款现代化的标注工具,用于收集机器学习模型的训练数据,由某机构开发。版本1.10包含大量新功能,包括手动依赖和关系标注、音频和视频标注、全新改进的图像用户界面、新的配方回调、更多手动NER设置,以及各种新的配置选项和设置。
主要功能亮点
- 依赖和关系标注:支持手动标注依赖关系和实体间关系。
- 依赖解析:增强依赖解析能力,提升标注准确性。
- 共指消解:识别并链接文本中的指代实体。
- 联合跨度和关系标注:同时标注文本跨度和其间关系。
- 生物医学事件抽取:专用于生物医学领域的实体和事件标注。
- 音频和视频标注:扩展支持多媒体数据标注,包括转录和自定义界面。
- 说话人日志与模型循环:结合模型进行说话人识别和日志记录。
- 改进的手动图像标注:优化图像标注用户界面和功能。
- NER标注用于微调Transformer:支持基于Transformer模型的实体识别标注。
- 基于字符的跨度标注:精细到字符级别的文本标注。
- 配方回调:新增
before_db和validate_answer回调函数,增强流程控制。 - 用户界面配置:支持翻译、按钮和侧边栏自定义设置。
资源链接
- 网站与文档:https://prodi.gy
- 在线演示:https://prodi.gy/demo
- 论坛支持:https://support.prodi.gy
- 配方脚本:https://github.com/某机构/prodigy-recipes
该版本专注于提升标注工具的灵活性和效率,适用于自然语言处理、计算机视觉和多模态机器学习任务。