Ceres:从半结构化网络获取知识
在2020年信息与知识管理国际会议(CIKM)上,某中心高级首席科学家Xin Luna Dong发表了主题演讲,探讨了从半结构化网络获取知识的技术方案。该项目的目标是构建一个产品知识图谱,“回答关于产品和相关知识的任何问题”。
技术挑战与解决方案
知识图谱已被广泛应用于支持各种应用并增强搜索和问答功能,但传统方法经常遗漏长尾知识,包括不受欢迎的实体、关系和垂直领域。
AutoCeres ClosedIE系统
某中心开发的AutoCeres ClosedIE系统显著提升了从半结构化数据中进行全自动知识提取的准确性,将现有最先进技术的60%+准确率提升至90%以上。
OpenCeres创新系统
OpenCeres是首个针对半结构化数据的开放信息提取系统,能够识别现有本体中不易包含的新关系。
技术集成与应用
该演讲还介绍了某中心在以下技术领域的其他努力:
- 本体对齐
- 实体链接
- 图挖掘
- 问答系统
这些技术使得某中心能够充分利用提取的知识来增强搜索和问答功能。