某中心EMNLP 2022论文技术综述
会议背景
某中心在今年经验方法自然语言处理会议(EMNLP)上发表了40余篇论文,包括被EMNLP新设产业轨道接收的论文。这些论文既涵盖了自然语言理解和问答等传统主题,也拓展到机器人技术和地理空间学习等跨学科领域,其中两篇论文还涉及双关语生成。
重点研究方向
对话系统
- 检索式响应模型:通过交叉注意力层学习历史记录、配置文件特征和候选响应之间的语义关联,利用评分函数计算和排序候选响应
- 对话意义表示:为任务导向对话系统开发新的对话意义表示方法
- 领域知识注入:在面向任务的对话系统中向语言模型注入领域知识
评估基准
GEMv2:多语言自然语言生成基准测试,仅需单行代码即可实现
事实验证
基于依存树的机器生成文本事实核查方法:从待评估事实性声明的依存解析树中识别实体属性
信息抽取
- 混合方法跨语言产品评论摘要:结合多种技术实现跨语言摘要生成
- 问答验证框架:通过生成跨度候选和验证实现属性值抽取
- DORE框架:基于生成框架的文档有序关系抽取,识别输入文档中同一实体的多个实例并构建实体关系矩阵
机器学习
- 开放世界分类:提出区分已知和未知数据类别的新方法,采用自适应负样本策略
- 元学习差异:为大型语言模型的高效适配做准备
多模态交互
多模态上下文传递:研究多模态场景中的上下文保持技术
自然语言处理
- 多上下文短语相似性与聚类:开发新的短语相似度计算方法
- 无监督语法控制释义生成:基于抽象意义表示实现无监督释义生成
查询重写
- 约束生成框架:使用字典树(trie)约束生成查询改写的模型输出
- 无监督双向关键词问题重写:开发新的无监督重写方法
- 个性化自适应交互图编码器:为对话系统中的查询重写提供个性化适配
问答系统
- 集成变换器:用于问答系统的高效准确排序任务
- 焦点问答:针对特定上下文的开放域问答
- 从答案排序到答案生成的知识迁移:探索不同任务间的知识转移
- 基于强化学习的可解释问答:使用蕴含树实现可解释的问答系统
机器人技术
ALFRED-L:研究语言在交互式视觉环境动作学习中的作用,为具身任务完成基准提出新的测试分割方法,包含让智能体回溯到已知参考位置的指令,以评估其位置记忆能力
技术特色
本次会议论文体现了自然语言处理领域的多个技术发展趋势:
- 查询重写成为新兴研究热点,涉及自学习和指代消解等应用
- 提示工程领域快速发展,探索如何引导大型语言模型产生期望输出类型
- 多模态学习和跨领域应用日益增多
- 无监督和弱监督学习方法持续创新
这些研究成果推动了自然语言处理技术的边界,为构建更智能的对话系统和语言理解模型提供了重要技术支撑。