EMNLP 2022自然语言处理技术全景解析

本文系统介绍了某机构在EMNLP 2022会议上发表的40余篇论文,涵盖对话系统、信息抽取、查询重写、提示工程等多个自然语言处理前沿领域,展示了最新的技术架构和研究进展。

对话系统

  • 《基于检索的任务导向对话响应模型部署》 提出了一种模型,其中交叉注意力层学习历史记录、配置文件特征和候选响应之间的语义关联,评分函数计算并对候选响应进行排序
  • 《任务导向对话系统的对话含义表示》 探索对话含义表示的新方法
  • 《面向任务对话系统的领域知识注入语言模型》 研究如何将领域知识有效注入语言模型

评估基准

  • 《GEMv2:单行代码实现多语言自然语言生成基准测试》 提出了一个统一的评估框架

事实核查

  • 《基于依赖树的事实核查机器生成文本》 从输入声明的依赖解析树中识别实体属性,以评估事实性

幽默生成

  • 《情境双关语生成》 研究在特定语境下生成双关语
  • 《ExPUNations:基于关键词和解释的双关语增强》 通过添加关键词和解释来增强双关语

信息抽取

  • 《混合方法的跨语言产品评论摘要》 结合多种方法实现跨语言摘要
  • 《询问验证:属性值抽取的跨度候选生成与验证》 提出新的属性值抽取方法
  • 《DORE:基于生成框架的文档有序关系抽取》 识别输入文档中同一实体的多个实例,构建记录实体间关系的关系矩阵
  • 《通过学习修订参考文献实现忠实摘要》 提高摘要的忠实度
  • 《弱监督信息抽取中训练数据过滤的原型表示》 使用原型表示过滤训练数据

信息检索

  • 《通过术语影响分解加速学习稀疏索引》 提升检索效率
  • 《机器翻译在电子商务多语言搜索中的影响》 研究机器翻译对搜索效果的影响

知识蒸馏

  • 《将多语言Transformer蒸馏到CNN以实现可扩展意图分类》 探索模型压缩技术
  • 《知识蒸馏传输集及其对下游自然语言理解任务的影响》 分析知识蒸馏技术的影响

机器学习

  • 《使用焦点损失校准不平衡分类器:实证研究》 针对类别不平衡问题提出解决方案
  • 《元学习差异:为大型语言模型的高效适应做准备》 研究模型适应方法
  • 《使用自适应负样本的开放世界分类》 提出区分已知和未知数据类别的新方法

多模态交互

  • 《多模态上下文传递》 研究多模态场景中的上下文保持

自然语言处理

  • 《McPhraSy:多上下文短语相似度和聚类》 提出新的短语相似度计算方法
  • 《基于抽象意义表示的无监督句法控制复述生成》 探索无监督复述生成

自然语言理解

  • 《基于模型解释的训练样本选择改进大规模对话助手》 利用模型解释优化训练数据
  • 《通过细粒度查询理解改进文本到SQL语义解析》 提升语义解析准确性
  • 《通过深度度量学习学习冷启动和难解析地址的地理位置》 使用深度度量学习捕捉地理空间距离语义

提示工程

  • 《DynaMaR:带有掩码标记表示的动态提示》 提出动态提示方法
  • 《诱导器调优:连接前缀调优和适配器调优》 统一不同的参数高效微调方法

查询重写

  • 《CGF:对话AI中查询重写的约束生成框架》 使用字典树约束查询重写模型的输出
  • 《CycleKQR:无监督双向关键词问题重写》 提出无监督的重写方法
  • 《PAIGE:对话系统中查询重写的个性化自适应交互图编码器》 融合个性化信息
  • 《PENTATRON:基于检索的对话理解的个性化上下文感知Transformer》 结合上下文信息的个性化模型
  • 《对话问答的强化问题重写》 使用强化学习优化问题重写

问答系统

  • 《用于高效准确排序任务的集成Transformer:在问答系统中的应用》 提升排序效果
  • 《FocusQA:具有焦点上下文的开放域问答》 研究焦点上下文下的问答
  • 《从答案排序到答案生成的知识迁移》 探索不同任务间的知识迁移
  • 《使用句子级目标预训练Transformer模型进行答案句子选择》 改进答案选择
  • 《RLET:基于强化学习的可解释问答与蕴含树方法》 提高问答可解释性

机器人技术

  • 《ALFRED-L:研究语言在交互式视觉环境中动作学习的作用》 提出了ALFRED基准的新测试分割,包含让智能体回溯到已知参考位置的指令,以评估其位置记忆能力
comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计