NAACL自然语言处理技术研究全景概览

本文系统介绍了某机构在NAACL会议上发表的45余篇论文,涵盖持续学习、数据增强、对话系统、机器翻译等多领域技术突破,展示自然语言处理前沿研究成果与应用实践。

持续学习

终身预训练:持续适应新兴语料库的语言模型 Xisen Jin, Dejiao Zhang, Henghui Zhu, Wei Xiao, Shang-Wen Li, Xiaokai Wei, Andrew O. Arnold, Xiang Ren

面向新特性的生产级SLU模型迭代训练局部到全局学习 Yulia Grishina, Daniil Sorokin

序列到序列语言生成领域适应中的灾难性遗忘克服 Dingcheng Li, Zheng Chen, Eunah Cho, Jie Hao, Xiaohu Liu, Xing Fan, Chenlei (Edward) Guo, Yang Liu

在"序列到序列语言生成领域适应中的灾难性遗忘克服"中,研究人员提出了一种估算现有模型在新任务训练时数据表示变化程度的方法(右图)。

口语理解的时间泛化 Judith Gaspers, Anoop Kumar, Greg Ver Steeg, Aram Galstyan

数据增强

基于后验正则化的标签迁移词对齐约束 Kevin Martin Jose, Thomas Gueudré

使用词对齐将文本标签从一种语言迁移到另一种语言的困难示例。英语中冠词"the"被标记为"o"(其他);法语中缩写冠词与名词结合,两者接收相同标签(“类型”)。摘自"基于后验正则化的标签迁移词对齐约束"。

通过插入操作实现NLU受控数据生成 Manoj Kumar, Haidar Khan, Yuval Merhav, Wael Hamza, Anna Rumshisky, Rahul Gupta

自然语言理解的高效半监督一致性训练 George Leung, Joshua Tan

语义处理任务的示例生成学习 Danilo Croce, Simone Filice, Giuseppe Castellucci, Roberto Basili

对话系统

从连续语句学习对话表示 Zhihan Zhou, Dejiao Zhang, Wei Xiao, Nicholas Dingwall, Xiaofei Ma, Andrew O. Arnold, Bing Xiang

使用格结构的大规模文本生成解码 Jiacheng Xu, Siddhartha Reddy Jonnalagadda, Greg Durrett

实体链接、消解与类型标注

事件与实体跨文档共指消解的对比表示学习 Benjamin Hsu, Graham Horwood

通过知识库推理改进实体消歧 Tom Ayoola, Joseph Fisher, Andrea Pierleoni

ReFinED:端到端实体链接的零样本能力高效方法 Tom Ayoola, Shubhi Tyagi, Joseph Fisher, Christos Christodoulopoulos, Andrea Pierleoni

通过多任务问答向语言模型注入类型知识 Shuyang Li, Mukund Sridhar, Chandana Satya Prakash, Jin Cao, Wael Hamza, Julian McAuley

可解释AI

在"通过迭代检索-生成推理器的蕴含树解释"中,研究人员提出通过逻辑重组从支持文本证据中提取的前提来解释大语言模型输出的方法。

通过迭代检索-生成推理器的蕴含树解释 Danilo Neves Ribeiro, Shen Wang, Xiaofei Ma, Rui Dong, Xiaokai Wei, Henry Zhu, Xinchi Chen, Zhiheng Huang, Peng Xu, Andrew O. Arnold, Dan Roth

自然语言模型理解的局部聚合特征归因 Sheng Zhang, Jin Wang, Haitao Jiang, Rui Song

极端多标签分类

低流量电商商店中海量语义匹配模型的训练数据增强 Ashutosh Joshi, Shankar Vishwanath, Choon Hui Teo, Vaclav Petricek, Vishy Vishwanathan, Rahul Bhagat, Jonathan May

极端文本分类的极端零样本学习 Yuanhao Xiong, Wei-Cheng Chang, Cho-Jui Hsieh, Hsiang-Fu Yu, Inderjit S. Dhillon

联邦学习

带噪声用户反馈的联邦学习 Rahul Sharma, Anil Ramakrishna, Ansel MacLaughlin, Anna Rumshisky, Jimit Majmudar, Clement Chung, Salman Avestimehr, Rahul Gupta

关键词识别

AB/BA分析:在保持音频隐私的同时估计关键词识别召回率改进的框架 Raphael Petegrosso, Vasistakrishna Baderdinni, Thibaud Senechal, Benjamin L. Bullough

机器翻译

CoCoA-MT:形式化控制对比机器翻译的数据集与基准 Maria Nadejde, Anna Currey, Benjamin Hsu, Xing Niu, Marcello Federico, Georgiana Dinu

在联邦学习中,神经网络的分布式副本在本地训练,仅将其更新(红色)发送到中心模型。“通过联邦学习训练混合领域翻译模型"引入了动态拉取技术,其中参数值在训练轮次间变化较大的分布式模型(左下角)其参数与变化较小模型分开拉取至中心模型。

细节决定成败:神经机器翻译词汇选择陷阱 Tobias Domhan, Eva Hasler, Ke Tran, Sony Trenous, Bill Byrne, Felix Hieber

通过联邦学习训练混合领域翻译模型 Peyman Passban, Tanya G. Roosta, Rahul Gupta, Ankit Chadha, Clement Chung

多任务学习

通过收敛任务知识蒸馏实现多任务学习异步收敛 Weiyi Lu, Sunny Rajagopalan, Priyanka Nigam, Jaspreet Singh, Xiaodi Sun, Yi Xu, Belinda Zeng, Trishul Chilimbi

探索大规模多任务学习中任务可转移性的作用 Vishakh Padmakumar, Leonard Lausen, Miguel Ballesteros, Sheng Zha, He He, George Karypis

命名实体识别

多语言模型中的动态地名录集成用于跨语言跨领域命名实体识别 Besnik Fetahu, Anjie Fang, Oleg Rokhlenko, Shervin Malmasi

NER-MQMRC:将命名实体识别表述为多问题机器阅读理解 Anubhav Shrimal, Avi Jain, Kartik Mehta, Promod Yenigalla

问答系统

答案整合: formulation与基准测试 Wenxuan Zhou, Qiang Ning, Heba Elfardy, Kevin Small, Muhao Chen

多句子推理的段落级Transformer预训练 Luca Di Liello, Siddhant Garg, Luca Soldaini, Alessandro Moschitti

PerKGQA:个性化知识图谱问答 Ritam Dutt, Kasturi Bhattacharjee, Rashmi Gangadharaiah, Dan Roth, Carolyn Penstein Rosé

异构源的产品答案生成:新基准与最佳实践 Xiaoyu Shen, Gianni Barlacchi, Marco Del Tredici, Weiwei Cheng, Adria de Gispert, Bill Byrne

推荐系统

CERES:半结构化会话数据的图条件Transformer预训练 Rui Feng, Chen Luo, Qingyu Yin, Bing Yin, Tuo Zhao, Chao Zhang

自学习

在"FPI:大规模对话助手中的故障点隔离"中,研究人员提出了推断对话代理处理管道中错误发生位置的方法。

FPI:大规模对话助手中的故障点隔离 Rinat Khaziev, Usman Shahid, Tobias Röding, Rakesh Chada, Emir Kapanci, Pradeep Natarajan

大规模对话AI系统中技能路由的可扩展鲁棒自学习 Mohammad Kachuee, Jinseok Nam, Sarthak Ahuja, Jin-Myung Won, Sungjin Lee

大规模对话AI中基于反馈的自感知自学习 Pragaash Ponnusamy, Clint Solomon Mathialagan, Gustavo Aguilar, Chengyuan Ma, Chenlei (Edward) Guo

任务导向语义解析示例,将自然语言转换为AI代理可操作的正式表示。摘自"作为抽象问答的组合式任务导向解析”。

语义解析

作为抽象问答的组合式任务导向解析 Wenting Zhao, Konstantine Arkoudas, Weiqi Sun, Claire Cardie

SeqZero:使用序列提示和零样本模型的少样本组合语义解析 Jingfeng Yang, Haoming Jiang, Qingyu Yin, Danqing Zhang, Bing Yin, Diyi Yang

任务适应

注意力融合:NLU任务适应的轻量高效后期融合机制 Jin Cao, Chandana Satya Prakash, Wael Hamza

通过识别注意力内核结构增强参数高效迁移学习 Yifan Chen, Devamanyu Hazarika, Mahdi Namazifar, Yang Liu, Di Jin, Dilek Hakkani-Tür

文本挖掘

电商评论的远程监督方面聚类与命名 Prateek Sircar, Aniket Chakrabarti, Deepak Gupta, Anirban Majumdar

观点摘要的高效少样本微调 Arthur Bražinskas, Ramesh Nallapati, Mohit Bansal, Markus Dreyer

FactGraph:使用语义图表示评估摘要事实性 Leonardo F. R. Ribeiro, Mengwen Liu, Iryna Gurevych, Markus Dreyer, Mohit Bansal

对话代理如何将在线来源获取的事实(白框)融入对话回复(蓝框)的示例。摘自"通过文档语义图增强接地对话的知识选择"。

通过文档语义图增强接地对话的知识选择 Sha Li, Madhi Namazifar, Di Jin, Mohit Bansal, Heng Ji, Yang Liu, Dilek Hakkani-Tür

通过检索器-生成器迭代训练实现检索增强的多语言关键词生成 Yifan Gao, Qingyu Yin, Zheng Li, Rui Meng, Tong Zhao, Bing Yin, Irwin King, Michael R. Lyu

用户关心什么?从用户反馈中检测可操作见解 Kasturi Bhattacharjee, Rashmi Gangadharaiah, Kathleen McKeown, Dan Roth

文本转语音

共情机器:使用中间特征作为杠杆在文本转语音系统中模拟情感 Saiteja Kosgi, Sarath Sivaprasad, Niranjan Pedanekar, Anil Nelakanti, Vineet Gandhi

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计