大规模多语言NLU 2022:征稿及共享任务参与邀请
大规模多语言自然语言理解2022(MMNLU-22)是一个即将在与自然语言处理实证方法(EMNLP)会议同期举办的研讨会。该研讨会专注于50多种语言的自然语言处理(NLP)技术,将邀请知名NLP研究人员进行演讲、论文展示和海报环节。研讨会将于2022年12月7日在阿布扎比和线上同步举行。某中心与学术合作伙伴共同主办此次研讨会。
技术内容
作为MMNLU-22共享任务基础的MASSIVE数据集是一个涵盖51种语言的并行数据集。
MMNLU 2022现已发布征稿通知。OpenReview直接提交截止日期为9月7日,ACL滚动评审(ARR)承诺截止日期为10月2日。任何与多语言自然语言理解(NLU)模型和系统进展相关的工作都将被考虑,包括:
- 多语言基准测试的建模结果
- 多语言表征的探索与可视化
- 数据缩减和增强技术(包括使用机器翻译的方法)
- 分词分析
- 蒸馏和量化工作
同时欢迎观点论文、负面结果报告和扩展摘要。
共享任务竞赛
除论文提交外,还设有使用MASSIVE数据集的共享任务竞赛。MASSIVE是一个包含100万标注话语、涵盖51种语言的并行NLU数据集。更多细节可在论文预印本和GitHub存储库中找到。
训练集和验证集已于4月20日发布,大规模多语言NLU 2022共享任务的未标注输入将于7月25日发布。参赛者需在8月8日前通过eval.ai提交模型预测结果。获奖者将有机会在研讨会上展示其模型和结果。
重要日期
- 7月25日:共享任务测试集发布
- 8月8日:共享任务提交截止
- 9月7日:研讨会论文直接提交截止
- 10月2日:ACL滚动评审承诺截止
- 12月7日:MMNLU研讨会
期待收到您的论文和共享任务提交。