多设备场景下的信号处理与机器学习挑战
本次会议旨在汇聚产业界与学术界专家,推动多设备信号处理与机器学习研究。议题包括但不限于:
- 多设备音频数据集
- 自动语音识别与关键词检测
- 设备仲裁(确定响应查询的设备)
- 语音增强:去混响、降噪、回声消除
- 声源分离与说话人定位追踪
- 隐私敏感的信号处理技术
包容性与公平语音技术
会议重点关注语音技术中的算法偏见问题,议题涵盖:
- 偏见分析与缓解方法
- 面向非标准语音(如ALS、听力障碍)的自动语音识别
- 伦理考量与技术民主化
- 公平性驱动的个性化技术
可信语音处理
针对语音数据中丰富的语言及副语言信息,会议探讨以下方向:
- 差分隐私与联邦学习
- 模型可解释性
- 偏见量化与缓解
- 新型隐私攻击防御
- 可信语音处理数据集与基准
听力障碍者的语音清晰度预测
基于全球3.6亿听力障碍人群的需求,会议聚焦:
- 统计语音建模与清晰度预测
- 个性化听力模型构建
- 实时清晰度预测技术
- 清晰度增强模型评估方法
论文提交
所有特别会议论文需通过Interspeech主会议门户提交,截止日期为2022年3月21日。其中听力清晰度预测专题与为期五年的Clarity挑战赛联动,参赛者可基于公开数据集开发预测模型。