“环境智能”将加速通用人工智能的发展
随着世界日益互联,计算渗透到我们周围的环境中,一种新的人工智能范式正在出现:环境智能。在这种范式中,我们的环境能够响应请求、预测需求、提供信息或建议行动,然后悄然退居背景。
通用智能的核心能力
通用智能最实用的定义包括三种能力:
- 能够联合学习多个任务,而不是独立建模每个任务
- 能够在没有明确人类监督的情况下持续适应已知任务的变化
- 能够通过与最终用户直接交互来学习新任务
对于交互式AI服务,还有两个关键属性:
- 多感官和多模态智能:处理来自多个输入传感器(如麦克风、摄像头、超声波)的数据,融合传感器数据以更好地理解用户目标,并以不同模态(如语音、文本、图像、视频)生成输出
- 交互技能:能够以类人方式进行对话,不仅掌握自然语言,还能识别和响应情感
技术进展与创新
增强能力
通过大型预训练语言模型的进步,正在更轻松地扩展功能。训练了"教师模型",这是一个拥有数十亿参数的大型预训练多语言模型,编码语言以及与AI交互的显著模式。通过微调该模型,可以在相同数量的任务特定训练数据下获得显著的性能提升。
模型从隐式反馈中自学习的能力得到扩展,包括两种方法:
- 自动重新表述语音识别输出以确保更准确响应的机制
- 自动注释交互数据以最少人工参与重新训练自然语言理解模型
更自然和对话式
通过"对话模式"实现了重大进步,利用视觉算法评估用户对设备的物理方向,结合视觉和音频信息显著改进设备定向语音检测。
扩展了对话记忆能力,超越会话内的指代消解,在特定情况下临时保持跨会话记忆。
发布了常识对话数据集,包含11,000多个新收集的对话,其中连续对话轮次通过公共常识知识图谱中的关系三元组相关联。
更个性化
推出了多项新服务,允许用户以自助方式个性化AI:
- 偏好教学:明确教导哪些技能应处理天气相关问题、关注哪些运动队、偏好哪些美食
- 自定义声音事件检测:从少量示例中训练识别新声音(如门铃响)
- 自适应音量:根据环境噪声水平调整设备音量
- 自适应聆听:为用户提供更多时间完成说话后再响应
更洞察和主动
目前四分之一的智能家居交互由AI主动发起,通过扩展预测和主动功能如预感和例行程序实现。
预感功能识别日常例行程序中的异常并建议纠正,今年还提供了使预感更加主动的选项,让AI可以代表用户行动。
推出推断式例行程序,识别用户通常重复的动作序列,并建议将它们组合成例行程序。
更值得信赖
保护用户隐私是不可妥协的原则和发明领域。差分隐私是重点关注的领域之一:
- 提出了在满足差分隐私标准的同时提高机器学习模型性能的方法
- 开发了自动重新表述训练文本同时保持语义意义以保护隐私的方法
致力于检测和减轻不当偏见的研究,在多个顶级会议上发表了关于测量语言模型偏见和检测训练数据集中偏见的论文。
未来发展路径
认识到通往通用AI有多条路径,每条路径都需要多年的基础研究。环境智能的愿景提供了一条实用的通用AI路径——每一项进步都使AI在用户的日常生活中更加有用。
随着全球AI研究社区在AI各个学科取得的进步,这些技术突破将帮助我们在未来预防大流行病的发生。