自2018年起,美国某音乐平台用户可通过语音助手获取音乐推荐。机器学习技术的进步使该对话式推荐系统更加精准和令人满意。
推荐系统无处不在,但传统系统存在明显缺陷:无法感知用户实时情绪或场景上下文。某音乐平台通过对话式交互填补这一信息缺口,其技术复杂度极高,但机器学习突破显著提升了用户体验。该平台全球拥有超5500万用户,技术改进带来巨大潜在价值。
系统工作原理
用户通过语音指令触发推荐流程,系统通过多轮对话收集偏好信息。提问方式包括开放式(“有想听的类型吗?")和引导式(“想要轻松还是活泼的风格?")。系统根据反馈推荐特定艺术家或播放音乐片段,直至用户接受推荐或退出交互。
技术演进
早期版本采用基于规则的对话策略,虽能运行但难以优化。团队转而开发基于机器学习的下一代系统,成为业界首个面向用户的对话式推荐系统。新系统不仅提升对话效率,还整合用户收听历史记录。
机器学习实验
团队通过两次实验突破技术瓶颈:
- 离线强化学习:通过5万次匿名对话数据训练模型,以"提示有用性"为奖励指标(成功推荐=1,失败=0),使成功推荐率提升8%,对话轮次减少20%。最优提示为风格选择问句。
- 个性化整合:加入用户历史数据后,成功率再提升4%,对话轮次减少13%。该场景下最有效的提示变为流派推荐(如"要听另类摇滚还是电子音乐?")。
持续优化机制
系统通过随机化策略探索潜在优化空间:即使某提示仅有5%概率最优,仍会按比例测试。反事实分析确保新策略仅在被验证优于现有策略后才会部署。
未来方向
团队正探索超越"提示有用性"的奖励函数,并研究情感分析技术——通过语气和用词判断用户情绪(如"还行"与"太棒了"的差异)。系统通过多因子评分动态调整回应同理心,平衡技术前沿与用户体验。
技术合作
该成果发表于2021年ACM推荐系统会议,融合了机器学习与对话式AI技术,体现多团队在科研、用户体验和工程领域的跨领域协作。