机器学习平台五周年回顾与展望

本文回顾了某中心机器学习平台五年的发展历程,从最初的基础模型构建工具到如今集成数据准备、自动验证、地理空间分析等功能的完整生态系统,探讨了机器学习民主化趋势及未来AI自动化内容创作的发展方向。

五年前的11月,在某中心年度re:Invent大会上,某机构宣布推出一项名为SageMaker的新服务,使客户能够快速轻松地构建、训练和部署机器学习模型。同时发布了四项将机器学习应用于特定任务的服务:语音转文本、文本翻译、文本理解和视频分析服务。

自那时起,SageMaker成为某中心历史上增长最快的服务之一。但当时,市场对全托管机器学习服务的需求尚不明确。“机器学习已经很重要,而且显然会变得更加重要,”某中心机器学习与人工智能服务副总裁表示,“但构建和训练模型非常复杂,需要大量专业知识。我们不确定市场需求有多大,但我们在内部成功应用了机器学习,希望将这种机会带给客户。”

SageMaker的目标之一就是简化机器学习流程。首个版本包含了广泛使用的机器学习算法实现、自动超参数调优、与TensorFlow等流行机器学习框架的原生集成,以及简便的模型部署功能。“它消除了管理机器学习基础设施、执行健康检查、应用安全补丁和进行其他日常维护的繁重工作,”该副总裁表示。

事实上,SageMaker的快速普及超出了预期。当时市场上已有多个机器学习服务。“我们起步较晚,但增长更快,”该副总裁说。

这部分归功于某中心在系统设计方面的深厚专业知识。工程师们能够设计出PyTorch和TensorFlow等核心机器学习框架的高效实现,研究人员持续开发更有效的方法在多个GPU上分布式训练大型模型。

但该副总裁强调,这也得益于某机构在机器学习方面的专业积累。“某机构从事机器学习已有数十年,是个性化和推荐系统的先驱,并且长期使用需求预测来优化供应链。”

该副总裁表示,SageMaker的快速普及还受益于持续开发的新工具,这些工具使得在云中进行机器学习更加容易。例如,为处理特定类型数据(如图像、文本、地理空间数据或金融数据)的客户发布了专用工具。

“我们发明了以前不存在的机器学习工具——如协作工具、调试工具和世界上首个机器学习集成开发环境。目标是将软件开发领域的熟悉工具引入机器学习领域。”

这种创新持续不断。在最近的re:Invent大会上,宣布了八项新的SageMaker功能,包括:

  • 数据准备功能:允许客户可视化检查数据并解决问题
  • 自动模型验证:使客户能够使用实时推理请求测试新模型
  • 地理空间数据支持:使客户能够更轻松地开发用于气候科学、城市规划、灾害响应、零售规划和精准农业等领域的机器学习模型

当然,不仅仅是SageMaker的周年纪念。用于语音转文本、翻译、文档处理以及视频和图像分析的AI服务也迎来了五周年。随着SageMaker环境的扩展,AI产品组合也在不断丰富。

最令人兴奋的新增功能之一是CodeWhisperer。通过该服务,客户可以使用普通语言指定希望程序执行的操作,基于集成开发环境中的现有代码,CodeWhisperer会建议实现代码。该服务还利用某机构在自动推理方面的专业知识,确保生成的代码安全且行为正确。

“所有这些工具——SageMaker和AI产品组合中的所有其他服务——都是为了让人工智能和机器学习成为主流,”该副总裁表示,“CodeWhisperer指向了一个未来,客户甚至不需要知道如何编码就能在云中部署自己的复杂服务。”

周年纪念是思考未来和回顾过去的时刻,虽然很难预测几年后客户最迫切的需求是什么,但该副总裁对具有比当今可用服务更多自主权的AI服务前景很感兴趣。

“一个有趣的领域是各种任务的自动化,”该副总裁说,“我们已经看到工业设备预测性维护等应用。但我认为我们将看到更多将机器学习嵌入个人生产力工具的应用——例如,查看电子邮件并进行总结、确定需要优先回复的邮件、更新日历、处理更新电子表格或保存附件等重复性任务的机器学习。”

“另一个即将到来的趋势是AI为您创建内容,如电影或诗歌。例如,看看Alexa故事创作体验。想象一下,使用自然语言描述视频,AI就能为您创建。这即将到来。这将民主化提升到另一个层次,符合AI服务的整体理念。”

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计