视频分析平台如何实现自动化学习

本文探讨了如何利用智能视频分析平台实现程序监控与模仿学习,通过最少样本训练模型实时识别操作偏差,应用于航天制造及家居场景,核心技术创新包括认知架构开发与多模态理解能力。

编辑注:本次访谈是某科学机构发布的系列文章最新一期,关注某基金投资企业的科学技术背景。2019年,某基金首次投资nFlux.ai,2020年参与其种子轮融资。

2018年,Seyed Sajjadi在南加州大学攻读计算机科学硕士学位时辍学创立nFlux.ai。攻读硕士期间,他同时担任加州州立大学北岭分校系统工程研究实验室(SERL)项目经理。

在南加州大学,Sajjadi专注于认知架构系统Sigma的开发,该研究最终形成论文《控制仿真中的合成角色:认知架构与Sigma的应用》,由Sajjadi与计算机科学教授Paul Rosenbloom等合作完成,入选2018年跨服务/行业培训模拟与教育会议(I/ITSEC)。

在SERL,Sajjadi领导超过90名工程师与人因研究人员的跨学科团队,专注于构建下一代人工智能机器人搜救系统。受漫威电影宇宙中J.A.R.V.I.S.角色启发,团队开始构思创立nFlux.ai,探索人工智能系统如何以积极方式增强人类能力。

问:什么是视频分析平台?如何实现程序监控?
nFlux是首个智能视频分析平台,可从视频非结构化数据中自动化学习并生成上下文洞察。目标是通过视频理解的图灵测试——开发能像人类一样回答视频相关问题的系统。首个客户为某航天机构,当前正在开发类似《太空漫游》中HAL 9000的通用AI系统,可模拟人类思维、行为与行动。针对深空任务通信延迟问题,系统可理解宇航员操作并实时辅助,核心创新为程序监控技术。

通过模仿学习(仅需10-15个样本)构建计算模型,实时跟踪操作流程。若宇航员偏离程序(如遗漏螺丝),系统将实时识别并预警。关键技术在于从少量视频中学习,通过先验语义知识(如系绳、钻孔等)识别关键活动与工具,其灵感来源于人类观察新程序时的信息消化方式。

问:nFlux技术如何应用于制造业?
尽管机器人普及,72%的制造工作仍由人类完成。系统可实时捕获操作偏差,作为虚拟教师培训新员工或现有员工学习新流程,显著缩短生产周期并降低缺陷率。技术还能捕获“部落知识”——通过视频衍生的计算模型标准化培训流程,辅助而非替代人力,最终减少返工并提升产品质量。

问:计算模型如何与智能家居用户相关?
配备屏幕的智能设备支持多模态体验,提供视觉上下文理解。例如烹饪时,设备可监控操作并提示遗漏食材,将程序监控从工厂延伸至厨房。近期获某航天机构合同支持宇航员健康监测,相关技术可应用于居家养老场景:如检测未按时服药或久坐不动时发出提醒,实现医疗健康场景的程序监控延伸。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计