AI助力机器理解视觉内容的技术突破

一家由MIT校友创立的公司开发了AI驱动的多模态内容分析平台,能够从图像、视频等非结构化数据中提取洞察,帮助媒体和零售企业实现内容自动化管理和分析。

数据应驱动现代企业的每个决策。但大多数企业存在一个巨大盲点:他们无法理解视觉数据中发生的内容。Coactive正致力于改变这一现状。该公司由两位MIT校友创立,开发了一个人工智能驱动的平台,能够解析图像、音频和视频等数据以获取新洞察。

该平台可即时搜索、组织和分析非结构化视觉内容,帮助企业做出更快更好的决策。“在第一波大数据革命中,企业更擅长从结构化数据中获取价值,“创始人表示,“但如今全球约80-90%的数据是非结构化的。在新的大数据时代,企业需要大规模处理图像、视频等数据,而AI是实现这一能力的关键。”

该技术已应用于多家大型媒体和零售公司,帮助他们无需人工标注即可理解视觉内容。应用场景包括:更快向用户推送合适内容、自动过滤平台上的不当内容,以及分析特定内容对用户行为的影响。

技术原理上,该平台采用模型无关的架构,可随时替换底层AI系统。核心功能包括:内容智能搜索、元数据自动生成和分析洞察提取。“AI出现前,计算机通过字节认识世界,而人类通过视觉,“创始人解释道,“现在AI让机器能像人类一样’看见’世界,这将模糊数字与物理世界的界限。”

典型案例包括:某新闻机构使用该技术实现图片库的智能搜索,使记者能找到更准确的故事素材;某大型娱乐社区平台利用该技术将内容审核时间从24-48小时缩短至500毫秒级。

这项技术代表了人机交互方式的范式转变。“历史上人类必须通过键盘鼠标以机器能理解的方式输入信息,“创始人指出,“现在我们可以自然地交流,与AI共享图像视频,它能理解这些内容。这需要全新的操作系统和工作方式。”

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计