计算机视觉与3D重建技术突破获奖

文章介绍了Richard Zhang因其在计算机图形学和视觉计算领域的开创性贡献获得2022年加拿大⼈机通信协会成就奖,重点阐述了他在3D重建、基于学习的视觉数据分析与合成方面的技术突破。

计算机视觉与3D重建技术突破获奖

获奖成就

Hao (Richard) Zhang,西蒙弗雷泽大学杰出教授兼某机构学者,因其“对计算机图形学的众多高影响力贡献”而获得2022年加拿大⼈机通信协会(CHCCS)成就奖。该奖项表彰了“他在基于学习的视觉数据分析与合成方面,特别是3D形状和室内场景方面的持续且有影响力的贡献”。

技术贡献

3D重建技术

Zhang的工作主要解决3D计算机图形学和计算机视觉领域的挑战,其专长领域是3D重建:从各种输入(如激光扫描捕获3D对象上的数据点或仅一张/少数几张照片)计算三维形状。该过程通常会产生不完整的数据,需要数学算法来填补缺失部分。

“重建问题是不适定的,意味着没有足够的输入来获得完整准确的3D模型,”Zhang表示。“这就是为什么需要一些先验知识,例如对称性、其他形式的规律性假设,或从现有数据中提取或学习的知识。”

开源软件贡献

Zhang三篇论文的方法(均与3D重建相关)已被计算几何算法库(CGAL)采用,这是一个著名的开源软件项目。

神经表示创新

Zhang表示:“我今天做的大部分工作都是数据驱动和基于学习的,涉及神经网络。一个非常有趣的问题是什么是3D形状的最佳神经表示。与图像和语音不同,3D形状并不局限于一种标准表示。”

他与学生发表了一篇基础论文,引入使用隐式形状表示进行几何深度学习。虽然这项工作仅有三年的历史,但已经产生了许多后续研究,并引发了现代神经网络设计在重建、渲染和生成3D数据方式上的转变。这项工作的一个后续由Zhang与合作者完成,并获得了CVPR 2020最佳学生论文奖。

学术背景与应用

Zhang拥有滑铁卢大学的数学学士和硕士学位,主修计算机科学。2002年,他获得多伦多大学计算机科学和计算机图形学博士学位。自2014年起担任西蒙弗雷泽大学全职教授,并指导图形学与视觉实验室(GrUVi),这是一个从事计算机图形学和计算机视觉研究的跨学科团队。

工业应用

成为某机构学者后,Zhang被该公司希望为其销售的每个产品建立3D模型的愿景所吸引。作为成像科学组的一部分,他致力于3D建模和内容创建,目标是增强客户在线购物时的“3D体验”:购物者不仅能够以传统方式查看产品,还可以在购买前与它们互动,仿佛它们是真实的3D对象。

“我们生活在3D现实中,所以我们的在线现实最好是三维的,这样人们才能有正确和真实的体验,”Zhang说。“据我所知,如果我们要开发真正有效的东西——并且达到某机构的规模,仍然存在许多技术挑战!”

研究影响

Zhang已经发表了170多篇关于视觉计算各个主题的论文,这是一个处理图像和3D内容(包括用于AR/VR的在线产品和虚拟环境)分析与创建的计算机科学子领域。他的许多论文引入了开创性方法,这些方法已成为该领域的基础工具。

CHCCS成就奖表彰对计算机图形学、可视化或⼈机交互领域做出重大贡献的加拿大研究人员。Zhang在Graphics Interface 2022上接受了该奖项并发表了主题演讲,这是一个致力于计算机图形学和⼈机交互的年度国际会议。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计