计算机视觉与3D重建技术突破获奖
获奖成就
Hao (Richard) Zhang,西蒙弗雷泽大学杰出教授兼某机构学者,因其“对计算机图形学的众多高影响力贡献”而获得2022年加拿大⼈机通信协会(CHCCS)成就奖。该奖项表彰了“他在基于学习的视觉数据分析与合成方面,特别是3D形状和室内场景方面的持续且有影响力的贡献”。
技术贡献
3D重建技术
Zhang的工作主要解决3D计算机图形学和计算机视觉领域的挑战,其专长领域是3D重建:从各种输入(如激光扫描捕获3D对象上的数据点或仅一张/少数几张照片)计算三维形状。该过程通常会产生不完整的数据,需要数学算法来填补缺失部分。
“重建问题是不适定的,意味着没有足够的输入来获得完整准确的3D模型,”Zhang表示。“这就是为什么需要一些先验知识,例如对称性、其他形式的规律性假设,或从现有数据中提取或学习的知识。”
开源软件贡献
Zhang三篇论文的方法(均与3D重建相关)已被计算几何算法库(CGAL)采用,这是一个著名的开源软件项目。
神经表示创新
Zhang表示:“我今天做的大部分工作都是数据驱动和基于学习的,涉及神经网络。一个非常有趣的问题是什么是3D形状的最佳神经表示。与图像和语音不同,3D形状并不局限于一种标准表示。”
他与学生发表了一篇基础论文,引入使用隐式形状表示进行几何深度学习。虽然这项工作仅有三年的历史,但已经产生了许多后续研究,并引发了现代神经网络设计在重建、渲染和生成3D数据方式上的转变。这项工作的一个后续由Zhang与合作者完成,并获得了CVPR 2020最佳学生论文奖。
学术背景与应用
Zhang拥有滑铁卢大学的数学学士和硕士学位,主修计算机科学。2002年,他获得多伦多大学计算机科学和计算机图形学博士学位。自2014年起担任西蒙弗雷泽大学全职教授,并指导图形学与视觉实验室(GrUVi),这是一个从事计算机图形学和计算机视觉研究的跨学科团队。
工业应用
成为某机构学者后,Zhang被该公司希望为其销售的每个产品建立3D模型的愿景所吸引。作为成像科学组的一部分,他致力于3D建模和内容创建,目标是增强客户在线购物时的“3D体验”:购物者不仅能够以传统方式查看产品,还可以在购买前与它们互动,仿佛它们是真实的3D对象。
“我们生活在3D现实中,所以我们的在线现实最好是三维的,这样人们才能有正确和真实的体验,”Zhang说。“据我所知,如果我们要开发真正有效的东西——并且达到某机构的规模,仍然存在许多技术挑战!”
研究影响
Zhang已经发表了170多篇关于视觉计算各个主题的论文,这是一个处理图像和3D内容(包括用于AR/VR的在线产品和虚拟环境)分析与创建的计算机科学子领域。他的许多论文引入了开创性方法,这些方法已成为该领域的基础工具。
CHCCS成就奖表彰对计算机图形学、可视化或⼈机交互领域做出重大贡献的加拿大研究人员。Zhang在Graphics Interface 2022上接受了该奖项并发表了主题演讲,这是一个致力于计算机图形学和⼈机交互的年度国际会议。