从法律到计算机视觉的转折
安东·范登·亨格尔原本准备成为一名知识产权律师,甚至在第一天入职前已经购置了正装。然而他最终选择回到阿德莱德大学,开启了计算机视觉研究的职业生涯。
计算机视觉的发展历程
在20世纪90年代初,全球仅有约1000人从事计算机视觉研究,当时甚至还没有数码相机。大多数计算机视觉论文都要花费大量篇幅描述图像的采集过程。
如今,计算机视觉已经从纯数学领域转变为具有巨大经济价值的技术。范登·亨格尔认为:“计算机视觉的经济价值已经飙升到前所未有的高度。”
视觉问答技术的突破
视觉问答是计算机视觉的一个重要分支,旨在让计算机不仅能理解图像内容,还能回答关于图像的自然语言问题。范登·亨格尔是该领域全球被引用次数最多的研究者,引用次数接近22,000次。
“视觉问答的有趣之处在于,你在运行时提出问题并需要立即获得答案,因此需要非常灵活,这与当前通常针对特定问题的固定、单一用途的机器学习应用不同。”
神经网络推动技术进步
在过去的十年中,深度学习神经网络已经取代了之前为解决各种问题而设计的计算机视觉算法。“事实上,神经网络在这方面表现得如此出色,它们从一个有趣的解决方案变成了我们面临的一些核心挑战的实际解决方案。”
实际应用案例
医疗领域
范登·亨格尔与医疗技术公司合作开发了APAS自动病理评估系统,该系统可以筛查和解释大量病理板,减轻病理学家的工作负担。该设备于2019年获得FDA批准。
零售领域
目前他正在进行的项目包括应用视觉检测方法确保客户获得最佳的新鲜产品,以及使用计算机视觉和机器学习更深入地理解不断变化的商品目录中的数亿个商品。
“我认为整个零售领域正在朝着更好地理解世界上物体的本质以及人类如何与这些物体或产品相关联的方向发展。这是计算机视觉特别适合提供的领域。”
研究展望
尽管管理团队的工作要求很高,范登·亨格尔决心继续亲自参与研究。“要在创新方面真正提供对客户有价值且无人能及的东西,你需要深刻理解技术发展方向的经理。”