计算机视觉在WACV：超越像素标注的技术前沿

某机构杰出科学家Gérard Medioni在IEEE冬季计算机视觉应用会议（WACV）上担任主席，并负责邀请三位主题演讲嘉宾。会议聚焦计算机视觉如何实现"通过视觉输入理解环境"这一核心挑战。

动态场景理解的技术演进

计算机视觉不再局限于图像像素标注，而是需要解读动态场景。这涉及行为理解和预测，例如活动理解子领域需要回答"这个人在做什么"的问题。

自动驾驶和无人购物成为计算机视觉的理想试验场。自动驾驶需要解决场景理解、目标检测和行为推断等全套技术问题，同时还需生成控制车辆的驱动信号。技术难点在于：

虚拟形象生成需要精确建模和复现人类行为。技术难点包括：

计算机视觉领域每周都有显著进展，在面部表情丰富度建模等方面取得突破性成果。该领域正从静态识别向动态环境理解快速演进。