ECCV 2022计算机视觉研究全景展示

本文系统介绍了某中心在ECCV 2022会议上展示的计算机视觉前沿研究成果,涵盖视觉异常检测、道路网络提取、回归约束神经架构搜索等12项创新技术,展示了自监督学习、多目标跟踪等领域的重大突破。

ECCV 2022计算机视觉研究全景展示

研究概览

某中心在本届欧洲计算机视觉会议(ECCV 2022)上的贡献反映了该机构研究兴趣的多样性。以下是12篇ECCV论文的主题和方法概览,这些论文的作者包括某中心的科学家。

关键技术突破

细粒度时尚表征学习

通过在线深度聚类方法,研究人员将表征学习视为多任务学习问题,对全局结构实施集群级约束。学习到的表征显著提升了时尚检索性能。

GLASS:场景文本检测的全局到局部注意力机制

研究人员提出了一种新颖的注意力机制GLASS,将全局和局部特征融合。全局特征从共享骨干网络提取,而局部特征则在调整大小、高分辨率的单词裁剪上单独计算。GLASS在多个公共基准测试中取得了最先进的结果。

大规模真实世界多人跟踪

本文提出了新的多人跟踪数据集PersonPath22,其规模比现有高质量多目标跟踪数据集大一个数量级。该数据集来源多样,注释包含丰富元数据,可用于评估跟踪器在不同维度上的性能。

MaCLR:视频表征的运动感知对比学习

研究人员提出了一种自监督视频表征学习方法MaCLR,在训练期间显式建模运动线索。该方法包含视觉和运动两条路径,通过新颖的跨模态对比目标连接,使运动路径能够引导视觉路径关注相关运动线索。

PSS:开放世界视觉表征学习的渐进式样本选择

研究人员提出了一种新颖的渐进方法,在每次迭代中选择高度同质但属于与当前已知类别距离较远类别的未标记样本。通过在这些选定样本上进行聚类生成高质量伪标签,迭代改进特征泛化能力。

瑞利特征方向:多维特征的非线性GAN潜空间遍历

研究人员提出了一种在潜空间中寻找非线性轨迹的新方法,提供了对GAN输出的前所未有的控制能力,包括在变化其他特征时固定指定图像特征的能力。

多域基准上的少样本目标检测反思

研究人员提出了包含10个不同领域数据集的多域少样本目标检测基准,全面分析了冻结层、不同架构和不同预训练数据集对少样本目标检测性能的影响。

SPot-the-Difference:异常检测和分割的自监督预训练

本文提出了新的Visual Anomaly数据集和新的自监督学习方法SPot-the-Difference,可规范对比自监督和监督预训练,更好地处理异常检测任务。

TD-Road:整体图构建的自顶向下道路网络提取

与之前使用自底向上方法的基于图的方法不同,本文提出了一种自顶向下方法,将问题分解为两个子任务:关键点预测和连通性预测。

面向多样化计算平台的回归自由神经网络

本文介绍了回归约束神经架构搜索,包含两个组件:新颖的架构约束和结合了Top-1准确率和负翻转的搜索奖励。相对于现有最先进方法,REG-NAS实现了33-48%的负翻转减少。

人脸识别中的无监督和半监督偏差基准测试

本文介绍了人脸验证半监督性能评估方法,基于人脸嵌入相似度得分的参数化贝叶斯建模,可准确评估无身份标签数据上的性能。

X-DETR:实例级视觉语言任务的多功能架构

X-DETR架构包含三个主要组件:目标检测器、语言编码器和视觉语言对齐模块。该简单架构在多个实例级视觉语言任务上表现出良好的准确性和快速速度。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计