失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > CVPR 图像匹配挑战赛 双赛道冠亚军方案

CVPR 图像匹配挑战赛 双赛道冠亚军方案

时间:2022-03-07 15:02:26

相关推荐

CVPR 图像匹配挑战赛 双赛道冠亚军方案

来源:腾讯优图

近日,腾讯优图实验室在CVPR举办的Image Matching Workshop比赛中,提出的图像匹配技术 (SS-Fusing)荣获双赛道冠亚军。IMW是Google和University of British Columbia(UBC)联合举办的Workshop比赛,吸引了包括旷视,商汤,EPFL,KORNIA,华中科大和OPPO等公司、学校和机构参加。

作为计算机视觉领域的基础技术之一,Image Matching是指寻找一张图片中拍摄的子区域在另一张图片中的对应位置,广泛应用于包括SFM、SLAM、三维重建、大规模图像检索,缺陷检测与配准等领域。

图1 图像匹配技术示例

本次比赛的评测机制如图2所示,参赛者根据自己提出的方法提取每张图的关键点和对应描述子,并提交每两张图之间的匹配结果,赛方会根据提交的结果统计两种评估方案:

1、通过对比两张图之间匹配结果对应的相机位姿和真实位姿之间的差异(Stereo)。

2、根据多张图之间的关键点匹配结果,统计重建后预测全图的相机位姿和真实位姿之间的差异(Multi-view)。因此对于任意两张图之间,关键点的分布越分散,匹配的点越准,则位姿估计的效果越好。

图2 比赛流程图

此外,本届比赛分为限制性赛道(Restricted category)非限制性赛道(Unlimited category),其中限制性赛道要求参赛者提交有限的关键点和对应描述子,非限制性赛道可提交不限数量的关键点对和对应描述子。相较于前两届比赛,本届比赛增加了街景和公园等场景,图片之间的角度和尺度变换更大,对算法挑战非常大,因此我们同时针对关键点的提取部分和匹配准确度部分都做了相应的改善,具体思路如下:

SuperPoint+Autoencoder+Super-Glue作为我们的关键点匹配pipeline。其中SuperPoint用于提取关键点和对应描述子,Autoencoder用于特征压缩,SuperGlue用于关键点匹配,最后通过DEGENSAC进行离群点过滤。同时我们优化了SuperGlue的训练过程和损失函数,提升了模型在比赛数据集下的匹配精度。

图3 SS-Fusing算法流程图

我们针对输入图片进行随机变换增加了提取到的关键点对尺度变换的鲁棒性,同时提出了针对描述子的特征融合模块,以提升描述子的表达能力和尺度鲁棒性。同时我们还对比了我们的特征融合和平均特征融合的效果,其中横坐标为描述子的cos相似度,纵坐标为二者的分布差异,可见我们的方法在高相似度区域下的占比明显高于平均特征,而在低相似度区域下的占比明显低于平均特征,验证了我们方法的有效性。

图4 特征融合模块

图5 加权特征和平均特征相似度分布差异图

我们提出了前背景分割和coarse-to-fine的匹配结构,进一步提升关键点匹配的有效性。其中前背景分割可以有效过滤掉与匹配无关的背景部分。Coarse-to-fine的匹配结构可以提升拍摄尺度差异过大导致的匹配率过低的问题。

图6 前背景分离示意图

图7 coarse-to-fine匹配前后示意图

视觉图像匹配作为基础的计算机视觉能力,在其基础上可拓展众多的下游任务。如在图像检索中,可以通过image matching来检索到和Database中相似的图片,如图8所示。在SFM(Structure from motion)中,可以通过关键点匹配来获取摄像头外参并结合内参进行深度估计并重建出拍摄物体,如图9所示。在图像跟踪与配准中,通过前后帧的匹配可以捕捉视频的运动轨迹,并针对目标物体进行视频跟踪与图像配准,如下方视频所示。

图8 图像检索

图9 三维重建

视频:视频轨迹跟踪

作为腾讯旗下顶尖的人工智能实验室,优图实验室聚焦计算机视觉,专注人脸识别、图像识别、OCR等领域开展技术研发和行业落地,在推动产业数字化升级过程中,始终坚持基础研究、产业落地两条腿走路的发展战略,与腾讯云与智慧产业深度融合,挖掘客户痛点,切实为行业降本增效。

未来,腾讯优图实验室也将继续深耕CV技术,并将持续探索更多的应用场景和应用空间,让更多的用户享受到科技带来的红利。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉+ 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~

如果觉得《CVPR 图像匹配挑战赛 双赛道冠亚军方案》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。