失眠网 > PolarMask：单阶段实例分割框架 FCOS进阶！

PolarMask：单阶段实例分割框架 FCOS进阶！

时间：2022-07-16 16:28:06

点击上方“AI搞事情”关注我们

PolarMask是一项CVPR录用的工作，该方法基于FCOS，将实例分割也融入到了FCN框架中，相比于“先检测再分割”的Mask RCNN，PolarMask是一种single shot的实例分割框架。

相关资源

论文：/pdf/1909.13226.pdf

开源：/xieenze/PolarMask

论文笔记

PolarMask针对实例分割任务提出了一种新的建模方式，

下图展示了两种实例分割建模方式：

a：pixel-based建模，目标框中针对像素进行分类，如图 (b)，Mask RCNN采用此方式。

b：contour-based建模，在坐标系 (c. 直角坐标 \ d.极坐标) 中建模目标轮廓，本文采用 (d) 方式建模，相比于 (c) ，极坐标系建模轮廓可以利用固定角度先验信息，网络只需要回归特定方向的长度即可，进一步简化问题。

PolarMask通过极坐标系建模轮廓，把实例分割问题转化为实例中心点分类(instance center classification)问题和密集距离回归(dense distance regression)问题。

PolarMask特点：

(1) anchor free and bbox free，不需要检测框

(2) fully convolutional network, 相比FCOS把4根射线散发到36根射线，将instance segmentation和object detection用同一种建模方式来表达。

因此，FCOS可以看作是PolarMask的特殊形式，而PolarMask可以看作FCOS的通用形式。FCOS只从0，90，180，270四个角度回归长度，而PolarMask将目标实例分为了36个方向进行长度回归。

极坐标掩码回归

PolarMask整个网络结构同FCOS基本一致，由主干网(Backbone)+特征金字塔（Feature Pyramid）+预测head组成。预测部分，Mask预测分支替换了FCOS的Bbox预测分支（将channel=4扩展成36），同时，作者提出了Polar Centerness替换了FCOS的Centerness，作用基本一致，用来定义高质量样本，根据位置为像素样本赋予不同权重。

(PolarMask网络结构图)

Polar Representation

针对实例掩码，采样实例的中心点（xc, yc）以及实例轮廓点(xi, yi), i = 1, 2, ..., N。以均匀的角度∆θ链接中心点和轮廓点。这样，一个实例就可以通过极坐标的方式建模为一个中心点和n条射线。

Mass Center

选择实例中心有很多方式，如边框中心、质心。如何选择需要根据分割预测的效果，实验证明选择质心作为实例中心效果更好。

Center Samples

实例质心周围的像素被视为中心样本，其余为负样本。具体，选择质心对应特征图上步长为1.5周围的点为正样本，因此，一个实例质心周围有9~16个像素被作为正样本。主要可以：

(1). 增加正样本数量，避免正负样本不均衡。

(2). 质心并不一定是实例样本的最佳采样点。

Distance Regression

得到中心样本点（xc, yc），根据该点生成n（n=36）条射线，一些特殊情况：

(1). 射线与实例轮廓有多个交点，取最长射线。