Press "Enter" to skip to content

- FCOS述评:全卷积单阶段目标检测

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

本文综述了阿德莱德大学的FCOS:全卷积单阶段目标检测。在本文中:

FCOS算法完全避免了训练过程中计算重叠等与锚盒相关的复杂计算。
它还避免了与锚定框相关的所有超参数。
FCOS鼓励重新考虑锚箱的需求。

这是一篇被引用超过1000篇的2019年ICCV论文。(曾锡豪@Medium) Sik-Ho Tsang

 

大纲

 

1.FCOS:网络架构

 

 

1.1.符号、输入、输出

设Fi(大小为H×W×C)为主干CNN第一层的特征映射,s为到该层的总步长。
将输入图像的地面真实边界框定义为{Bi},其中Bi=(x(I)0,y(I)0,x(I)1,y(I)1,c(I)),其中{x(I)0,y(I)0},{x(I)1,y(I)1}分别是边界框的左上角和右下角的坐标。C(I)是对象类。
C是班级总数。例如:在MS Coco中C=80。
具体地说,如果位置(x,y)落入任何地真盒中,则它被认为是正样本,并且该位置的类标c*是地真盒的类标。否则为负样本,c*=0(背景类)。
4D实向量t*=(l*,t*,r*,b*)是该位置的回归目标,如故事顶部的第一个图所示。这里l*,t*,r*,b*是从该位置到边界框四边的距离。
形式上,如果位置(x,y)与边界框Bi相关联,则该位置的训练回归目标可以表示为(Eq.(1)):

我们的网络的最后一层预测分类标签的80D向量p和4D向量t=(l,t,r,b)边界框坐标。
C个二值分类器的训练。
在骨干网络的特征图之后分别添加4个卷积层,分别用于分类和回归分支。
由于回归目标始终为正,因此使用EXP(X)将任何实数映射到回归分支顶部的(0,∞)。

1.2.损失函数

损失函数为(等式)。(2)):

其中LCLS是RetinaNet中的焦点丢失。Lreg是欠条的遗失。NPO表示正样本的个数,本文中λ为1是LREG的平衡权重。
在特征地图Fi上的所有位置上计算总和。1{c*i>0}是指示器函数,如果c*i>0,则为1,否则为0。

1.3.推理

给定输入图像,图像通过网络并获得特征地图Fi上每个位置的分类分数Px,y和回归预测Tx,y。
在RetinanNet之后,我们选择Px,y>0.05的位置作为正样本,并反演公式。(1)获取预测包围盒。

如果一个位置落入多个边界框中,则将其视为不明确样本。我们简单地选择面积最小的包围盒作为其回归目标。

与基于锚点的检测器不同,基于锚点的检测器将不同大小的锚框分配给不同的特征级别,而边界框回归的范围对于每个级别都是直接有限的。
范围mi是要素高程i需要回归的最大距离。在本工作中,m2、m3、m4、m5、m6和m7分别设置为0、64、128、256、512和∞。
更具体地说,我们首先计算所有特征级别上每个位置的回归目标l*、t*、r*、b*。接下来,如果位置满足MAX(l*,t*,r*,b*)>mi或max(l*,t*,r*,b*)

如果一个位置,即使使用了多层预测,仍然被分配到多个地面实值盒子,则简单地选择面积最小的地面实值盒子作为其目标。
在不同的特征级别之间共享头部,不仅使检测器的参数效率更高,而且提高了检测性能。
由于不同的特征映射针对不同的对象大小,使用可训练标量si的exp(si×x)来自动调整特征级PI的指数函数的基数,而不是exp(X),从而提高了一点精度性能。

2.2.FCOS的中心性

 

在FCOS中使用多级预测后,与基于锚点的检测器相比,性能仍有差距。这是由于远离对象中心的位置产生了大量低质量的预测边界框。
中心度被用来解决这个问题(等式)。(3)):

中心度描述了从该位置到该位置负责的对象的中心的归一化距离。
中心度的范围从0到1,因此用二元交叉熵(BCE)损失来训练。将损失添加到损失函数Eq.(2)。
在测试时,通过将预测的中心度与相应的分类分数相乘来计算最终分数(用于对检测到的边界框进行排序)。因此,中心度可以降低远离对象中心的边界框分数。

3.烧蚀研究

COCO traval35k Split(115K图像)用于训练,Minival Split(5K图像)用于验证。

 

3.2.中心度

 

中心度+也可以用预测的回归向量来计算,而不需要引入额外的中心度分支。但它不能改善AP。

3.3。其他改进

 

“CTR。在注册表上“:将中心度分支移动到回归分支。
“CTR。抽样“:只抽样地面实况盒的中心部分作为阳性样本。
“GIOU”:在欠条损失中处罚外接矩形区域上的联合区域。
“归一化”:将等式中的回归目标归一化。(1)随着FPN水平的跨度

下面的SOTA比较中没有使用这些改进。这是在论文最初的深渊翻滚之后发现的。

4.SOTA比较

 

4.1.MS COCO测试开发拆分

 

在MS-COCO基准的测试开发拆分上,FCOS与其他最先进的对象检测器配合使用。
使用ResNet-101-FPN时,FCOS的性能比使用相同主干ResNet-101-FPN的Retinanet高2.4%AP。

FCOS的性能也远远超过其他经典的两级锚定检测器,如更快的R-CNN。
以ResNeXt-64x4d-101-FPN为主干,FCOS在AP中达到43.2%。它的性能大大超过了最近最先进的无锚检测器CornerNet,而且更简单。

此外,经过第三节改进的FCOS在单模型和单尺度测试中获得了44.7%的AP,大大超过了以前的探测器。

4.2.区域提案网络的扩展

 

即使没有提议的中心度分支,FCOS也已经显着改善了AR100和AR1k。
通过建议的中心分支,FCOS将AR100和AR1k分别进一步提高到52.8%和60.3%,与采用FPN的RPN相比,AR100和AR1k的相对改善分别为18%和3.4%。

参考文献

 

[2019 ICCV][FCOS]FCOS:全卷积一级目标检测 FCOS: Fully Convolutional One-Stage Object Detection

 

目标检测

 

2014年至2017年:…2018年:[YOLOv3][Cascade R-CNN][MegDet][StairNet][RefineDet][CornerNet][Pelee&PeleeNet]2019年:[DCNv2][重新思考ImageNet预训][GRF-DSOD&GRF-SSD][Centernet][Grid R-CNN][NAS-FPN][ASFF][Bag of Freebies][VoVNet/ YOLOv3 Cascade R-CNN MegDet StairNet RefineDet CornerNet Pelee & PeleeNet DCNv2 Rethinking ImageNet Pre-training GRF-DSOD & GRF-SSD CenterNet Grid R-CNN NAS-FPN ASFF Bag of Freebies VoVNet/OSANet FCOS EfficientDet CSPNet YOLOv4 SpineNet Scaled-YOLOv4

 

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注