Press "Enter" to skip to content

单炮多盒探测器(SSD)实时目标检测技术是如何工作的?

在这篇文章中,我们将了解一种使用单个深度神经网络(SSD)检测图像中的对象的方法及其体系结构,其中包括一些关于MultiBox算法和其他技术等的其他信息。在这篇文章之后,我希望您能更好地掌握SSD和对象检测

目标检测

 

目标检测是一种计算机视觉技术,它允许我们识别和定位图像或视频中的目标。有了这种识别和定位,目标检测可以用来对场景中的目标进行计数,确定和跟踪它们的精确位置,同时对它们进行准确的标记。现在我们已经熟悉了目标定位和检测的问题,让我们来看看最近一些性能最好的深度学习模型。

 

R-CNN模范家庭

 

一些流行的目标检测模型属于R-CNN家族,R-CNN家族指的是R-CNN,即“具有CNN特征的区域”或“基于区域的卷积神经网络”。区域卷积神经网络是区域卷积神经网络的缩写,这些结构都是基于区域提议结构的。多年来,它们变得更准确,计算效率也更高。MASK R-CNN是Facebook研究人员开发的最新版本,它为服务器端目标检测模型提供了一个很好的起点。

 

YOLO

 

R-CNN模型通常可能更准确,但是YOLO模型家族比R-CNN模型更快,比R-CNN快得多,实现了实时的对象检测

 

固态硬盘

 

单镜头多盒检测器(SSD)是一种目标检测算法,它是对VGG16体系结构的改进。它于2016年11月底发布,在对象检测任务的性能和精度方面创下了新的纪录,在PascalVOC和COCO等标准数据集上以59帧/秒的速度获得了超过74%的MAP(平均精度)。像YOLO这样的SSD使用多盒只需一次镜头就可以检测到图像中存在的多个对象。

架构

 

SSD方法基于前馈卷积网络,该网络产生固定大小的包围盒集合和这些包围盒中存在的对象类实例的分数,然后进行非最大值抑制步骤以产生最终检测。SSD通常从RESNET预先训练的模型上的VGG开始,该模型被转换为完全卷积神经网络。需要注意的重要一点是,在VGG网络上传递图像后,会添加一些转换层,生成大小为19×19、10×10、5×5、3×3、1×1的特征地图。这些与VGG的Conv4_3生成的38×38特征地图是将用于预测包围盒的特征地图。其中,cv43_3负责探测最小的目标,而cv11_2负责探测最大的目标。

单次拍摄:SSD只需一次拍摄即可使用多框检测图像中存在的多个对象。多框:边界框回归技术检测器:对检测到的对象进行分类

 

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/06/15/%e5%8d%95%e7%82%ae%e5%a4%9a%e7%9b%92%e6%8e%a2%e6%b5%8b%e5%99%a8ssd%e5%ae%9e%e6%97%b6%e7%9b%ae%e6%a0%87%e6%a3%80%e6%b5%8b%e6%8a%80%e6%9c%af%e6%98%af%e5%a6%82%e4%bd%95%e5%b7%a5%e4%bd%9c%e7%9a%84/

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注