0%

目标检测中的小目标的检测一直是一个难题,同样也有很多方法被提出来优化小目标的识别,使用图像金字塔进行多尺度检测是一个比较常用的方法,但是使用图像金字塔往往会带来巨大的资源消耗,本篇文章就针对这个问题,提出了一个解决利用图像金字塔进行多尺度训练时间长、资源消耗大的方法,其在SNIP的方法上发展而来,通过采样多个chips,并将chips缩放到相同的尺度(这点有点像RCNN)进行训练,不仅仅实现了多尺度,还提高了3倍的速度,并且保证了精度。

阅读全文 »

本篇文章是一篇优化目标检测精度的文章,在two stage方法上进行模型优化的,文章的主要关注点在于目标尺度(Scale)。基于作者对目标尺度的实验与分析,设计了SNIP方法,该方法实验证明,可以有效提高目标检测的精度


论文名称:An Analysis of Scale Invariance in Object Detection – SNIP

阅读全文 »

本篇论文是CVPR2019的一篇anchor free的目标检测论文,借鉴了CornerNet的思想,又对其进行了进一步的改进,取得了还不错的效果,不同于CornerNet,本文提出网络ExtremeNet,不再检测目标的左上角点与右下角点,而是检测目标的4个极值点(即最上点,最下点,最左点,最右点),框出目标,极值点示例如下图所示,方法比较新颖,同时也取得了比较不错的效果,在COCO测试集上,取得了43.7%的精度,速度其实没有特别大的优势,大约300ms处理一张图像,下面我们详细介绍一下本篇论文。

阅读全文 »

论文链接:https://arxiv.org/abs/1506.01497

如出现图像显示不完整,或者公式显示不完整,可访问如下博客

CSDN博客地址:https://blog.csdn.net/chunfengyanyulove/article/details/80037396


创新点

  • 目前object detection的成功主要在于region proposal方法以及region-based CNN网络方法。
  • region proposal耗时成为object detection的瓶颈。
  • 作者设计提出RPN网络,替代region proposal方法的同时,实现end-to-end网络。
  • rpn网络利用特征图实现region proposal,使得时间降低到10ms/张。
  • rpn利用“anchor”实现多尺度,多方向的变换。(论文中同时介绍了其他的方法,比如图像金字塔,但是感觉还是anchor比较实用)
  • 为了保证rpn与fast rcnn的一致,作者提出了一种交替训练的方法。
阅读全文 »

论文链接:https://arxiv.org/abs/1612.03144


FPN 创新点

  • 低层特征信息与高层语义信息的特征融合
  • 有利于小目标的检测

写在前面的话

FPN的全称是Feature Pyramid Networks[特征金字塔网络], 图像金子塔是什么?图像金字塔其实在很早便被提出,像比如SIFT,SURF,HOG等传统的特征提取方法均使用了图像金字塔,想了解传统特征提取方法的参考博文http://wanglichun.tech/algorithm/Sift.html,但是在深度学习中,一直没有被使用,其实主要原因在于深度学习中图像的计算量较大,采用金字塔,多一个scale就相当于多了一倍的计算量,这个时候内存很有可能扛不住了,可是为了达到多尺度的检测该怎么办呢?

阅读全文 »

Fast R-CNN是RBG大神于2015年发表的目标检测网络,其在SPP-Net的基础上,通过进一步的改进,使得目标检测精度以及检测速度有了进一步的提升,下面详细介绍Fast R-CNN的创新点。主要创新点在于:1. Fast R-CNN设计了multi-loss方式进行目标分类以及位置回归,不需要进行特征存储到disk,使得效率有了大大的提升,2. 不需要multi-pipeline。3. CNN参数全更新。4. 单个ROI-pooling不再是SPP-Net的多级pooling,ROI pooling可以理解为SPP-Net的特殊形式。5. 使用mini-batch SGD方式进行训练。6. 利用SVD方式进行速度的提升。

阅读全文 »

Mask R-CNN是He Kaiming大神2017年的力作,其在进行目标检测的同时进行实例分割,取得了出色的效果,其在没有任何trick的情况下,取得了COCO 2016比赛的冠军。其网络的设计也比较简单,在Faster R-CNN基础上,在原本的两个分支上(分类+坐标回归)增加了一个分支进行语义分割,如下图所示:

阅读全文 »

论文链接:https://arxiv.org/abs/1708.02002

代码链接:https://github.com/facebookresearch/Detectron


摘要

为什么two stage方法的精度要比one stage算法的精度高?
因为two stage方法使用了rpn网络产生了较好的候选区域,而one stage方法,由于采用了固定的滑框去产生prior,所以较为规律和稠密,因此影响了精度。究其原因,是前景和背景的类别不均衡产生的。

阅读全文 »

知识点总结
  • 首先利用Selective Search方法提取Region Proposal
  • Region Proposal缩放后送入到CNN网络,为什么要缩放,因为fc层要求固定大小的输入。
  • CNN提取特征后,送入到后面的SVM进行分类(这里还涉及到难例挖掘)
  • 回归部分,利用4个线性回归,对proposal的坐标计算。
  • CNN使用预训练模型,然后在VOC上进行finetune
阅读全文 »