[R-CNN]边界框回归
在R-CNN
算法中,使用SVM
分类器对候选建议进行分类后,使用对应类别的边界框回归器(bounding-box regression
)预测其坐标偏移值,这一操作能够进一步提高检测精度
在R-CNN
算法中,使用SVM
分类器对候选建议进行分类后,使用对应类别的边界框回归器(bounding-box regression
)预测其坐标偏移值,这一操作能够进一步提高检测精度
The receptive field is defined as the region in the input space that a particular CNN’s feature is looking at (i.e. be affected by). —— Dang Ha The Hien 在卷积神经网络中,感受野的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。 ——博客园 在机器视觉领域的深度神经网络中有一个概念叫做感受野,用来表示网络内部的不同位置的神经元对原图像的感受范围的大小。 ——蓝荣祎
卷积层滤波器的神经元和前一层输出数据体的局部神经元一一连接,其空间尺寸称为感受野(receptive field
)大小
刚开始学习神经网络的时候就接触到了过拟合和欠拟合的概念,包括各种提高模型泛化能力的方法。随着学习内容的增多,反而往往会忽视掉最初的理论
最近在训练目标检测算法时发现模型在训练集上能够得到很好的提高,但是在验证集上没有进步,这就是欠拟合的表现。小结一下关于过拟合与欠拟合的内容
3
月份实现了R-CNN
算法,完成了博客网站的迁移,同时学习了SPP-net
以及Fast R-CNN
,完成了部分SPP-net
算法。相对于月初设定的目标,发现还可以进一步的提高,同时对于关键结果还需要进一步的完善
文章Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition提出空间金字塔池化(spatial pyramid pooling
)的概念,通过分离卷积层和全连接层架构,避免了固定大小的图像输入,能够有效提高子窗口的识别精度
ZFNet
对AlexNet
进行了调整,使用更小的滤波器取得更大的特征提取能力。使用PyTorch
进行测试
R-CNN
是早期最先在目标检测领域中使用卷积神经网络的模型之一,实现了很好的检测效果
原文:Rich feature hierarchies for accurate object detection and semantic segmentation
译文:[译]Rich feature hierarchies for accurate object detection and semantic segmentation
在目标检测中,非最大值抑制(Non-Maximum Suppression, NMS
)能够有效去除冗余的候选边界框
softmax
是常用的分类器之一,其一大特点就是输出每个类别的分类概率。之前已经学习和使用过softmax
,在这里小结计算概率实现