综合PASCAL VOC 20072012数据集,进行分类/检测任务。分两步完成:

  1. 下载07 trainval、07 test、12 trainval数据集,解析出分类/检测需要的数据
  2. 根据具体任务(分类或者检测)从中提取数据

相关实现:zjykzj/vocdev

阅读全文 »

R-CNN算法中,使用SVM分类器对候选建议进行分类后,使用对应类别的边界框回归器(bounding-box regression)预测其坐标偏移值,这一操作能够进一步提高检测精度

阅读全文 »

什么是感受野?

The receptive field is defined as the region in the input space that a particular CNN’s feature is looking at (i.e. be affected by). —— Dang Ha The Hien 在卷积神经网络中,感受野的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。 ——博客园 在机器视觉领域的深度神经网络中有一个概念叫做感受野,用来表示网络内部的不同位置的神经元对原图像的感受范围的大小。 ——蓝荣祎

卷积层滤波器的神经元和前一层输出数据体的局部神经元一一连接,其空间尺寸称为感受野(receptive field)大小

  • 局部感受野大小:针对上一层输出数据体的空间尺寸
  • 理论感受野大小:针对原始输入图像的局部空间尺寸
阅读全文 »