论文Rethinking the Inception Architecture for Computer VisionGoogLeNetGoogleNet_BN的实现做了进一步的解释,同时提出了新的Inception模块和损失函数LSR(label-smoothing regularizer),本文实现其中的Inception_v2架构

论文翻译地址:[译]Rethinking the Inception Architecture for Computer Vision

阅读全文 »

综合PASCAL VOC 20072012数据集,进行分类/检测任务。分两步完成:

  1. 下载07 trainval、07 test、12 trainval数据集,解析出分类/检测需要的数据
  2. 根据具体任务(分类或者检测)从中提取数据

相关实现:zjykzj/vocdev

阅读全文 »

R-CNN算法中,使用SVM分类器对候选建议进行分类后,使用对应类别的边界框回归器(bounding-box regression)预测其坐标偏移值,这一操作能够进一步提高检测精度

阅读全文 »