介绍COCO目标检测任务以及评价标准

目标检测任务

COCO将目标检测任务分为两个部分:

  1. 边界框检测
  2. 目标分割检测,也称为实例分割

用于目标检测任务的训练/测试/验证数据集拥有超过20万张图像,共80个类别。其中,在训练和验证数据集上的标注超过了50万个

阅读全文 »

介绍COCO数据集以及标注文件格式。官网地址:COCO

简介

COCO是一个大规模的目标检测、分割和字幕数据集。包含了以下特征:

  1. 目标分割(Object segmentation
  2. 场景分析(Recognition in context
  3. 超像素分割(Superpixel stuff segmentation
  4. 33万张图像,其中超过20万张已标注(330K images (>200K labeled)
  5. 150万个目标实例(1.5 million object instances
  6. 80个目标类别(80 object categories
  7. 91 stuff categories
  8. 每张图片5个字幕(5 captions per image
  9. 25万个行人关键点(250,000 people with keypoints
阅读全文 »

阅读源码时发现torchvision提供了许多边界框操作,包括

  1. NMS
  2. 移除小边界框
  3. 修剪边界框坐标,保证边界框坐标位于图像内
  4. 计算边界框面积
  5. IoU计算

在线文档:torchvision.ops

源码地址:torchvision/ops/boxes.py

当前torchvision版本:0.6.0a0+82fd1c8

阅读全文 »

4月份实现了YOLO_v1算法,学习新的模型ResNet/GoogLeNet/SqueezeNet/DenseNet/SSD,同时小结了评估标准,包括mAP/Flops/Params Size/FPS/Top-k accuracy

本周学习了如何寻找最优学习率/权重衰减,以及进行warmup+CosineAnnearling加速模型训练,同时加强了数据预处理,包括随机擦除/颜色抖动/Ten Crops测试等

本周继续SSD算法的学习和实现,同时开始新模型和训练方法的学习。本月期待完成新工作的寻找

阅读全文 »