[数据集][COCO]目标检测任务评估
本文字数: 5.7k 阅读时长 ≈ 10 分钟
Image Localization Dataset是一个目标检测数据集,其标注文件使用了PASCAL VOC
定义的格式,将其转换成COCO
格式
[数据集]voc2coco及cocoapi使用
本文字数: 1.5k 阅读时长 ≈ 3 分钟
[数据集][COCO]目标检测任务
本文字数: 741 阅读时长 ≈ 1 分钟
介绍COCO
目标检测任务以及评价标准
目标检测任务
COCO
将目标检测任务分为两个部分:
- 边界框检测
- 目标分割检测,也称为实例分割
用于目标检测任务的训练/测试/验证数据集拥有超过20
万张图像,共80
个类别。其中,在训练和验证数据集上的标注超过了50
万个
[数据集]COCO简介
本文字数: 6.2k 阅读时长 ≈ 11 分钟
介绍COCO
数据集以及标注文件格式。官网地址:COCO
简介
COCO
是一个大规模的目标检测、分割和字幕数据集。包含了以下特征:
- 目标分割(
Object segmentation
) - 场景分析(
Recognition in context
) - 超像素分割(
Superpixel stuff segmentation
) 33
万张图像,其中超过20
万张已标注(330K images (>200K labeled)
)150
万个目标实例(1.5 million object instances
)80
个目标类别(80 object categories
)91 stuff categories
- 每张图片
5
个字幕(5 captions per image
) 25
万个行人关键点(250,000 people with keypoints
)
目标检测训练框架
本文字数: 254 阅读时长 ≈ 1 分钟
研究lufficc/SSD源码时,发现其实现了一个目标检测训练框架,进行深入研究后整理成一个新的训练框架
SSD: Single Shot MultiBox Detector
本文字数: 3.2k 阅读时长 ≈ 6 分钟
[目标检测][PyTorch]边界框操作
本文字数: 3.6k 阅读时长 ≈ 7 分钟
阅读源码时发现torchvision
提供了许多边界框操作,包括
NMS
- 移除小边界框
- 修剪边界框坐标,保证边界框坐标位于图像内
- 计算边界框面积
IoU
计算
在线文档:torchvision.ops
源码地址:torchvision/ops/boxes.py
当前torchvision
版本:0.6.0a0+82fd1c8
[目标检测]IoU计算
本文字数: 2.1k 阅读时长 ≈ 4 分钟
之前学习IoU
的概念并且实现了预测框和对应真值边界框之间的计算 - [目标检测]IoU
不过预设的条件是每个真值边界框仅和单个预测边界框进行比对,参考box_utils.py计算每个真值边界框和每个预测边界框的IoU
权重初始化 - PyTorch实现
本文字数: 3.3k 阅读时长 ≈ 6 分钟