[COCO]为什么总共有91个类别,检测任务仅采用了80类

调研coco数据集的时候,有一个小疑惑,就是官网介绍说coco包含了80个目标类别(object categories)和91个材料类别(stuff categories)。这两者有什么差别?为什么目标检测任务不使用全部的91个类别?

在官网首页,coco只是简单介绍了数据集包含的信息,包括类别数:

通过查阅文章What is the COCO Dataset? What you need to know in 2023,它有简单介绍objectstuff的区别:object是单独的实例,能够很容易被标注和识别,而stuff包含了部分没有清晰边界的类别,比如天空(sky)、街道(street)、草地(grass)。

在2014年论文Microsoft COCO: Common Objects in Context第3.1章Common Object Categories有介绍objectsutff的区别,解释跟上面的类似。最开始的coco数据集为了更加关注于实例的检测,所以并没有加入剩余的11个类别。