简介
PASCAL VOC
(The PASCAL Visual Object Classes
)是一个世界级的计算机视觉挑战赛,第一届比赛在2005年举办,随后一年举办一次,直到2012年最后一次。PASCAL
的全称是 Pattern Analysis, Statistical modelling and ComputAtional Learning
,官方地址是 http://host.robots.ox.ac.uk/pascal/VOC/
PASCAL VOC
为图像识别和分类提供了一整套标准化的数据集,用来构建和评估用于图像分类(Classification
),目标检测(Object Detection
)和分割(Segmentation
)的算法,我们耳熟能详的计算机视觉模型,如 R-CNN
系列、SSD
和 YOLO
等等都是基于 PASCAL VOC
数据集上推出的
目前最完整的数据集是 PASCAL VOC 2012
数据集,而大多数研究者普遍使用的是 PASCAL VOC 2007
和 PASCAL VOC 2012
这2个数据集,它们二者是互斥的,不相容的。PASCAL VOC 2012
总共包括了20类物体,train
和 val
中有11530张图片,共有27450个目标检测标签和6929个分割标签
下图是数据集的类别及其层级结构
这个结构自2007年后就没有改变过
数据集的组织结构
数据集下载后解压,文件结构是这样的
├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片
其中 Annotations
文件夹
├── 000001.xml
├── 000002.xml
├── 000003.xml
...
一个典型的 xml
标签文件如下
各个字段的含义分别是
folder
:所属文件夹filename
:文件名database
:数据库名annotation
:标记文件格式size
:图像尺寸,width
宽、height
高,depth
通道数目segmented
:分割object
: 表示一个目标,name
标签名、pose
拍摄角度,有front
、rear
、left
、right
和unspecified
、truncated
是否被截断也就是图片中是否包含完整目标、difficult
检测难易程度,1表示是、0表示否bndbox
:目标所在的位置,用xmin
、ymin
、xmax
、ymax
来表示
ImageSets
文件夹,存放数据集的分割文件,包含三个子文件夹 Action
、Layout
、Main
和 Segmentation
,其中 Action
文件夹存放用于动作识别文件,Main
文件夹存放的是用于分类和检测的数据集分割文件,Layout
文件夹用于 person layout
任务,Segmentation
用于分割任务
评估标准
PASCAL VOC
的评估标准是 mAP
(mean Average Precision
),至于 mAP
,前文 Precision、Recall、IoU和mAP 已经解释过了,不清楚的可以再去看看
PASCAL
官方给出了评估 mAP
的脚本和示例代码,下载地址: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCdevkit_18-May-2011.tar,不过代码是用 matlab
写的
获取数据集
PASCAL VOC2007
链接:https://pan.baidu.com/s/1-0U9w_XBGzYpzP4ND25blQ
提取码:zmz6
PASCAL VOC2012
链接:https://pan.baidu.com/s/1cJPer12vhuubqDeLcRQoPQ
提取码:1340