简介
PASCAL VOC(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛,第一届比赛在2005年举办,随后一年举办一次,直到2012年最后一次。PASCAL 的全称是 Pattern Analysis, Statistical modelling and ComputAtional Learning,官方地址是 http://host.robots.ox.ac.uk/pascal/VOC/



PASCAL VOC 为图像识别和分类提供了一整套标准化的数据集,用来构建和评估用于图像分类(Classification),目标检测(Object Detection)和分割(Segmentation)的算法,我们耳熟能详的计算机视觉模型,如 R-CNN 系列、SSD 和 YOLO 等等都是基于 PASCAL VOC 数据集上推出的
目前最完整的数据集是 PASCAL VOC 2012 数据集,而大多数研究者普遍使用的是 PASCAL VOC 2007 和 PASCAL VOC 2012 这2个数据集,它们二者是互斥的,不相容的。PASCAL VOC 2012 总共包括了20类物体,train 和 val 中有11530张图片,共有27450个目标检测标签和6929个分割标签
下图是数据集的类别及其层级结构

这个结构自2007年后就没有改变过
数据集的组织结构
数据集下载后解压,文件结构是这样的
├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片其中 Annotations 文件夹
├── 000001.xml
├── 000002.xml
├── 000003.xml
...一个典型的 xml 标签文件如下

各个字段的含义分别是
- folder:所属文件夹
- filename:文件名
- database:数据库名
- annotation:标记文件格式
- size:图像尺寸,- width宽、- height高,- depth通道数目
- segmented:分割
- object: 表示一个目标,- name标签名、- pose拍摄角度,有- front、- rear、- left、- right和- unspecified、- truncated是否被截断也就是图片中是否包含完整目标、- difficult检测难易程度,1表示是、0表示否
- bndbox:目标所在的位置,用- xmin、- ymin、- xmax、- ymax来表示
ImageSets 文件夹,存放数据集的分割文件,包含三个子文件夹 Action、Layout、Main 和 Segmentation,其中 Action 文件夹存放用于动作识别文件,Main 文件夹存放的是用于分类和检测的数据集分割文件,Layout 文件夹用于 person layout 任务,Segmentation 用于分割任务
评估标准
PASCAL VOC 的评估标准是 mAP(mean Average Precision),至于 mAP,前文 Precision、Recall、IoU和mAP 已经解释过了,不清楚的可以再去看看
PASCAL 官方给出了评估 mAP 的脚本和示例代码,下载地址: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCdevkit_18-May-2011.tar,不过代码是用 matlab 写的
获取数据集
PASCAL VOC2007
链接:https://pan.baidu.com/s/1-0U9w_XBGzYpzP4ND25blQ
提取码:zmz6 
PASCAL VOC2012
链接:https://pan.baidu.com/s/1cJPer12vhuubqDeLcRQoPQ
提取码:1340



