欢迎访问本站,希望站内信息可以帮助到您! 博主个人微信:xituxiaoshutong100

PASCAL VOC数据集

ML/DL 迷途小书童 0评论

简介

PASCAL VOC(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛,第一届比赛在2005年举办,随后一年举办一次,直到2012年最后一次。PASCAL的全称是Pattern Analysis, Statistical modelling and ComputAtional Learning,官方地址是 http://host.robots.ox.ac.uk/pascal/VOC/

PASCAL VOC

PASCAL VOC

PASCAL VOC

PASCAL VOC为图像识别和分类提供了一整套标准化的数据集,用来构建和评估用于图像分类(Classification),目标检测(Object Detection)和分割(Segmentation)的算法,我们耳熟能详的计算机视觉模型,如R-CNN系列、SSDYOLO等等都是基于PASCAL VOC数据集上推出的

目前最完整的数据集是PASCAL VOC 2012数据集,而大多数研究者普遍使用的是PASCAL VOC 2007PASCAL VOC 2012这2个数据集,它们二者是互斥的,不相容的。PASCAL VOC 2012总共包括了20类物体,trainval中有11530张图片,共有27450个目标检测标签和6929个分割标签

下图是数据集的类别及其层级结构

PASCAL VOC

这个结构自2007年后就没有改变过

数据集的组织结构

数据集下载后解压,文件结构是这样的

├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片

其中Annotations文件夹

├── 000001.xml
├── 000002.xml
├── 000003.xml
...

一个典型的xml标签文件如下

PASCAL VOC

各个字段的含义分别是

  • folder:所属文件夹
  • filename:文件名
  • database:数据库名
  • annotation:标记文件格式
  • size:图像尺寸,width宽、height高,depth通道数目
  • segmented:分割
  • object: 表示一个目标,name标签名、pose拍摄角度,有frontrearleftrightunspecifiedtruncated是否被截断也就是图片中是否包含完整目标、difficult检测难易程度,1表示是、0表示否
  • bndbox:目标所在的位置,用xminyminxmaxymax来表示

ImageSets文件夹,存放数据集的分割文件,包含三个子文件夹ActionLayoutMainSegmentation,其中Action文件夹存放用于动作识别文件,Main文件夹存放的是用于分类和检测的数据集分割文件,Layout文件夹用于person layout任务,Segmentation用于分割任务

评估标准

PASCAL VOC的评估标准是mAP(mean Average Precision),至于mAP,前文 Precision、Recall、IoU和mAP 已经解释过了,不清楚的可以再去看看

PASCAL官方给出了评估mAP的脚本和示例代码,下载地址: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCdevkit_18-May-2011.tar,不过代码是用matlab写的

获取数据集

PASCAL VOC2007

链接:https://pan.baidu.com/s/1-0U9w_XBGzYpzP4ND25blQ
提取码:zmz6

PASCAL VOC2012

链接:https://pan.baidu.com/s/1cJPer12vhuubqDeLcRQoPQ
提取码:1340

参考资料

喜欢 (1)
发表我的评论
取消评论

表情