欢迎访问我的网站,希望内容对您有用,感兴趣的可以加入我们的社群。

PASCAL VOC数据集

人工智能 迷途小书童 4年前 (2021-02-17) 3538次浏览 0个评论

简介

PASCAL VOC(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛,第一届比赛在2005年举办,随后一年举办一次,直到2012年最后一次。PASCAL 的全称是 Pattern Analysis, Statistical modelling and ComputAtional Learning,官方地址是 http://host.robots.ox.ac.uk/pascal/VOC/

PASCAL VOC

PASCAL VOC

PASCAL VOC

PASCAL VOC 为图像识别和分类提供了一整套标准化的数据集,用来构建和评估用于图像分类(Classification),目标检测(Object Detection)和分割(Segmentation)的算法,我们耳熟能详的计算机视觉模型,如 R-CNN 系列、SSDYOLO 等等都是基于 PASCAL VOC 数据集上推出的

目前最完整的数据集是 PASCAL VOC 2012 数据集,而大多数研究者普遍使用的是 PASCAL VOC 2007PASCAL VOC 2012 这2个数据集,它们二者是互斥的,不相容的。PASCAL VOC 2012 总共包括了20类物体,trainval 中有11530张图片,共有27450个目标检测标签和6929个分割标签

下图是数据集的类别及其层级结构

PASCAL VOC

这个结构自2007年后就没有改变过

数据集的组织结构

数据集下载后解压,文件结构是这样的

├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片

其中 Annotations 文件夹

├── 000001.xml
├── 000002.xml
├── 000003.xml
...

一个典型的 xml 标签文件如下

PASCAL VOC

各个字段的含义分别是

  • folder:所属文件夹
  • filename:文件名
  • database:数据库名
  • annotation:标记文件格式
  • size:图像尺寸,width宽、height高,depth通道数目
  • segmented:分割
  • object: 表示一个目标,name标签名、pose拍摄角度,有frontrearleftrightunspecifiedtruncated是否被截断也就是图片中是否包含完整目标、difficult检测难易程度,1表示是、0表示否
  • bndbox:目标所在的位置,用xminyminxmaxymax来表示

ImageSets 文件夹,存放数据集的分割文件,包含三个子文件夹 ActionLayoutMainSegmentation,其中 Action 文件夹存放用于动作识别文件,Main 文件夹存放的是用于分类和检测的数据集分割文件,Layout 文件夹用于 person layout 任务,Segmentation 用于分割任务

评估标准

PASCAL VOC 的评估标准是 mAP(mean Average Precision),至于 mAP,前文 Precision、Recall、IoU和mAP 已经解释过了,不清楚的可以再去看看

PASCAL 官方给出了评估 mAP 的脚本和示例代码,下载地址: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCdevkit_18-May-2011.tar,不过代码是用 matlab 写的

获取数据集

PASCAL VOC2007

链接:https://pan.baidu.com/s/1-0U9w_XBGzYpzP4ND25blQ
提取码:zmz6

PASCAL VOC2012

链接:https://pan.baidu.com/s/1cJPer12vhuubqDeLcRQoPQ
提取码:1340

参考资料

喜欢 (1)

您必须 登录 才能发表评论!