多目标数据集中提取单个目标 - 迷途小书童的Note迷途小书童的Note

环境

windows 10 64bit
voc dataset

简介

有些时候，针对大的一个数据集(比如 VOC2012)，我们只需要去做某个目标(比如 person)的模型训练，这时候，就需要将特定目标的图片和对应的标注整理出来，形成一个新的数据集。本篇，我们就来实现这个目标。

操作步骤

这里以 VOC2012 数据集为例，来到 roboflow 官方的公开数据集，选择 Pascal VOC 2012 Dataset

VOC2012

下载时，选择 YOLO Darknet 格式

VOC2012

下载完成后，解压，目录结构是这样的

VOC2012

完整的 VOC2012 包含了20个目标，这个在文件 _darknet.labels 中有描述

VOC2012

这里假设要抽取出 person 这个 class，我们在数据集根目录新建脚本，输入如下代码

import os
import shutil

# 统计下最后图片的数量
counter = 0

# 创建2个目标文件夹，images放图片，labels放标注
if not os.path.exists('images'):
    os.makedirs('images')

if not os.path.exists('labels'):
    os.makedirs('labels')

for file in os.listdir('train'):
    flag = False
    if file.endswith('.txt'):
        f = open("train/{}".format(file), 'r')
        line = f.readline()

        # 原数据集中有部分txt，大小为0，内容为空，去除掉
        if line == "":
            continue

        while line:
            # 去除txt中的第一列的值，也就是class id
            tmp = line.split(' ')[0]

            # txt中的数据是字符串类型，人这个目标的id是14
            if tmp != "14":
                print('NOT person.')
                flag = True
                break

            line = f.readline()

        f.close()

        if not flag:
            counter += 1
            prefix = file[0: -3]

            # 拷贝符合条件的图片和对应的标注
            shutil.copy2('train/{}jpg'.format(prefix), 'images')
            shutil.copy2('train/{}'.format(file), 'labels')

print('total number image: {}'.format(counter))

执行上述脚本后，就会将符合条件的图片存放在 images 文件夹，而标注则是存放在 labels 文件夹

那接下来就要去修改标注中的 class id 了，在 VOC2012 中，人的 id 是14(从0开始)，考虑到新的数据集只有人这一类，所以 id 就是0，那工作就变成要将 txt 文件中的第一列数据中的 14 改为 0

本质上这个就是查找替换的操作，实现的方法很多。这里给大家介绍个 windows 下的一个开源工具 grepWin，它拥有图形界面，操作非常简单，下载地址是

https://github.com/stefankueng/grepWin/releases/tag/2.0.8

安装后，右键点击文件夹 labels，选择 search with grepWin 打开

VOC2012