标注
标注是制作自定义数据集中不可或缺的一个步骤,如何方便高效的进行,是我们需要关注的点,本文分享2款开源的标注工具,也是目前使用最多、效率较高的图形化标注工具。它们是 LabelImg
和 CVAT
。
LabelImg
LabelImg
是一款开源的图形化的图片标注工具,使用 python
和 Qt
编写,同时支持 windows
、linux
和 macOS
,项目地址: https://github.com/tzutalin/labelImg
LabelImg
操作还是很方便的,它提供了默认的 class
,如果你不需要这些类型的话,可以将其删除
接下来就可以打开 exe
文件,点击 Open
导入图片,按下快捷键 w
,选定目标后,会弹出输入框,写上 class
名称,就可以了,如果有多个目标,那就继续标
labelImg
还支持文件夹的导入,在标完一张后,在左侧选择 Next Image
就可以切换到下一张继续了。输出格式部分,目前 labelImg
支持 YOLO
和 PascalOVC
2种格式,前者标签信息是存储在 txt
文件中,而后者是存储在 xml
中
打完标签后,就可以进行保存了,图片和标签文件我们分开存放,但是文件名是对应的,只是扩展名不同
最后来看看标签文件的内容
一行代表一个目标,格式是
class x_center y_center width height
第一列是 class
的索引,计数从0开始,比如这里的0代表的是 basketball
,1代表的是 face
;后4列是 x_center/image_width
、y_center/image_height
、width/image_width
、height/image_height
,取值范围是0 ~ 1
CVAT
CVAT
是 Computer Vision Annotation Tool
的缩写,intel
公司开发的开源工具,使用也非常简单,能够帮助你快速创建自己的数据集。
CVAT
还提供了一个网站,你可以访问 https://cvat.org/
注册登录后,创建一个 task
为简单示例,这里上传几张口罩的图片进行测试
高级设置部分,一般没特别要求,都可以不设
创建好后,在 Tasks
栏目下就可以看到了
进去之后就可以进行标注了
一张图片标注结束后,点击左上角的保存,然后点击图片上方的右箭头,进行下一张图片的标注,一直到所有图片处理完毕
最后来到 Tasks
,导出数据集,目前 CVAT
支持的格式有 COCO 1.0
、PASCAL VOC 1.1
、MOT 1.1
、ImageNet 1.0
、YOLO 1.1
等
这里导出了份 PASCAL VOC 1.1
格式的数据集
如果需要搭建本地 CVAT
的话,也是可以的,参考官方给出的搭建文档 https://github.com/openvinotoolkit/cvat/blob/develop/cvat/apps/documentation/installation.md