YOLOv5模型训练 - 迷途小书童的Note迷途小书童的Note

文章目录

软硬件环境

ubuntu 18.04 64bit
anaconda with 3.7
nvidia gtx 1070Ti
cuda 10.1
pytorch 1.5
YOLOv5

视频看这里

此处是youtube的播放链接，需要科学上网。喜欢我的视频，请记得订阅我的频道，打开旁边的小铃铛，点赞并分享，感谢您的支持。

YOLOv5环境配置

请参考之前的文章，YOLOv5目标检测

使用COCO数据集

YOLOv5的预训练模型是基于 COCO 数据集，如果自己想去复现下训练过程，可以依照下面的命令

$ python train.py --data coco.yaml --cfg yolov5s.yaml --weights '' --batch-size 64
                                         yolov5m                                48
                                         yolov5l                                32
                                         yolov5x                                16

COCO的数据集可以通过data文件夹下get_coco2017.sh脚本进行下载，包含图片和lable文件。COCO的数据集实在是太大了，整个压缩包有18G，考虑到自己到的网速还有机器的算力，还是洗洗睡吧。。。

制作自己的数据集

如果没有对应目标的公开数据集，那就只有自己出手收集了，图片到手后，接下来就是艰辛的打标签工作了，这里使用工具LabelImg，下载地址是

https://github.com/tzutalin/labelImg/releases/tag/v1.8.1

LabelImg使用Qt做了图形化的界面，操作还是很方便的，这也是选择它的理由，它提供了默认的class，如果你不需要这些类型的话，可以将其删除

yolov5 trainning

接下来就可以打开exe文件，点击Open导入图片，按下快捷键w，选定目标后，会弹出输入框，写上class名称，就可以了，如果有多个目标，那就继续标

yolov5 trainning

labelImg还支持文件夹的导入，在标完一张后，在左侧选择Next Image就可以切换到下一张继续了。输出格式部分，目前labelImg支持YOLO和PascalOVC2种格式，前者标签信息是存储在txt文件中，而后者是存储在xml中

打完标签后，就可以进行保存了，图片和标签文件我们分开存放，但是文件名是对应的，只是扩展名不同

yolov5 trainning

最后来看看标签文件的内容

yolov5 trainning

一行代表一个目标，格式是

class x_center y_center width height

第一列是class的索引，计数从0开始，比如这里的0代表的是basketball，1代表的是face；后4列是x_center/image_width、y_center/image_height、width/image_width、height/image_height，取值范围是0 ~ 1

使用公开的数据集进行训练

ROBOFLOW 提供了一些公开的数据集，我们下载其中的口罩数据集进行训练，链接是 https://public.roboflow.ai/object-detection/mask-wearing, 如果原网站无法访问的话，可以到下面的链接下载

CSDN下载
百度网盘, 提取码:wja4

下载下来是一个压缩包，解压后，文件夹内的文件结构是这样的

yolov5 trainning

其中文件夹train包含了参加训练的图片以及对应的label文件，两者只有扩展名不同而已，目前图片只有105张。我们将包含数据集的文件夹重命名为mask，存储在yolov5工程的同级目录下

yolov5 trainning

接着修改mask/data.yaml文件内容为

(base) xugaoxiang@1070Ti:~/Works/github/mask$ cat data.yaml
train: ../mask/train/images
val: ../mask/valid/images

nc: 2
names: ['mask', 'no-mask']

最后修改yolov5/models/yolov5s.yaml，将nc = 80修改为nc = 2，因为数据集中只有mask和no-mask2个类别

接下来执行训练命令

cd yolov5
python train.py --img 640 --batch 16 --epochs 300 --data ../mask/data.yaml --cfg models/yolov5s.yaml --weights ''

训练结束后，在weights文件夹下就生成了best.pt和last.pt，到mask/test/images找些图片测试一下

python detect.py --weight weights/best.pt --source ../mask/test/images/1224331650_g_400-w_g_jpg.rf.b816f49e2d84044fc997a8cbd55c347d.jpg

yolov5 trainning

效果还算ok。感兴趣的话，自己动手试试吧

v3.0版本

很多朋友反应，在训练时出现下面的错误

yolov5 trainning

这个错误是由于python环境中的pyqt引起的，卸载pyqt就好

pip uninstall pyqt5

这里多说一句，如果使用的是anaconda的环境，在安装好后，在base的环境中不要去安装任何第三方库。针对不同的项目或者工程，创建独立的虚拟环境，然后安装依赖的库，就不会出现类似的错误了。

另外，在windows上训练模型，如果出现

OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.
OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program. That is dangerous, since it can degrade performance or cause incorrect results. The best thing to do is to ensure that only a single OpenMP runtime is linked into the process, e.g. by avoiding static linking of the OpenMP runtime in any library. As an unsafe, unsupported, undocumented workaround you can set the environment variable KMP_DUPLICATE_LIB_OK=TRUE to allow the program to continue to execute, but that may cause crashes or silently produce incorrect results. For more information, please see http://www.intel.com/software/products/support/.

解决的方法是在train.py文件开头部分，添加语句

import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'

参考资料

在制作自己的数据集之前, 图片尺寸要统一吗? 毕竟爬回来的图片尺寸各异

yangqinjiang2022-11-24 11:24

不用
迷途小书童2022-11-24 22:15 登录以回复

謝謝你~

匿名2021-12-16 17:46

對，我想知道這些代碼哪些需要修改，以及怎麼修改~

匿名2021-12-16 14:11

修改 util/plot.py 中的 plot_one_box方法(5.0版本)，其它版本可能不太一样。具体参考这篇 https://xugaoxiang.com/2019/12/10/opencv-zh/
迷途小书童2021-12-16 15:50 登录以回复

所以我只要使用labelimg就可以將detect能顯示中文囉，需要改Yolov5裡面東西的一些參數之類的嗎?

匿名2021-12-14 23:49

不是，labelimg只是标注工具。目标要用中文显示，你可以在detect后去做，需要修改代码
迷途小书童2021-12-15 13:23 登录以回复

我想要了解的是將dog顯示為狗這樣的中文標籤，求教學~

匿名2021-12-14 23:25

有什么理由在训练时这样做？在 detect 的时候显示中文就好
迷途小书童2021-12-14 23:43 登录以回复

跪求中文標籤教學，還是說其實已經有相關教程了?

匿名2021-12-14 22:31

就是labelimg工具的使用，文章中已经提过了
迷途小书童2021-12-14 23:15 登录以回复

口罩数据集下的valid文件夹是干什么的？

匿名2021-12-07 17:01

验证集
迷途小书童2021-12-10 10:27 登录以回复

請問一下，為什麼我自己訓練完模組後，我val內訓練的照片不會顯示比重?

匿名2021-11-27 21:12

真没看懂，不好意思
迷途小书童2021-11-30 15:59 登录以回复

請問一下，如果使用GPU去訓練數據集，顯示BrokenPipeError: [Errno 32] Broken pipe該如何解決

匿名2021-11-26 00:03

请描述下使用的版本、训练命令、gpu信息
迷途小书童2021-11-26 15:00 登录以回复

請問你的電腦記憶體是幾G呢？

匿名2021-11-24 17:38

内存16G、显存6G、硬盘1T
迷途小书童2021-11-24 18:19 登录以回复

請問一下，若想偵測的是影片中的物體是要先訓練完圖片再導入影片去做測試嗎?

匿名2021-08-24 16:10

是的
迷途小书童2021-08-24 23:20 登录以回复

可以麻煩大老出一期訓練自定義資料集的嗎

匿名2021-08-19 09:35

这个不就是了？按照mask的方式组织好自己的数据集就好，训练方法一样。
迷途小书童2021-08-19 21:25 登录以回复

請問一下python detect.py --weight weights/best.pt --source ../mask/test/images/1224331650_g_400-w_g_jpg.rf.b816f49e2d84044fc997a8cbd55c347d.jpg最後這串指示在新版本後應該怎麼改寫

匿名2021-07-22 15:15

你这么写，可以的。有什么问题？
迷途小书童2021-07-22 20:11 登录以回复

为啥训练好之后，没带口罩的也会显示mask？

匿名2021-06-13 22:55

强啊！

匿名2021-06-02 15:13

谢谢支持
迷途小书童2021-06-06 10:27 登录以回复

你好，用mask 数据集没问题，自己制作的数据集进行数据训练时 imgaes数目没问题但是 targets一直识别为0 P R map经过六七轮一直为0 请问这个问题数据集有可能有什么样的错误，您知道吗？我把图片改成了450*500的图片，还是没有结果

匿名2021-05-10 11:53

图片尺寸太大了
迷途小书童2021-06-07 18:20 登录以回复

您好，我四月底的时候才下载了源码，训练结束后可以进行测试，但是训练输出的recall，map的结果都是0，请问您知道是为什么吗

匿名2021-05-10 10:18

试试roboflow的mask数据集
迷途小书童2021-06-07 18:21 登录以回复

请问错误显示RunTimeError cunda error: out of memory。检查了GPU内存没有问题，在运行的时候更换了指定的GPU。但是还是一样的错误，您知道怎么解决吗

匿名2021-04-26 16:46

你将batch-size调小
迷途小书童2021-05-05 22:50 登录以回复

请问一下，就是在运行过后没有在weights中没有生成best.pt 和last.pt是怎么回事啊

匿名2021-04-09 12:21

新版本，存放的路径已经改了，你注意看下，训练结束最后的输出信息，在runs/train文件夹下
迷途小书童2021-04-09 15:27 登录以回复

请问你们训练有遇到这个问题吗？---求大佬支招 Traceback (most recent call last): File "/data/nas/workspace/jupyter/yolov5-master/models/yolo.py", line 151, in _initialize_biases b[:, 4] += math.log(8 / (640 / s) ** 2) # obj (8 objects per 640 image) RuntimeError: a view of a leaf Variable that requires grad is being used in an in-place operation.

匿名2021-03-26 00:01

这个错误，一般出现在单目标的训练上面，作者已经改过了，你重新拉下源码。
迷途小书童2021-03-26 15:34 登录以回复

你好，用mask 数据集没问题，自己制作的数据集进行数据训练时 imgaes数目没问题但是 targets一直识别为0 P R map经过六七轮一直为0 请问你解决了吗

匿名2021-02-08 13:13

你好，用mask 数据集没问题，自己制作的数据集进行数据训练时 imgaes数目没问题但是 targets一直识别为0 P R map经过六七轮一直为0

匿名2021-02-06 22:38

数据集有问题
迷途小书童2021-02-08 14:22 登录以回复

在运行报如下错误，怎末解决啊，求教 raise DistributionNotFound(req, requirers) pkg_resources.DistributionNotFound: The 'thop' distribution was not found and is required by the application

匿名2021-01-23 19:17

依赖没有安装好。
迷途小书童2021-01-26 22:26 登录以回复

大佬

匿名2020-12-19 22:20

ROBOFLOW，怎么样才能打开，并下载呢？

匿名2020-12-19 21:03

ROBOFLOW,老上去？

匿名2020-12-02 10:27

这个站点很好。
迷途小书童2020-12-02 11:37 登录以回复

多谢多谢

匿名2020-07-19 23:12

ROBOFLOW的口罩数据集已经搬运到了百度盘，地址链接: https://pan.baidu.com/s/15GSPiJ59dg4kNyUch6W5Xw 提取码: wja4

迷途小书童2020-07-16 14:46

ROBOFLOW提供d的口罩数据集在国内下载不了，也许只有我下载不了。能不能提供一个百度网盘的链接分享一下。多谢！多谢！

匿名2020-07-15 06:51

软硬件环境

视频看这里

YOLOv5环境配置

使用COCO数据集

制作自己的数据集

使用公开的数据集进行训练

v3.0版本

参考资料

您必须 登录 才能发表评论！

您必须登录才能发表评论！