软硬件环境
- ubuntu 18.04 64bit
- pytorch 1.7
- cuda 11.0
- yolov5 4.0
- nvidia gtx 1070Ti
视频看这里
Youtube
Bilibili
前言
前文 yolov5 V4.0更新了啥? 我们介绍过 yolov5
已经在本地集成了 Weights & Biases
,也就是 wandb
,这样就可以方便的追踪模型训练的整个过程,包括模型的性能、超参数、GPU
的使用情况、模型预测,还有数据集。说到底,wandb
就是个可视化的工具。
实操
开始之前,需要安装依赖
pip install wandb
关于模型训练,前文 https://xugaoxiang.com/2020/07/02/yolov5-training/ 已经比较详细的介绍过了,这里我们直接使用前面使用过的口罩数据集进行测试。命令如下
python train.py --img 640 --batch 16 --epochs 300 --data ../mask/data.yaml --cfg models/yolov5s.yaml --weights ''
如果没有账号的话,就选择1在线创建;已有账号的话就选择2;不想使用 wandb
的话,就选择3。由于我已经在网页端注册过了,所以输入数字2
终端提示需要 wandb.ai
的 API Key
,在浏览器中访问站点 https://wandb.ai/authorize,复制后贴到终端中
然后就开始训练了,这个过程跟前面是一模一样的
在模型训练的过程中,登录网站 https://wandb.ai/home,就可以看到训练的状态了
各项指标
GPU
的使用信息汇总
Mosaics
训练完成后,终端中会输出 wandb
相关的信息,训练好的模型保存在本地目录 runs/train
下
项目信息汇总
模型的各项性能指标,图表形式
评估模型是件非常痛苦的事。你是不是也曾经尝试过使用不同阶段训练出来的模型进行推理呢?最后再选出最优的模型呢?
现在使用 wandb
就可以很方便的达到这个目的,而且还是交互式的,下图是个例子
还有个非常有用的功能,那就是分享,你可以创建 report
,然后生成网络链接分享给你的小伙伴,前提是你的项目必须是 public
的