软硬件环境
- ubuntu 18.04 64bit
- pytorch 1.7
- cuda 11.0
- yolov5 4.0
- nvidia gtx 1070Ti
视频看这里
Youtube
Bilibili
前言
前文 yolov5 V4.0更新了啥? 我们介绍过 yolov5 已经在本地集成了 Weights & Biases,也就是 wandb,这样就可以方便的追踪模型训练的整个过程,包括模型的性能、超参数、GPU 的使用情况、模型预测,还有数据集。说到底,wandb 就是个可视化的工具。
实操
开始之前,需要安装依赖
pip install wandb
关于模型训练,前文 https://xugaoxiang.com/2020/07/02/yolov5-training/ 已经比较详细的介绍过了,这里我们直接使用前面使用过的口罩数据集进行测试。命令如下
python train.py --img 640 --batch 16 --epochs 300 --data ../mask/data.yaml --cfg models/yolov5s.yaml --weights ''

如果没有账号的话,就选择1在线创建;已有账号的话就选择2;不想使用 wandb 的话,就选择3。由于我已经在网页端注册过了,所以输入数字2

终端提示需要 wandb.ai 的 API Key,在浏览器中访问站点 https://wandb.ai/authorize,复制后贴到终端中

然后就开始训练了,这个过程跟前面是一模一样的

在模型训练的过程中,登录网站 https://wandb.ai/home,就可以看到训练的状态了

各项指标

GPU 的使用信息汇总

Mosaics


训练完成后,终端中会输出 wandb 相关的信息,训练好的模型保存在本地目录 runs/train 下

项目信息汇总

模型的各项性能指标,图表形式

评估模型是件非常痛苦的事。你是不是也曾经尝试过使用不同阶段训练出来的模型进行推理呢?最后再选出最优的模型呢?
现在使用 wandb 就可以很方便的达到这个目的,而且还是交互式的,下图是个例子

还有个非常有用的功能,那就是分享,你可以创建 report,然后生成网络链接分享给你的小伙伴,前提是你的项目必须是 public 的

