准备条件
必须要能够科学上网,本站中有相关内容,可搜索查阅,有购买服务的,可以考虑搬瓦工的官方服务 Just My Socks
需要一个国外手机号,如果没有的话就参考下文步骤去 sms-activate.org 网站注册一个虚拟号
需要注意的是,即使能够科学上网,查看 ip ...
迷途小书童
7天前 166℃ 0评论
0喜欢
环境
windows 10 64bit
简介
最近微软开源了一个叫 visual-chatgpt 的项目,将大火的 chatgpt 和不同类型的视觉基础模型结合起来,以便在聊天过程中发送和接收图像。
本地实操
首先,创建一个全新的虚拟环境
conda create -n c...
迷途小书童
1周前 (03-19) 45℃ 0评论
0喜欢
环境
windows 10 64bit
python 3.7
flask 2.2.3
简介
cartoonizer 是一个开源的图像/视频卡通化的项目,作者还在项目中集成了 flask web 框架,我们可以很方便的将它部署到网络上去,供自己或他人使用。
线上体验
官方提供了...
迷途小书童
1周前 (03-17) 94℃ 0评论
0喜欢
简介
K-Means 算法是一种非监督学习算法,它可以将数据分为K个不同的簇或者组。在本文中,我们将会介绍 K-Means 算法的基本概念、原理、实现方法以及使用示例。
基本概念
簇
在 K-Means 算法中,簇指的是一个由数据点组成的集合,这些数据点具有相似的属性。例如,在对...
迷途小书童
2周前 (03-16) 133℃ 0评论
0喜欢
最近,OpenAI 发布了 ChatGPT 新的模型。据 OpenAI 的官方消息,本次开放了 ChatGPT 和 Whisper 的模型 API,可以供用户使用并集成到他们的应用程序中。本次发布的 ChatGPT 的模型为 GPT-3.5-turbo,从 OpenAI 的官方网...
迷途小书童
3周前 (03-08) 222℃ 0评论
0喜欢
环境
ubuntu 18.04 64bit
Nvidia GTX 1070Ti 8G
简介
Tortoise 是一个开源的 Text-To-Speech 程序,具有强大的文本转语音功能和高度逼真的语音和语调。
搭建
创建一个全新的 python 虚拟环境
conda crea...
迷途小书童
4周前 (03-02) 181℃ 0评论
0喜欢
环境
windows 10 64bit
mediapipe 0.8.11
简介
本篇介绍另一个图片、视频和摄像头图像背景去除的开源项目,该项目基于 mediapipe 机器学习框架,主要封装了 FaceDetection 和 SelfieSegmentation,除此之外,还...
迷途小书童
5个月前 (10-16) 1837℃ 0评论
1喜欢
环境
python 3.8
pillow 9.2.0
opencv 4.6.0.66
torch 1.9.1
torchvision 0.10.1
简介
一般来说,我们进行图片的读写,用的是 pillow 和 opencv 中的 API,pillow 读取的通道顺序是 RGB...
迷途小书童
6个月前 (09-27) 1025℃ 0评论
0喜欢
环境
windows 10 64bit
wav2lip-hq
pytorch 1.12.1+cu113
视频看这里
此处是 youtube 的播放链接,需要科学上网。喜欢我的视频,请记得订阅我的频道,打开旁边的小铃铛,点赞并分享,感谢您的支持。
前言
前面的博文 嘴型同步模...
迷途小书童
6个月前 (09-15) 1782℃ 0评论
0喜欢
环境
windows 10 64bit
python 3.8
pillow 8.1.1
前言
图像亮度是指图像的明暗程度,数字图像的灰度值在0 ~ 255之间,越接近0亮度越低,越接近255则亮度越高。对比度指的是图像中最高和最低灰度值之间的灰度差。饱和度指的是图像颜色种类的...
迷途小书童
6个月前 (09-14) 548℃ 0评论
0喜欢
环境
window 10 64bit
yolov5 v6.2
torch1.7.1+cuda101
tensorflow-gpu 2.9.1
前言
前文 借助NCNN,在Android上运行YOLOv5目标检测 和 在Android上进行yolov5目标检测,使用torchs...
迷途小书童
7个月前 (09-06) 3211℃ 0评论
0喜欢
环境
windows 10 64bit
python 3.8.11
torch-1.7.1 + cu101
前言
北京时间8月17日晚上,YOLOv5 官方发布了 v6.2 版本,相比 v6.1 ,此次的更新,加入了分类的训练、验证、推理和其它模型格式的导出,分别提供了基于 ...
迷途小书童
7个月前 (08-19) 1650℃ 2评论
0喜欢
环境
windows 10 64bit
python 3.8
pytorch1.7.1 + cu101
视频看这里
Youtube
Bilibili
简介
前面,我们介绍过 基于YOLOv5和DeepSort的目标跟踪,最近大神又在刚出的 YOLOv7 的基础上加上了目...
迷途小书童
7个月前 (08-16) 4459℃ 2评论
1喜欢
环境
ubuntu 18.04 64bit
python 3.8
pytorch1.8.2 + cu111
视频看这里
Youtube
Bilibili
简介
前文 YOLOv7 提到了除目标检测外,未来 YOLOv7 还会在人体姿态估计和实例分割领域得到应用,不过那会...
迷途小书童
7个月前 (08-15) 3701℃ 0评论
2喜欢
环境
windows 10 64bit
mediapipe 0.8.10.1
前言
本文使用 google 家的 mediapipe 机器学习框架,结合 opencv 和 numpy,实现了一个实时识别 站立、坐下、走动、挥手 共4个动作的简单系统。
mediapipe 能做...
迷途小书童
8个月前 (08-10) 1022℃ 0评论
0喜欢
环境
ubuntu 18.04 64bit
torch 1.7.1+cu101
数据集准备
这里以前面我们进行 YOLOv5 模型训练 时用到的口罩数据集为例,这个数据集来自网站 roboflow.com,再次安利一下这个站点,真的非常棒,不止有详尽的博客教程,还有很多的开放...
迷途小书童
8个月前 (08-02) 2459℃ 0评论
0喜欢
环境
windows 10 64bit
torch 1.7.1+cu101
视频看这里
Bilibili
前言
近日,原 YOLOv3/YOLOv4/Scaled-YOLOv4 的团队推出了 YOLOv7,源码地址:https://github.com/WongKinYi...
迷途小书童
8个月前 (07-21) 7815℃ 5评论
1喜欢
前面介绍的仿射变换(平移、缩放、旋转等)都是在二维空间中进行物体变换,如果是在三维空间中发生了旋转,那么这种变换就是投影变换。投影变换需要先计算投影变换矩阵
cv2.getPerspectiveTransform(src, dst)
其中,src 和 dst 都是 4×...
迷途小书童
8个月前 (07-16) 601℃ 0评论
0喜欢
ROI 是 Region Of Interest 的缩写,是指图像中的感兴趣区域。很多时候,我们只会对图像中的部分区域进行操作。
示例
cv2.imshow("original image", image)
h, w = image.shape[:2]
#...
迷途小书童
8个月前 (07-16) 708℃ 0评论
0喜欢
二值图像指的就是只有黑与白两种颜色的图像,其中 0 表示黑色, 1 表示白色(也就是255)。
图像的二值化的一般过程是,首先将输入图像转换为灰度图,然后通过二值化方法转换为二值图像。这个过程本质上就是对数据的二分类分割,寻找合理的分割阈值至关重要。
示例
import cv2
...
迷途小书童
8个月前 (07-16) 508℃ 0评论
0喜欢
在仿射变换中,比如 resize 其实已经用到了插值 interpolation。一个图片从 100×100 放大到 200*200 的时候,就会产生新的像素点(下图中的红色点),新的像素点值是多少,这就是插值要做的事情。
OpenCV 4.x 版本支持的插值算法有很多,如下图...
迷途小书童
8个月前 (07-16) 562℃ 0评论
0喜欢
归一化就是把数据经过处理后限制在某个特定范围内。归一化的目的,是将没有可比性的数据变得具有可比性,同时又保持着之间的相对关系。
opencv 中使用 normalize 方法来实现归一化,它的函数原型如下
cv2.normalize(src, dst, alpha=None, b...
迷途小书童
8个月前 (07-16) 550℃ 0评论
0喜欢