大家好,我是小书童。
本篇给大家介绍一款开源的高质量 TTS (Text To Speech) 模型的推理和训练库,parler-tts。
parler-tts 是一种轻量级文本转语音 (TTS) 模型,它可以按照给定说话者的风格(性别、音调、说话风格等)生成高质量、听起来自然的语音。它是 Stability AI 和爱丁堡大学的 Dan Lyth 和 Simon King 论文 Natural language g……继续阅读 »
迷途小书童
3个月前 (08-13) 460浏览 0评论
0个赞
环境
windows 11
python 3.9
前言
Muggle OCR 是一个高效本地 OCR 模块,旨在通过简单的几步设置提供强大的文本识别功能,无论是在处理印刷文本还是解析验证码,都能让用户在工作中畅通无阻。Muggle OCR 易于安装和使用,支持双模型,识别快速准确。
实操
首先下载源码
# 克隆代买
git clone https://github.com/litongjava/muggle_oc……继续阅读 »
迷途小书童
4个月前 (08-07) 390浏览 0评论
0个赞
Amazon亚马逊云科技提供的免费VPS主机已经有好多年了,今天来为大家详细讲解一下新的亚马逊云科技云服务器申请与使用教程。Amazon亚马逊云科技目前提供的服务非常地多。
主要有云服务器(ec2)、云存储(S3)、CDN相关产品、lightsail VPS、SES (群发邮件)等,其中Amazon lightsail是类似于VPS主机的产品,云服务器(ec2)则是云服务器,可以对内存、流量、CPU、带宽等自由定制……继续阅读 »
迷途小书童
4个月前 (08-07) 251浏览 0评论
0个赞
今天,Midjourney发布了V6.1版本,标志着图像创造领域的一次重大飞跃!本次更新显著增强了图像质量,重新定义了创意视觉的标准。目前V6.1已经成为了默认模型,部分V6.1未能实现的功能,如修补/扩展,需要用户手动切换回V6.0版本,使用参数 -v 6即可。
V6.1版本的亮点如下:
无缝连接的图像构造:无论是人体的细微部分、自然界的动植物,新版都能确保图像间的平滑过渡,告别突兀的断层感,每一寸都宛如精心雕……继续阅读 »
迷途小书童
4个月前 (07-31) 365浏览 0评论
0个赞
视频看这里
工具对应链接
https://www.remove.bg/
https://cleanupphotos.com/
https://www.photoroom.com/
BG Remover:https://pan.quark.cn/s/037b542e0f2d
鲜艺AI抠图:https://pan.quark.cn/s/98fe35a7f056
……继续阅读 »
迷途小书童
4个月前 (07-30) 1982浏览 0评论
0个赞
亲爱的朋友们,
在这个信息爆炸的时代,人工智能(AI)正以前所未有的速度改变着我们的工作和生活方式。你是否渴望紧跟时代的步伐,成为 AI 领域的先行者?是否希望在 AI 的浪潮中找到属于自己的位置?如果是,那么请不要错过这个机会 — 加入我们的 AI 实战项目微信群,与行业精英一起探索 AI 的无限可能!
🚀 为什么选择我们?
实战项目拆解
我们不只分享理论,更注重实战。加入我们,你将有机会深入学习并……继续阅读 »
迷途小书童
4个月前 (07-16) 390浏览 0评论
0个赞
成果展示
步骤拆解
本篇实战使用的 AI 工具是 Adobe express,网站地址是:https://new.express.adobe.com,登录之后,
点击 Video, 然后点击 Animate from audio,进入编辑界面
Character 选择自己想要的形象,可以是人物、动物、动画等,这里就选个 Sticky
Background 选项卡提供了很多的背景,我们选个窗户的背景
Size ……继续阅读 »
迷途小书童
4个月前 (07-15) 566浏览 0评论
0个赞
视频看这里
软件下载
项目地址:https://github.com/Genymobile/scrcpy
压缩包下载链接:https://pan.quark.cn/s/4bfe1d47b6ad
……继续阅读 »
迷途小书童
4个月前 (07-15) 1941浏览 0评论
0个赞
成果展示
步骤拆解
老照片动起来其实就是利用 AI 大模型的图生视频功能,这个项目用到的工具是快手的可灵大模型,它有 web 版本和手机 App,这里使用手机 App 来操作。到应用商店下载快影 App。
打开快影后,点开 AI 创作
然后点开 AI 生视频
接着选择第2项的图生视频
我们选择一张手机图片进行上传,这里从网络上找了一张老照片
下方的提示栏,是我们需要输入的提示词,这个你可以不输。如果说有特殊……继续阅读 »
迷途小书童
4个月前 (07-11) 513浏览 0评论
0个赞
资料越来越多,找起来非常麻烦,索引就变的很有必要,这里整理了一份文档,方便大家查看,这份文档会持续维护。
地址:https://fmo6kuyy4v.feishu.cn/docx/QcZmdYdTuoo4QZxOISac2tc8nyh?from=from_copylink
……继续阅读 »
迷途小书童
4个月前 (07-10) 482浏览 0评论
0个赞
视频在这里
字体及设置工具下载链接
https://pan.quark.cn/s/29699b5d35b7
……继续阅读 »
迷途小书童
4个月前 (07-10) 1833浏览 0评论
0个赞
大家好,我是小书童,今天给大家介绍几款好用的 AI 变声软件工具,有专业商业版,也有开源免费版。变声软件是一种能够改变用户声音的软件工具,它们通常提供多种变声效果和声音调整选项,使用户能够在不同场合下使用不同的声音,相信对于做自媒体的朋友会非常有用。
MorphVOX Pro
这是一款功能比较齐全的变声软件,支持男声变女声、女声变男声等多种变声效果。使用上没有什么问题,相对比其他变声器,它的延迟效果比较大,约为一秒钟……继续阅读 »
迷途小书童
5个月前 (07-08) 458浏览 0评论
0个赞
大家好,我是小书童,今天给大家介绍几款好用的 AI 工具。
remove.bg
remove.bg 是一款强大的自动去除图片背景的在线工具,快速利用 AI 技术进行抠图。图片背景5秒就被消除,而且还是完全免费的。除此之外,它还提供了加背景、背景模糊化、调整透明度等功能。
工具地址: https://www.remove.bg/
VideoFusion
VideoFusion 是一款一站式短视频合成工具,它的主要功能……继续阅读 »
迷途小书童
5个月前 (07-05) 400浏览 0评论
0个赞
1. 法国版开源GPT-4o
由法国8人团队打造的原生多模态 Moshi,已经实现了接近 GPT-4o 的水平,现场演示几乎0延迟。团队仅用了半年的时间,从头完成了模型的训练。
目前 Moshi 还处在实验原型阶段,设计初衷是为了理解和表达情感,能够支持听、说、看,可以用70种不同情绪和风格说话,甚至随时被打断,可以实现最低160ms端到端延迟。
不仅如此,最小版本的 Moshi 还可以在笔记本电脑,或者消费级 GP……继续阅读 »
迷途小书童
5个月前 (07-05) 365浏览 0评论
0个赞
成果展示
步骤拆解
本篇实战要完成2个目标
用 AI 生成的人物替换原始视频中的人物,生成一个新的视频
将原始视频进行风格转换,比如现在很火的黏土风格
好,现在我们需要准备一个原始视频,这里从网络上下载了一个美女舞蹈视频,大家可以从抖音、B站或油管上去下载,推荐 you-get 这个工具,链接:https://github.com/soimort/you-get
然后,介绍下本篇的 AI 主角,它就是 D……继续阅读 »
迷途小书童
5个月前 (06-27) 367浏览 0评论
0个赞
1. 小米大模型提效新框架
小米大模型团队提出 SUBLLM(Subsampling-Upsampling-Bypass Large Language Model),国际AI语音大牛、开源语音识别工具 Kaldi 之父 Daniel Povey 也参与指导。与 Llama 等模型相比,SUBLLM 在训练和推理速度以及降低内存方面都有了显著提升。
在大模型训练中,SUBLLM 的速度提高了26%,每个 GPU 的内……继续阅读 »
迷途小书童
5个月前 (06-25) 300浏览 0评论
0个赞
成果展示
原始图片
合成的视频
步骤拆解
提供一张带完整人脸的图片,系统能够根据音频(或者根据输入文本生成音频)合成视频,也就是 AI 数字人。
本篇实战使用的 AI 平台是 hedra,网址是:https://www.hedra.com/。 目前这个系统还是 beta 阶段,使用完全免费,而且对于已有的功能,也完全没有任何的使用限制。对于一般的 AI 数字人产品,它的整体效果还是非常不错的,不仅能够比较好的对……继续阅读 »
迷途小书童
5个月前 (06-24) 466浏览 0评论
0个赞
1. 华为发布盘古大模型5.0
华为开发者大会2024在东莞召开。在大会现场,华为发布了 HarmonyOS Next、盘古大模型 5.0、仓颉编程语言等,也介绍了一系列 AI 先进技术的应用案例。
大模型即服务平台 ModelArts Studio 目前可以提供百模千态的第三方大模型托管服务,支持对大模型定制开发,并提供相应的工具和行业集成套件,让客户可以方便的将大模型与业务系统结合。它具备三大特点:
支持零代……继续阅读 »
迷途小书童
5个月前 (06-24) 358浏览 0评论
0个赞