今天,Midjourney发布了V6.1版本,标志着图像创造领域的一次重大飞跃!本次更新显著增强了图像质量,重新定义了创意视觉的标准。目前V6.1已经成为了默认模型,部分V6.1未能实现的功能,如修补/扩展,需要用户手动切换回V6.0版本,使用参数 -v 6即可。
V6.1版本的亮点如下:
无缝连接的图像构造:无论是人体的细微部分、自然界的动植物,新版都能确保图像间的平滑过渡,告别突兀的断层感,每一寸都宛如精心雕……继续阅读 »
迷途小书童
4个月前 (07-31) 364浏览 0评论
0个赞
视频看这里
工具对应链接
https://www.remove.bg/
https://cleanupphotos.com/
https://www.photoroom.com/
BG Remover:https://pan.quark.cn/s/037b542e0f2d
鲜艺AI抠图:https://pan.quark.cn/s/98fe35a7f056
……继续阅读 »
迷途小书童
4个月前 (07-30) 1979浏览 0评论
0个赞
亲爱的朋友们,
在这个信息爆炸的时代,人工智能(AI)正以前所未有的速度改变着我们的工作和生活方式。你是否渴望紧跟时代的步伐,成为 AI 领域的先行者?是否希望在 AI 的浪潮中找到属于自己的位置?如果是,那么请不要错过这个机会 — 加入我们的 AI 实战项目微信群,与行业精英一起探索 AI 的无限可能!
🚀 为什么选择我们?
实战项目拆解
我们不只分享理论,更注重实战。加入我们,你将有机会深入学习并……继续阅读 »
迷途小书童
4个月前 (07-16) 390浏览 0评论
0个赞
成果展示
步骤拆解
本篇实战使用的 AI 工具是 Adobe express,网站地址是:https://new.express.adobe.com,登录之后,
点击 Video, 然后点击 Animate from audio,进入编辑界面
Character 选择自己想要的形象,可以是人物、动物、动画等,这里就选个 Sticky
Background 选项卡提供了很多的背景,我们选个窗户的背景
Size ……继续阅读 »
迷途小书童
4个月前 (07-15) 565浏览 0评论
0个赞
视频看这里
软件下载
项目地址:https://github.com/Genymobile/scrcpy
压缩包下载链接:https://pan.quark.cn/s/4bfe1d47b6ad
……继续阅读 »
迷途小书童
4个月前 (07-15) 1940浏览 0评论
0个赞
成果展示
步骤拆解
老照片动起来其实就是利用 AI 大模型的图生视频功能,这个项目用到的工具是快手的可灵大模型,它有 web 版本和手机 App,这里使用手机 App 来操作。到应用商店下载快影 App。
打开快影后,点开 AI 创作
然后点开 AI 生视频
接着选择第2项的图生视频
我们选择一张手机图片进行上传,这里从网络上找了一张老照片
下方的提示栏,是我们需要输入的提示词,这个你可以不输。如果说有特殊……继续阅读 »
迷途小书童
4个月前 (07-11) 513浏览 0评论
0个赞
资料越来越多,找起来非常麻烦,索引就变的很有必要,这里整理了一份文档,方便大家查看,这份文档会持续维护。
地址:https://fmo6kuyy4v.feishu.cn/docx/QcZmdYdTuoo4QZxOISac2tc8nyh?from=from_copylink
……继续阅读 »
迷途小书童
4个月前 (07-10) 482浏览 0评论
0个赞
视频在这里
字体及设置工具下载链接
https://pan.quark.cn/s/29699b5d35b7
……继续阅读 »
迷途小书童
4个月前 (07-10) 1833浏览 0评论
0个赞
大家好,我是小书童,今天给大家介绍几款好用的 AI 变声软件工具,有专业商业版,也有开源免费版。变声软件是一种能够改变用户声音的软件工具,它们通常提供多种变声效果和声音调整选项,使用户能够在不同场合下使用不同的声音,相信对于做自媒体的朋友会非常有用。
MorphVOX Pro
这是一款功能比较齐全的变声软件,支持男声变女声、女声变男声等多种变声效果。使用上没有什么问题,相对比其他变声器,它的延迟效果比较大,约为一秒钟……继续阅读 »
迷途小书童
5个月前 (07-08) 457浏览 0评论
0个赞
大家好,我是小书童,今天给大家介绍几款好用的 AI 工具。
remove.bg
remove.bg 是一款强大的自动去除图片背景的在线工具,快速利用 AI 技术进行抠图。图片背景5秒就被消除,而且还是完全免费的。除此之外,它还提供了加背景、背景模糊化、调整透明度等功能。
工具地址: https://www.remove.bg/
VideoFusion
VideoFusion 是一款一站式短视频合成工具,它的主要功能……继续阅读 »
迷途小书童
5个月前 (07-05) 400浏览 0评论
0个赞
1. 法国版开源GPT-4o
由法国8人团队打造的原生多模态 Moshi,已经实现了接近 GPT-4o 的水平,现场演示几乎0延迟。团队仅用了半年的时间,从头完成了模型的训练。
目前 Moshi 还处在实验原型阶段,设计初衷是为了理解和表达情感,能够支持听、说、看,可以用70种不同情绪和风格说话,甚至随时被打断,可以实现最低160ms端到端延迟。
不仅如此,最小版本的 Moshi 还可以在笔记本电脑,或者消费级 GP……继续阅读 »
迷途小书童
5个月前 (07-05) 364浏览 0评论
0个赞