欢迎访问我的网站,希望内容对您有用,感兴趣的可以加入我们的社群。

最新发布 第2页

迷途小书童的Note-- 编程、技术、分享

算法

一款高质量TTS开源库

一款高质量TTS开源库
大家好,我是小书童。 本篇给大家介绍一款开源的高质量 TTS (Text To Speech) 模型的推理和训练库,parler-tts。 parler-tts 是一种轻量级文本转语音 (TTS) 模型,它可以按照给定说话者的风格(性别、音调、说话风格等)生成高质量、听起来自然的语音。它是 Stability AI 和爱丁堡大学的 Dan Lyth 和 Simon King 论文 Natural language g……继续阅读 »

迷途小书童 3个月前 (08-13) 460浏览 0评论 0个赞

OCR

适用于验证码的开源OCR

适用于验证码的开源OCR
环境 windows 11 python 3.9 前言 Muggle OCR 是一个高效本地 OCR 模块,旨在通过简单的几步设置提供强大的文本识别功能,无论是在处理印刷文本还是解析验证码,都能让用户在工作中畅通无阻。Muggle OCR 易于安装和使用,支持双模型,识别快速准确。 实操 首先下载源码 # 克隆代买 git clone https://github.com/litongjava/muggle_oc……继续阅读 »

迷途小书童 4个月前 (08-07) 390浏览 0评论 0个赞

IT技巧

免费Amazon亚马逊云服务器申请与使用教程

免费Amazon亚马逊云服务器申请与使用教程
​Amazon亚马逊云科技提供的免费VPS主机已经有好多年了,今天来为大家详细讲解一下新的亚马逊云科技云服务器申请与使用教程。Amazon亚马逊云科技目前提供的服务非常地多。 主要有云服务器(ec2)、云存储(S3)、CDN相关产品、lightsail VPS、SES (群发邮件)等,其中Amazon lightsail是类似于VPS主机的产品,云服务器(ec2)则是云服务器,可以对内存、流量、CPU、带宽等自由定制……继续阅读 »

迷途小书童 4个月前 (08-07) 251浏览 0评论 0个赞

AI资讯

Midjourney发布V6.1版本

Midjourney发布V6.1版本
今天,Midjourney发布了V6.1版本,标志着图像创造领域的一次重大飞跃!本次更新显著增强了图像质量,重新定义了创意视觉的标准。目前V6.1已经成为了默认模型,部分V6.1未能实现的功能,如修补/扩展,需要用户手动切换回V6.0版本,使用参数 -v 6即可。 V6.1版本的亮点如下: 无缝连接的图像构造:无论是人体的细微部分、自然界的动植物,新版都能确保图像间的平滑过渡,告别突兀的断层感,每一寸都宛如精心雕……继续阅读 »

迷途小书童 4个月前 (07-31) 365浏览 0评论 0个赞

付费专栏

邀你加入AI实战微信群

邀你加入AI实战微信群
亲爱的朋友们, 在这个信息爆炸的时代,人工智能(AI)正以前所未有的速度改变着我们的工作和生活方式。你是否渴望紧跟时代的步伐,成为 AI 领域的先行者?是否希望在 AI 的浪潮中找到属于自己的位置?如果是,那么请不要错过这个机会 — 加入我们的 AI 实战项目微信群,与行业精英一起探索 AI 的无限可能! 🚀 为什么选择我们? 实战项目拆解 我们不只分享理论,更注重实战。加入我们,你将有机会深入学习并……继续阅读 »

迷途小书童 4个月前 (07-16) 390浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(七)制作搞笑动画视频

手把手AI实战(七)制作搞笑动画视频
成果展示 步骤拆解 本篇实战使用的 AI 工具是 Adobe express,网站地址是:https://new.express.adobe.com,登录之后, 点击 Video, 然后点击 Animate from audio,进入编辑界面 Character 选择自己想要的形象,可以是人物、动物、动画等,这里就选个 Sticky Background 选项卡提供了很多的背景,我们选个窗户的背景 Size ……继续阅读 »

迷途小书童 4个月前 (07-15) 566浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(六)老照片动起来

手把手AI实战(六)老照片动起来
成果展示 步骤拆解 老照片动起来其实就是利用 AI 大模型的图生视频功能,这个项目用到的工具是快手的可灵大模型,它有 web 版本和手机 App,这里使用手机 App 来操作。到应用商店下载快影 App。 打开快影后,点开 AI 创作 然后点开 AI 生视频 接着选择第2项的图生视频 我们选择一张手机图片进行上传,这里从网络上找了一张老照片 下方的提示栏,是我们需要输入的提示词,这个你可以不输。如果说有特殊……继续阅读 »

迷途小书童 4个月前 (07-11) 513浏览 0评论 0个赞

下载频道

资料汇总

资料汇总
资料越来越多,找起来非常麻烦,索引就变的很有必要,这里整理了一份文档,方便大家查看,这份文档会持续维护。 地址:https://fmo6kuyy4v.feishu.cn/docx/QcZmdYdTuoo4QZxOISac2tc8nyh?from=from_copylink ……继续阅读 »

迷途小书童 4个月前 (07-10) 482浏览 0评论 0个赞

人工智能

5款AI变声软件

5款AI变声软件
大家好,我是小书童,今天给大家介绍几款好用的 AI 变声软件工具,有专业商业版,也有开源免费版。变声软件是一种能够改变用户声音的软件工具,它们通常提供多种变声效果和声音调整选项,使用户能够在不同场合下使用不同的声音,相信对于做自媒体的朋友会非常有用。 MorphVOX Pro 这是一款功能比较齐全的变声软件,支持男声变女声、女声变男声等多种变声效果。使用上没有什么问题,相对比其他变声器,它的延迟效果比较大,约为一秒钟……继续阅读 »

迷途小书童 5个月前 (07-08) 458浏览 0评论 0个赞

AIGC

3个免费AI提效工具

3个免费AI提效工具
大家好,我是小书童,今天给大家介绍几款好用的 AI 工具。 remove.bg remove.bg 是一款强大的自动去除图片背景的在线工具,快速利用 AI 技术进行抠图。图片背景5秒就被消除,而且还是完全免费的。除此之外,它还提供了加背景、背景模糊化、调整透明度等功能。 工具地址: https://www.remove.bg/ VideoFusion VideoFusion 是一款一站式短视频合成工具,它的主要功能……继续阅读 »

迷途小书童 5个月前 (07-05) 400浏览 0评论 0个赞

AI资讯

每日AI资讯-20240705

每日AI资讯-20240705
1. 法国版开源GPT-4o 由法国8人团队打造的原生多模态 Moshi,已经实现了接近 GPT-4o 的水平,现场演示几乎0延迟。团队仅用了半年的时间,从头完成了模型的训练。 目前 Moshi 还处在实验原型阶段,设计初衷是为了理解和表达情感,能够支持听、说、看,可以用70种不同情绪和风格说话,甚至随时被打断,可以实现最低160ms端到端延迟。 不仅如此,最小版本的 Moshi 还可以在笔记本电脑,或者消费级 GP……继续阅读 »

迷途小书童 5个月前 (07-05) 365浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(五)视频风格转换

手把手AI实战(五)视频风格转换
成果展示 步骤拆解 本篇实战要完成2个目标 用 AI 生成的人物替换原始视频中的人物,生成一个新的视频 将原始视频进行风格转换,比如现在很火的黏土风格 好,现在我们需要准备一个原始视频,这里从网络上下载了一个美女舞蹈视频,大家可以从抖音、B站或油管上去下载,推荐 you-get 这个工具,链接:https://github.com/soimort/you-get 然后,介绍下本篇的 AI 主角,它就是 D……继续阅读 »

迷途小书童 5个月前 (06-27) 367浏览 0评论 0个赞

AI资讯

每日AI资讯-20240625

每日AI资讯-20240625
1. 小米大模型提效新框架 小米大模型团队提出 SUBLLM(Subsampling-Upsampling-Bypass Large Language Model),国际AI语音大牛、开源语音识别工具 Kaldi 之父 Daniel Povey 也参与指导。与 Llama 等模型相比,SUBLLM 在训练和推理速度以及降低内存方面都有了显著提升。 在大模型训练中,SUBLLM 的速度提高了26%,每个 GPU 的内……继续阅读 »

迷途小书童 5个月前 (06-25) 300浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(四)让图片开口说话

手把手AI实战(四)让图片开口说话
成果展示 原始图片 合成的视频 步骤拆解 提供一张带完整人脸的图片,系统能够根据音频(或者根据输入文本生成音频)合成视频,也就是 AI 数字人。 本篇实战使用的 AI 平台是 hedra,网址是:https://www.hedra.com/。 目前这个系统还是 beta 阶段,使用完全免费,而且对于已有的功能,也完全没有任何的使用限制。对于一般的 AI 数字人产品,它的整体效果还是非常不错的,不仅能够比较好的对……继续阅读 »

迷途小书童 5个月前 (06-24) 466浏览 0评论 0个赞

AI资讯

每日AI资讯-20240624

每日AI资讯-20240624
1. 华为发布盘古大模型5.0 华为开发者大会2024在东莞召开。在大会现场,华为发布了 HarmonyOS Next、盘古大模型 5.0、仓颉编程语言等,也介绍了一系列 AI 先进技术的应用案例。 大模型即服务平台 ModelArts Studio 目前可以提供百模千态的第三方大模型托管服务,支持对大模型定制开发,并提供相应的工具和行业集成套件,让客户可以方便的将大模型与业务系统结合。它具备三大特点: 支持零代……继续阅读 »

迷途小书童 5个月前 (06-24) 358浏览 0评论 0个赞