最新发布第2页

迷途小书童的Note-- 编程、技术、分享

地表最强AI软件工程师–Genie

大家好，我是小书童。继 Devin 之后，又一个 AI 软件工程师出圈了。它就是 Genie，号称目前地表最强，用官方的描述就是它能够像人类工程师一样解决现实生活中的软件问题。 Genie 是迄今为止世界上最好的人工智能软件工程师。在行业标准基准 SWE-Bench 上得分为 30%，比之前亚马逊 Q 和 Factory 的 Code Droid（两者在 SWE-Bench 上得分均为 19%）的 SOTA……继续阅读 »

迷途小书童 2年前 (2024-08-14) 1556浏览 0评论 1个赞

AIGC

开源大模型套壳方案GeekAI

大家好，我是小书童。本篇给大家介绍一个开源的全套 AI 助手解决方案，GeekAI，它基于 AI 大语言模型 API 实现，自带运营管理后台，开箱即用。集成了 OpenAI，Azure， ChatGLM，讯飞星火，文心一言等多个平台的大语言模型，同时还集成了 MidJourney 和 Stable Diffusion 绘画功能，SUNO音乐创作，功能非常强大。主要特性完整的开源系统，前端应用和后台管理系统皆……继续阅读 »

迷途小书童 2年前 (2024-08-13) 2203浏览 0评论 0个赞

算法

一款高质量TTS开源库

大家好，我是小书童。本篇给大家介绍一款开源的高质量 TTS (Text To Speech) 模型的推理和训练库，parler-tts。 parler-tts 是一种轻量级文本转语音 (TTS) 模型，它可以按照给定说话者的风格（性别、音调、说话风格等）生成高质量、听起来自然的语音。它是 Stability AI 和爱丁堡大学的 Dan Lyth 和 Simon King 论文 Natural language g……继续阅读 »

迷途小书童 2年前 (2024-08-13) 1925浏览 0评论 0个赞

OCR

适用于验证码的开源OCR

环境 windows 11 python 3.9 前言 Muggle OCR 是一个高效本地 OCR 模块，旨在通过简单的几步设置提供强大的文本识别功能，无论是在处理印刷文本还是解析验证码，都能让用户在工作中畅通无阻。Muggle OCR 易于安装和使用，支持双模型，识别快速准确。实操首先下载源码 # 克隆代买 git clone https://github.com/litongjava/muggle_oc……继续阅读 »

迷途小书童 2年前 (2024-08-07) 1601浏览 0评论 0个赞

IT技巧

免费Amazon亚马逊云服务器申请与使用教程

Amazon亚马逊云科技提供的免费VPS主机已经有好多年了，今天来为大家详细讲解一下新的亚马逊云科技云服务器申请与使用教程。Amazon亚马逊云科技目前提供的服务非常地多。主要有云服务器（ec2）、云存储（S3）、CDN相关产品、lightsail VPS、SES (群发邮件)等，其中Amazon lightsail是类似于VPS主机的产品，云服务器（ec2）则是云服务器，可以对内存、流量、CPU、带宽等自由定制……继续阅读 »

迷途小书童 2年前 (2024-08-07) 1187浏览 0评论 0个赞

AI资讯

Midjourney发布V6.1版本

今天，Midjourney发布了V6.1版本，标志着图像创造领域的一次重大飞跃！本次更新显著增强了图像质量，重新定义了创意视觉的标准。目前V6.1已经成为了默认模型，部分V6.1未能实现的功能，如修补/扩展，需要用户手动切换回V6.0版本，使用参数 -v 6即可。 V6.1版本的亮点如下：无缝连接的图像构造：无论是人体的细微部分、自然界的动植物，新版都能确保图像间的平滑过渡，告别突兀的断层感，每一寸都宛如精心雕……继续阅读 »

迷途小书童 2年前 (2024-07-31) 1159浏览 0评论 0个赞

IT技巧

5款抠图工具

视频看这里工具对应链接 https://www.remove.bg/ https://cleanupphotos.com/ https://www.photoroom.com/ BG Remover：https://pan.quark.cn/s/037b542e0f2d 鲜艺AI抠图：https://pan.quark.cn/s/98fe35a7f056 ……继续阅读 »

迷途小书童 2年前 (2024-07-30) 2892浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(七)制作搞笑动画视频

成果展示步骤拆解本篇实战使用的 AI 工具是 Adobe express，网站地址是：https://new.express.adobe.com，登录之后，点击 Video，然后点击 Animate from audio，进入编辑界面 Character 选择自己想要的形象，可以是人物、动物、动画等，这里就选个 Sticky Background 选项卡提供了很多的背景，我们选个窗户的背景 Size ……继续阅读 »

迷途小书童 2年前 (2024-07-15) 1361浏览 0评论 0个赞

IT技巧

Android手机投屏

视频看这里软件下载项目地址：https://github.com/Genymobile/scrcpy 压缩包下载链接：https://pan.quark.cn/s/4bfe1d47b6ad ……继续阅读 »

迷途小书童 2年前 (2024-07-15) 2813浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(六)老照片动起来

成果展示步骤拆解老照片动起来其实就是利用 AI 大模型的图生视频功能，这个项目用到的工具是快手的可灵大模型，它有 web 版本和手机 App，这里使用手机 App 来操作。到应用商店下载快影 App。打开快影后，点开 AI 创作然后点开 AI 生视频接着选择第2项的图生视频我们选择一张手机图片进行上传，这里从网络上找了一张老照片下方的提示栏，是我们需要输入的提示词，这个你可以不输。如果说有特殊……继续阅读 »

迷途小书童 2年前 (2024-07-11) 1265浏览 0评论 0个赞

下载频道

资料汇总

资料越来越多，找起来非常麻烦，索引就变的很有必要，这里整理了一份文档，方便大家查看，这份文档会持续维护。地址：https://fmo6kuyy4v.feishu.cn/docx/QcZmdYdTuoo4QZxOISac2tc8nyh?from=from_copylink ……继续阅读 »

迷途小书童 2年前 (2024-07-10) 1208浏览 0评论 0个赞

自媒体

Windows修改系统默认字体

视频在这里字体及设置工具下载链接 https://pan.quark.cn/s/29699b5d35b7 ……继续阅读 »

迷途小书童 2年前 (2024-07-10) 2713浏览 0评论 0个赞

人工智能

5款AI变声软件

大家好，我是小书童，今天给大家介绍几款好用的 AI 变声软件工具，有专业商业版，也有开源免费版。变声软件是一种能够改变用户声音的软件工具，它们通常提供多种变声效果和声音调整选项，使用户能够在不同场合下使用不同的声音，相信对于做自媒体的朋友会非常有用。 MorphVOX Pro 这是一款功能比较齐全的变声软件，支持男声变女声、女声变男声等多种变声效果。使用上没有什么问题，相对比其他变声器，它的延迟效果比较大，约为一秒钟……继续阅读 »

迷途小书童 2年前 (2024-07-08) 2044浏览 0评论 0个赞

AIGC

3个免费AI提效工具

大家好，我是小书童，今天给大家介绍几款好用的 AI 工具。 remove.bg remove.bg 是一款强大的自动去除图片背景的在线工具，快速利用 AI 技术进行抠图。图片背景5秒就被消除，而且还是完全免费的。除此之外，它还提供了加背景、背景模糊化、调整透明度等功能。工具地址： https://www.remove.bg/ VideoFusion VideoFusion 是一款一站式短视频合成工具，它的主要功能……继续阅读 »

迷途小书童 2年前 (2024-07-05) 1320浏览 0评论 0个赞

AI资讯

每日AI资讯-20240705

1. 法国版开源GPT-4o 由法国8人团队打造的原生多模态 Moshi，已经实现了接近 GPT-4o 的水平，现场演示几乎0延迟。团队仅用了半年的时间，从头完成了模型的训练。目前 Moshi 还处在实验原型阶段，设计初衷是为了理解和表达情感，能够支持听、说、看，可以用70种不同情绪和风格说话，甚至随时被打断，可以实现最低160ms端到端延迟。不仅如此，最小版本的 Moshi 还可以在笔记本电脑，或者消费级 GP……继续阅读 »

迷途小书童 2年前 (2024-07-05) 1028浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(五)视频风格转换

成果展示步骤拆解本篇实战要完成2个目标用 AI 生成的人物替换原始视频中的人物，生成一个新的视频将原始视频进行风格转换，比如现在很火的黏土风格好，现在我们需要准备一个原始视频，这里从网络上下载了一个美女舞蹈视频，大家可以从抖音、B站或油管上去下载，推荐 you-get 这个工具，链接：https://github.com/soimort/you-get 然后，介绍下本篇的 AI 主角，它就是 D……继续阅读 »

迷途小书童 2年前 (2024-06-27) 2133浏览 0评论 0个赞

AI资讯

每日AI资讯-20240625

1. 小米大模型提效新框架小米大模型团队提出 SUBLLM（Subsampling-Upsampling-Bypass Large Language Model），国际AI语音大牛、开源语音识别工具 Kaldi 之父 Daniel Povey 也参与指导。与 Llama 等模型相比，SUBLLM 在训练和推理速度以及降低内存方面都有了显著提升。在大模型训练中，SUBLLM 的速度提高了26%，每个 GPU 的内……继续阅读 »

迷途小书童 2年前 (2024-06-25) 939浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(四)让图片开口说话

成果展示原始图片合成的视频步骤拆解提供一张带完整人脸的图片，系统能够根据音频（或者根据输入文本生成音频）合成视频，也就是 AI 数字人。本篇实战使用的 AI 平台是 hedra，网址是：https://www.hedra.com/。目前这个系统还是 beta 阶段，使用完全免费，而且对于已有的功能，也完全没有任何的使用限制。对于一般的 AI 数字人产品，它的整体效果还是非常不错的，不仅能够比较好的对……继续阅读 »

迷途小书童 2年前 (2024-06-24) 2109浏览 0评论 0个赞