最新发布第3页

迷途小书童的Note-- 编程、技术、分享

资料汇总

资料越来越多，找起来非常麻烦，索引就变的很有必要，这里整理了一份文档，方便大家查看，这份文档会持续维护。地址：https://fmo6kuyy4v.feishu.cn/docx/QcZmdYdTuoo4QZxOISac2tc8nyh?from=from_copylink ……继续阅读 »

迷途小书童 2年前 (2024-07-10) 1306浏览 0评论 0个赞

自媒体

Windows修改系统默认字体

视频在这里字体及设置工具下载链接 https://pan.quark.cn/s/29699b5d35b7 ……继续阅读 »

迷途小书童 2年前 (2024-07-10) 2827浏览 0评论 0个赞

人工智能

大家好，我是小书童，今天给大家介绍几款好用的 AI 变声软件工具，有专业商业版，也有开源免费版。变声软件是一种能够改变用户声音的软件工具，它们通常提供多种变声效果和声音调整选项，使用户能够在不同场合下使用不同的声音，相信对于做自媒体的朋友会非常有用。 MorphVOX Pro 这是一款功能比较齐全的变声软件，支持男声变女声、女声变男声等多种变声效果。使用上没有什么问题，相对比其他变声器，它的延迟效果比较大，约为一秒钟……继续阅读 »

迷途小书童 2年前 (2024-07-08) 2216浏览 0评论 0个赞

AIGC

3个免费AI提效工具

大家好，我是小书童，今天给大家介绍几款好用的 AI 工具。 remove.bg remove.bg 是一款强大的自动去除图片背景的在线工具，快速利用 AI 技术进行抠图。图片背景5秒就被消除，而且还是完全免费的。除此之外，它还提供了加背景、背景模糊化、调整透明度等功能。工具地址： https://www.remove.bg/ VideoFusion VideoFusion 是一款一站式短视频合成工具，它的主要功能……继续阅读 »

迷途小书童 2年前 (2024-07-05) 1417浏览 0评论 0个赞

AI资讯

每日AI资讯-20240705

1. 法国版开源GPT-4o 由法国8人团队打造的原生多模态 Moshi，已经实现了接近 GPT-4o 的水平，现场演示几乎0延迟。团队仅用了半年的时间，从头完成了模型的训练。目前 Moshi 还处在实验原型阶段，设计初衷是为了理解和表达情感，能够支持听、说、看，可以用70种不同情绪和风格说话，甚至随时被打断，可以实现最低160ms端到端延迟。不仅如此，最小版本的 Moshi 还可以在笔记本电脑，或者消费级 GP……继续阅读 »

迷途小书童 2年前 (2024-07-05) 1191浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(五)视频风格转换

成果展示步骤拆解本篇实战要完成2个目标用 AI 生成的人物替换原始视频中的人物，生成一个新的视频将原始视频进行风格转换，比如现在很火的黏土风格好，现在我们需要准备一个原始视频，这里从网络上下载了一个美女舞蹈视频，大家可以从抖音、B站或油管上去下载，推荐 you-get 这个工具，链接：https://github.com/soimort/you-get 然后，介绍下本篇的 AI 主角，它就是 D……继续阅读 »

迷途小书童 2年前 (2024-06-27) 2254浏览 0评论 0个赞

AI资讯

每日AI资讯-20240625

1. 小米大模型提效新框架小米大模型团队提出 SUBLLM（Subsampling-Upsampling-Bypass Large Language Model），国际AI语音大牛、开源语音识别工具 Kaldi 之父 Daniel Povey 也参与指导。与 Llama 等模型相比，SUBLLM 在训练和推理速度以及降低内存方面都有了显著提升。在大模型训练中，SUBLLM 的速度提高了26%，每个 GPU 的内……继续阅读 »

迷途小书童 2年前 (2024-06-25) 1080浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(四)让图片开口说话

成果展示原始图片合成的视频步骤拆解提供一张带完整人脸的图片，系统能够根据音频（或者根据输入文本生成音频）合成视频，也就是 AI 数字人。本篇实战使用的 AI 平台是 hedra，网址是：https://www.hedra.com/。目前这个系统还是 beta 阶段，使用完全免费，而且对于已有的功能，也完全没有任何的使用限制。对于一般的 AI 数字人产品，它的整体效果还是非常不错的，不仅能够比较好的对……继续阅读 »

迷途小书童 2年前 (2024-06-24) 2223浏览 0评论 0个赞

AI资讯

每日AI资讯-20240624

1. 华为发布盘古大模型5.0 华为开发者大会2024在东莞召开。在大会现场，华为发布了 HarmonyOS Next、盘古大模型 5.0、仓颉编程语言等，也介绍了一系列 AI 先进技术的应用案例。大模型即服务平台 ModelArts Studio 目前可以提供百模千态的第三方大模型托管服务，支持对大模型定制开发，并提供相应的工具和行业集成套件，让客户可以方便的将大模型与业务系统结合。它具备三大特点：支持零代……继续阅读 »

迷途小书童 2年前 (2024-06-24) 1211浏览 0评论 0个赞

AI资讯

每日AI资讯-20240622

1. 可灵AI全新功能上线！可灵AI全新功能上线！图生视频和视频续写来啦！图生视频：上传任意图片，生成5秒精彩视频。支持添加提示词控制图像运动视频续写：对生成视频一键续写4～5秒，支持多次续写（最长3分钟），可通过微调提示词进行续写视频创作文生视频多比例选择：文生视频新增9:16和1:1视频尺寸选择，提供更多创作可能 PS：由于版本正在逐渐放量，已有权限的用户如果看不到功能，可以更新APP，再次尝试。没有……继续阅读 »

迷途小书童 2年前 (2024-06-22) 1127浏览 0评论 0个赞

AI资讯

每日AI资讯-20240621

1. Anthropic发布Claude 3.5 Sonnet Anthropic 推出了 Claude 3.5 Sonnet。Claude 3.5 Sonnet 在各种评测中都超越了竞争对手和 Claude 3 Opus，同时仍保持着 Claude 3 Sonnet 的速度和成本。 Claude 3.5 Sonnet 在解决问题、理解幽默和复杂指令方面均有显著进步。同时它的视觉理解能力也超越了 Claude 3 O……继续阅读 »

迷途小书童 2年前 (2024-06-21) 1470浏览 0评论 0个赞

AI资讯

每日AI资讯-20240620

1. 英伟达市值登顶全球科技领域迎来了一个重要时刻，英伟达超越微软，成为了全球市值最高的公司。英伟达是一家芯片制造商，在最近一个交易日的股价上涨 3.5% 达到 135.58 美元，市值升至 3.334 万亿美元，正式超越苹果、微软等一众科技公司，成为全球最有价值的 AI 科技公司，也是 AI 浪潮成为这个新时代主旋律的一个里程碑。随着市值持续增长，现年 61 岁的CEO黄仁勋身价也水涨船高，已经超过了 119……继续阅读 »

迷途小书童 2年前 (2024-06-20) 1071浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(三)让图片中的人物舞动起来

成果展示步骤拆解本篇使用的 AI 工具是 viggle，地址是：https://viggle.ai/ viggle 有2种使用方法，一个是在网页里，另一个是在 discord 里，看你自己的使用习惯，这里以 web 版为例，点击 Join The Beta 点击左侧的 Character 中的 Upload files or drop an image，下方的 Image Assets 中可以找到历史文件……继续阅读 »

迷途小书童 2年前 (2024-06-19) 2350浏览 0评论 0个赞

AI资讯

每日AI资讯-20240619

1. 谷歌DeepMind利用AI为无声视频配音 DeepMind近日公布了一项利用 AI 为无声视频生成背景音乐的video-to-audio技术。AI模型首先会将用户输入的视频进行拆解，此后结合用户的用户文字提示，利用扩散模型反复运算，最终以生成与视频画面协调的背景声音，例如输入一条“在黑暗中行走”的无声视频，再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示，相关模型就能生成恐怖风格的背景音效。 ……继续阅读 »

迷途小书童 2年前 (2024-06-19) 1113浏览 0评论 0个赞

AI资讯

每日AI资讯-20240618

1. 3D 版 SORA 来了！ DreamTech 官宣了其高质量 3D 生成大模型 Direct3D，并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。链接：https://arxiv.org/abs/2405.14832 这是首个公开发布的原生三维生成路线的 3D 大模型，通过采用……继续阅读 »

迷途小书童 2年前 (2024-06-18) 1082浏览 0评论 0个赞

AI资讯

每日AI资讯-20240617

1. Meta AI的NLLB-200登上Nature Meta AI在社交媒体X上宣传自家的大模型NLLB，全称为No Language Left Behind，这个AI模型能够翻译200种语言，包括资源匮乏的语言，更难得的是，NLLB模型可以免费提供给非商业用途。这项研究刊登在了本周的Nature上，题为Scalling neural machine translations to 200 languages。……继续阅读 »

迷途小书童 2年前 (2024-06-17) 1325浏览 0评论 0个赞

AI资讯

每日AI资讯-20240616

1. AI漫画角色一致性大突破由中山大学和联想团队联合提出AutoStudio，它是一个无需训练的多智能体协同框架。AutoStudio采用基于大语言模型的三个智能体来处理交互，并使用基于扩散模型的Drawer生成高质量图像。实验中，AutoStudio无论是在定量还是定性评估中都优于现有方法。 AutoStudio包括三个基于LLM的智能体：主题管理器：解释对话，识别不同的主题，并为其分配适当的上下文 ……继续阅读 »

迷途小书童 2年前 (2024-06-16) 1036浏览 0评论 0个赞

AI资讯

每日AI资讯-20240615

1. Follow Your Emoji 一键让照片变表情包腾讯混元联合港科大、清华大学联合推出肖像动画生成框架Follow Your Emoji，可以通过人脸骨架信息生成任意风格的脸部动画，一键创建表情包。基于算法革新和数据积累，Follow Your Emoji可以支持对脸部进行精细化的控制，包括眉毛，眼珠，翻白眼等细节，动物表情包也可以轻松拿捏。首先，引入了表情感知骨架这一表情控制信号，能够有效地引导动画……继续阅读 »

迷途小书童 2年前 (2024-06-15) 1020浏览 0评论 0个赞

迷途小书童的Note — 编程、技术、分享

最新发布第3页

资料汇总

Windows修改系统默认字体

5款AI变声软件

3个免费AI提效工具

每日AI资讯-20240705

手把手AI实战(五)视频风格转换

每日AI资讯-20240625

手把手AI实战(四)让图片开口说话

每日AI资讯-20240624

每日AI资讯-20240622

每日AI资讯-20240621

每日AI资讯-20240620

手把手AI实战(三)让图片中的人物舞动起来

每日AI资讯-20240619

每日AI资讯-20240618

每日AI资讯-20240617

每日AI资讯-20240616

每日AI资讯-20240615