欢迎访问我的网站,希望内容对您有用,感兴趣的可以加入我们的社群。

2024年06月的内容

AI+自媒体实战

手把手AI实战(五)视频风格转换

手把手AI实战(五)视频风格转换
成果展示 步骤拆解 本篇实战要完成2个目标 用 AI 生成的人物替换原始视频中的人物,生成一个新的视频 将原始视频进行风格转换,比如现在很火的黏土风格 好,现在我们需要准备一个原始视频,这里从网络上下载了一个美女舞蹈视频,大家可以从抖音、B站或油管上去下载,推荐 you-get 这个工具,链接:https://github.com/soimort/you-get 然后,介绍下本篇的 AI 主角,它就是 D……继续阅读 »

迷途小书童 5个月前 (06-27) 367浏览 0评论 0个赞

AI资讯

每日AI资讯-20240625

每日AI资讯-20240625
1. 小米大模型提效新框架 小米大模型团队提出 SUBLLM(Subsampling-Upsampling-Bypass Large Language Model),国际AI语音大牛、开源语音识别工具 Kaldi 之父 Daniel Povey 也参与指导。与 Llama 等模型相比,SUBLLM 在训练和推理速度以及降低内存方面都有了显著提升。 在大模型训练中,SUBLLM 的速度提高了26%,每个 GPU 的内……继续阅读 »

迷途小书童 5个月前 (06-25) 299浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(四)让图片开口说话

手把手AI实战(四)让图片开口说话
成果展示 原始图片 合成的视频 步骤拆解 提供一张带完整人脸的图片,系统能够根据音频(或者根据输入文本生成音频)合成视频,也就是 AI 数字人。 本篇实战使用的 AI 平台是 hedra,网址是:https://www.hedra.com/。 目前这个系统还是 beta 阶段,使用完全免费,而且对于已有的功能,也完全没有任何的使用限制。对于一般的 AI 数字人产品,它的整体效果还是非常不错的,不仅能够比较好的对……继续阅读 »

迷途小书童 5个月前 (06-24) 464浏览 0评论 0个赞

AI资讯

每日AI资讯-20240624

每日AI资讯-20240624
1. 华为发布盘古大模型5.0 华为开发者大会2024在东莞召开。在大会现场,华为发布了 HarmonyOS Next、盘古大模型 5.0、仓颉编程语言等,也介绍了一系列 AI 先进技术的应用案例。 大模型即服务平台 ModelArts Studio 目前可以提供百模千态的第三方大模型托管服务,支持对大模型定制开发,并提供相应的工具和行业集成套件,让客户可以方便的将大模型与业务系统结合。它具备三大特点: 支持零代……继续阅读 »

迷途小书童 5个月前 (06-24) 357浏览 0评论 0个赞

AI资讯

每日AI资讯-20240622

每日AI资讯-20240622
1. 可灵AI全新功能上线! 可灵AI全新功能上线!图生视频和视频续写来啦! 图生视频:上传任意图片,生成5秒精彩视频。支持添加提示词控制图像运动 视频续写:对生成视频一键续写4~5秒,支持多次续写(最长3分钟),可通过微调提示词进行续写视频创作 文生视频多比例选择:文生视频新增9:16和1:1视频尺寸选择,提供更多创作可能 PS:由于版本正在逐渐放量,已有权限的用户如果看不到功能,可以更新APP,再次尝试。没有……继续阅读 »

迷途小书童 5个月前 (06-22) 351浏览 0评论 0个赞

AI资讯

每日AI资讯-20240621

每日AI资讯-20240621
1. Anthropic发布Claude 3.5 Sonnet Anthropic 推出了 Claude 3.5 Sonnet。Claude 3.5 Sonnet 在各种评测中都超越了竞争对手和 Claude 3 Opus,同时仍保持着 Claude 3 Sonnet 的速度和成本。 Claude 3.5 Sonnet 在解决问题、理解幽默和复杂指令方面均有显著进步。同时它的视觉理解能力也超越了 Claude 3 O……继续阅读 »

迷途小书童 5个月前 (06-21) 391浏览 0评论 0个赞

AI资讯

每日AI资讯-20240620

每日AI资讯-20240620
1. 英伟达市值登顶 全球科技领域迎来了一个重要时刻,英伟达超越微软,成为了全球市值最高的公司。英伟达是一家芯片制造商,在最近一个交易日的股价上涨 3.5% 达到 135.58 美元,市值升至 3.334 万亿美元,正式超越苹果、微软等一众科技公司,成为全球最有价值的 AI 科技公司,也是 AI 浪潮成为这个新时代主旋律的一个里程碑。 随着市值持续增长,现年 61 岁的CEO黄仁勋身价也水涨船高,已经超过了 119……继续阅读 »

迷途小书童 5个月前 (06-20) 281浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(三)让图片中的人物舞动起来

手把手AI实战(三)让图片中的人物舞动起来
成果展示 步骤拆解 本篇使用的 AI 工具是 viggle,地址是:https://viggle.ai/ viggle 有2种使用方法,一个是在网页里,另一个是在 discord 里,看你自己的使用习惯,这里以 web 版为例,点击 Join The Beta 点击左侧的 Character 中的 Upload files or drop an image,下方的 Image Assets 中可以找到历史文件……继续阅读 »

迷途小书童 5个月前 (06-19) 398浏览 0评论 0个赞

AI资讯

每日AI资讯-20240619

每日AI资讯-20240619
1. 谷歌DeepMind利用AI为无声视频配音 DeepMind近日公布了一项利用 AI 为无声视频生成背景音乐的video-to-audio技术。AI模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。 ……继续阅读 »

迷途小书童 5个月前 (06-19) 326浏览 0评论 0个赞

AI资讯

每日AI资讯-20240618

每日AI资讯-20240618
1. 3D 版 SORA 来了! DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。 链接:https://arxiv.org/abs/2405.14832 这是首个公开发布的原生三维生成路线的 3D 大模型,通过采用……继续阅读 »

迷途小书童 5个月前 (06-18) 286浏览 0评论 0个赞

AI资讯

每日AI资讯-20240617

每日AI资讯-20240617
1. Meta AI的NLLB-200登上Nature Meta AI在社交媒体X上宣传自家的大模型NLLB,全称为No Language Left Behind,这个AI模型能够翻译200种语言,包括资源匮乏的语言,更难得的是,NLLB模型可以免费提供给非商业用途。 这项研究刊登在了本周的Nature上,题为Scalling neural machine translations to 200 languages。……继续阅读 »

迷途小书童 5个月前 (06-17) 340浏览 0评论 0个赞

付费专栏

AI专栏推荐

AI专栏推荐
100款好用的AI工具 AI设计从入门到变现 AI赚钱的100种思路(含指令) AI海外赚钱 中小厂程序员生存指南 AI+公众号爆文写作 AI爆款标题指南 AI拆书入门到变现 AI代写 AI电商从入门到赚钱 AI视频制作(50个案例拆解) AI写真变现(爆款案例拆解) 写作与AI写作变现 ……继续阅读 »

迷途小书童 5个月前 (06-17) 1736浏览 0评论 0个赞

AI资讯

每日AI资讯-20240616

每日AI资讯-20240616
1. AI漫画角色一致性大突破 由中山大学和联想团队联合提出AutoStudio,它是一个无需训练的多智能体协同框架。AutoStudio采用基于大语言模型的三个智能体来处理交互,并使用基于扩散模型的Drawer生成高质量图像。实验中,AutoStudio无论是在定量还是定性评估中都优于现有方法。 AutoStudio包括三个基于LLM的智能体: 主题管理器:解释对话,识别不同的主题,并为其分配适当的上下文 ……继续阅读 »

迷途小书童 5个月前 (06-16) 291浏览 0评论 0个赞

AI资讯

每日AI资讯-20240615

每日AI资讯-20240615
1. Follow Your Emoji 一键让照片变表情包 腾讯混元联合港科大、清华大学联合推出肖像动画生成框架Follow Your Emoji,可以通过人脸骨架信息生成任意风格的脸部动画,一键创建表情包。基于算法革新和数据积累,Follow Your Emoji可以支持对脸部进行精细化的控制,包括眉毛,眼珠,翻白眼等细节,动物表情包也可以轻松拿捏。 首先,引入了表情感知骨架这一表情控制信号,能够有效地引导动画……继续阅读 »

迷途小书童 5个月前 (06-15) 239浏览 0评论 0个赞

AI资讯

每日AI资讯-20240614

每日AI资讯-20240614
1. AI视频新霸主诞生!Dream Machine 成立于2021年的Luma AI官宣了文生视频/图生视频模型Dream Machine,而且提供免费试用API,高质量的生成效果获得了很多网友的好评。 有网友输入相同的提示词,对比Pika、Runway和Dream Machine三个模型,他认为最终还是Luma赢了。 2. 吴恩达开源机器翻译智能体 人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体……继续阅读 »

迷途小书童 5个月前 (06-14) 450浏览 0评论 0个赞

AI资讯

每日AI资讯-20240613

每日AI资讯-20240613
1. GPT-4o更容易越狱? 来自北航和南洋理工的研究人员,通过上万次的API查询,对GPT-4o各种模态的安全性进行了详细测试。结果发现,GPT-4o新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌GPT-4V。 研究人员针对4个常用的基准测试,对GPT-4o支持的三种模态(文本、图像、音频)进行了测试。 测试一共涉及到4000+初始文本查询的优化,8000+响应判断,16000+次OpenAI的API……继续阅读 »

迷途小书童 5个月前 (06-13) 300浏览 0评论 0个赞

AIGC

手把手教你打造一个AI智能体

手把手教你打造一个AI智能体
什么是AI智能体? Agent AI 智能体,也被称为人工智能代理(Artificial Intelligence Agent),是一种能够感知环境、进行自主理解、决策和执行动作的智能体。它具备独立思考和调用工具逐步完成给定目标的能力。Agent AI 智能体不仅仅是一个大模型,它通过感知和适应环境,可以模拟人类的交互方式,并展现出上下文学习能力、思维链和推理能力等类似人类思考方式的能力。 通俗的理解:Agent A……继续阅读 »

迷途小书童 5个月前 (06-13) 475浏览 0评论 0个赞

AI资讯

每日AI资讯-20240612

每日AI资讯-20240612
1. Yandex开源LLM训练工具,节省高达20%的GPU资源 Yandex 最近推出了 YaFSDP,这是一种用于训练大型语言模型 (LLM) 的开源方法。YaFSDP 是目前最有效的公开可用工具,用于增强 GPU 通信并减少 LLM 训练中的内存使用量,与 FSDP 相比,其训练速度提升最高可达 26%,具体取决于架构和参数数量。通过使用 YaFSDP 减少 LLM 的训练时间可以节省高达 20% 的 GPU ……继续阅读 »

迷途小书童 5个月前 (06-12) 252浏览 0评论 0个赞