最新发布第2页

迷途小书童的Note-- 编程、技术、分享

每日AI资讯-20240618

1. 3D 版 SORA 来了！ DreamTech 官宣了其高质量 3D 生成大模型 Direct3D，并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。链接：https://arxiv.org/abs/2405.14832 这是首个公开发布的原生三维生成路线的 3D 大模型，通过采用……继续阅读 »

迷途小书童 1个月前 (06-18) 174浏览 0评论 0个赞

AI资讯

每日AI资讯-20240617

1. Meta AI的NLLB-200登上Nature Meta AI在社交媒体X上宣传自家的大模型NLLB，全称为No Language Left Behind，这个AI模型能够翻译200种语言，包括资源匮乏的语言，更难得的是，NLLB模型可以免费提供给非商业用途。这项研究刊登在了本周的Nature上，题为Scalling neural machine translations to 200 languages。……继续阅读 »

迷途小书童 1个月前 (06-17) 200浏览 0评论 0个赞

付费专栏

AI专栏推荐

100款好用的AI工具 AI设计从入门到变现 AI赚钱的100种思路(含指令) AI海外赚钱中小厂程序员生存指南 AI+公众号爆文写作 AI爆款标题指南 AI拆书入门到变现 AI代写 AI电商从入门到赚钱 AI视频制作(50个案例拆解) AI写真变现(爆款案例拆解) 写作与AI写作变现 ……继续阅读 »

迷途小书童 1个月前 (06-17) 1609浏览 0评论 0个赞

AI资讯

每日AI资讯-20240616

1. AI漫画角色一致性大突破由中山大学和联想团队联合提出AutoStudio，它是一个无需训练的多智能体协同框架。AutoStudio采用基于大语言模型的三个智能体来处理交互，并使用基于扩散模型的Drawer生成高质量图像。实验中，AutoStudio无论是在定量还是定性评估中都优于现有方法。 AutoStudio包括三个基于LLM的智能体：主题管理器：解释对话，识别不同的主题，并为其分配适当的上下文 ……继续阅读 »

迷途小书童 1个月前 (06-16) 164浏览 0评论 0个赞

AI资讯

每日AI资讯-20240615

1. Follow Your Emoji 一键让照片变表情包腾讯混元联合港科大、清华大学联合推出肖像动画生成框架Follow Your Emoji，可以通过人脸骨架信息生成任意风格的脸部动画，一键创建表情包。基于算法革新和数据积累，Follow Your Emoji可以支持对脸部进行精细化的控制，包括眉毛，眼珠，翻白眼等细节，动物表情包也可以轻松拿捏。首先，引入了表情感知骨架这一表情控制信号，能够有效地引导动画……继续阅读 »

迷途小书童 1个月前 (06-15) 138浏览 0评论 0个赞

AI资讯

每日AI资讯-20240614

1. AI视频新霸主诞生！Dream Machine 成立于2021年的Luma AI官宣了文生视频/图生视频模型Dream Machine，而且提供免费试用API，高质量的生成效果获得了很多网友的好评。有网友输入相同的提示词，对比Pika、Runway和Dream Machine三个模型，他认为最终还是Luma赢了。 2. 吴恩达开源机器翻译智能体人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体……继续阅读 »

迷途小书童 1个月前 (06-14) 278浏览 0评论 0个赞

AI资讯

每日AI资讯-20240613

1. GPT-4o更容易越狱？来自北航和南洋理工的研究人员，通过上万次的API查询，对GPT-4o各种模态的安全性进行了详细测试。结果发现，GPT-4o新引入的语音模态带来了新的攻击面，而且多模态整体安全性不敌GPT-4V。研究人员针对4个常用的基准测试，对GPT-4o支持的三种模态（文本、图像、音频）进行了测试。测试一共涉及到4000+初始文本查询的优化，8000+响应判断，16000+次OpenAI的API……继续阅读 »

迷途小书童 1个月前 (06-13) 155浏览 0评论 0个赞

AIGC

手把手教你打造一个AI智能体

什么是AI智能体？ Agent AI 智能体，也被称为人工智能代理（Artificial Intelligence Agent），是一种能够感知环境、进行自主理解、决策和执行动作的智能体。它具备独立思考和调用工具逐步完成给定目标的能力。Agent AI 智能体不仅仅是一个大模型，它通过感知和适应环境，可以模拟人类的交互方式，并展现出上下文学习能力、思维链和推理能力等类似人类思考方式的能力。通俗的理解：Agent A……继续阅读 »

迷途小书童 1个月前 (06-13) 337浏览 0评论 0个赞

AI资讯

每日AI资讯-20240612

1. Yandex开源LLM训练工具，节省高达20%的GPU资源 Yandex 最近推出了 YaFSDP，这是一种用于训练大型语言模型 (LLM) 的开源方法。YaFSDP 是目前最有效的公开可用工具，用于增强 GPU 通信并减少 LLM 训练中的内存使用量，与 FSDP 相比，其训练速度提升最高可达 26%，具体取决于架构和参数数量。通过使用 YaFSDP 减少 LLM 的训练时间可以节省高达 20% 的 GPU ……继续阅读 »

迷途小书童 1个月前 (06-12) 146浏览 0评论 0个赞

AIGC

快手可灵文生视频大模型

快手推出了新的视频生成模型，可灵 Kling AI，根据官方放出的 Demo，几乎可以和 OpenAI 的 SORA 相媲美。官网地址：https://kling.kuaishou.com/ 可灵 AI 的功能特点得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构，可灵大模型能够生成长达2分钟的视频，且帧率达到30fps。采用3D时空联合注意力机制，能够更好地建模复杂时空运动，生成较大幅度运动的视频……继续阅读 »

迷途小书童 1个月前 (06-12) 187浏览 0评论 0个赞

AIGC

敢叫印钞机加速器的AI，你确定不来试试？

大家好，我是小书童。今天给大家分享一款开源的文生视频的 AI 工具，叫 MoneyPrinterTurbo，印钞机加速器，就问你牛不牛逼？ MoneyPrinterTurbo 已经在 GitHub 斩获了超过13k的星星，可见它的受欢迎程度。你只需要提供一个视频的主题或者关键词，有关的剧本、素材、字幕和背景音乐就能够自动生成，高清短视频生成只在一瞬间！无论您是营销人员、创作者还是个人用户，它都能帮你大大减轻创作负担……继续阅读 »

迷途小书童 1个月前 (06-12) 191浏览 0评论 1个赞

AI+自媒体实战

手把手AI实战(二)古诗词教学视频

成果展示步骤拆解生成绘图的提示词这里以曹操的《观沧海》为例东临碣石，以观沧海。水何澹澹，山岛竦峙。树木丛生，百草丰茂。秋风萧瑟，洪波涌起。日月之行，若出其中；星汉灿烂，若出其里。幸甚至哉，歌以咏志。这里，我们将根据这七句诗词，画出七幅画。这个艰巨的任务就交给大模型吧，使用国产的 Kimi，地址：https://kimi.moonshot.cn/ 我给的提示词是我想将曹操的《观沧海》这……继续阅读 »

迷途小书童 1个月前 (06-12) 143浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(一)治愈系动画视频

成果展示详细步骤拆解 AI出图可以使用你顺手的 AI 绘图工具，国外的像 Midjouney、Stable Diffusion，国内的像扣子、智普清言等等。我这里用了剪映的，地址是：https://jimeng.jianying.com/ai-tool 平台免费用户每天有60个积分，画一次消耗一个积分，正常来讲够用了，不够的话，可以开会员。左侧就写上提示词，比如我这里是一个小女孩斜躺在客厅地板上看电视，……继续阅读 »

迷途小书童 1个月前 (06-12) 168浏览 0评论 1个赞

chatGPT

ChatGPT越狱

前言之所以要越狱 ChatGPT，是为了让它提供由于 OpenAI 的内部限制而无法提供的响应。这些指令通常会阻止 ChatGPT 使用脏话或提供可能被视为歧视性的答案，本质上是作为人工智能遵循的道德指南。越狱步骤首先，打开 ChatGPT 官网 https://chatgpt.com 清除网站缓存，点击网址旁边的按钮，点击 Cookie 和网站数据然后，点击管理设备端网站数据点击各个网址后边的清除……继续阅读 »

迷途小书童 1个月前 (06-12) 223浏览 0评论 0个赞

AI资讯

每日AI资讯-20240611

1. 苹果重新定义AI 通过端侧+云端的方式实现全场景人工智能。 WWDC2024上，苹果将自有的AI能力命名为Apple Intelligence，它能基于苹果内置的大语言模型，通过理解自然语言来执行用户的语音或文字指令。苹果让AI能力几乎覆盖了所有重要的原生应用，包括相机、照片、备忘录、语音备忘录、提醒事项、邮件、Safari、Keynote等等。除此以外，苹果还推出了两款全新应用，分别是书写工具Writing……继续阅读 »

迷途小书童 2个月前 (06-11) 89浏览 0评论 0个赞

AI资讯

每日AI资讯-20240610

1. 华科等提出人类跳舞视频生成新框架UniAnimate 来自华中科技大学、阿里巴巴、中国科学技术大学的研究团队提出了 UniAnimate 框架，以实现高效且长时间的人类视频生成，支持合成1分钟高清视频。 2. 5秒完成3D生成，合成数据集已开源来自上海交大、香港中文大学等团队使用大模型合成的数据，显著提升了3D的生成能力。他们推出Bootstrap3D框架，结合微调的具备3D感知能力的多模态大模型。这个……继续阅读 »

迷途小书童 2个月前 (06-10) 86浏览 0评论 0个赞

AI资讯

每日AI资讯-20240608

1. 腾讯混元推出AI动图神器Follow-Your-Pose-v2 腾讯混元团队与中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”，只需要输入一张人物图片和一段动作视频，就可以让图片上的人跟随视频上的动作动起来，生成视频长度可达10秒。与此前推出的模型相比，Follow-Your-Pose-v2可在推理耗时更少的情况下，支持单张图片上多人视频动作生成。模型特有的“深度图指导……继续阅读 »

迷途小书童 2个月前 (06-08) 86浏览 0评论 0个赞

AI资讯

每日AI资讯-20240607

1. 阿里通义千问Qwen2大模型发布并同步开源阿里通义千问Qwen2大模型今日发布，并在 Hugging Face和 ModelScope上同步开源。Qwen2系列涵盖5个尺寸的预训练和指令微调模型，其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B，据称性能超过美国最强的开源模型Llama3-70B；在中英文之外，模型训练数据中增加了27种语言……继续阅读 »

迷途小书童 2个月前 (06-07) 92浏览 0评论 0个赞