1. Anthropic发布Claude 3.5 Sonnet
Anthropic 推出了 Claude 3.5 Sonnet。Claude 3.5 Sonnet 在各种评测中都超越了竞争对手和 Claude 3 Opus,同时仍保持着 Claude 3 Sonnet 的速度和成本。
Claude 3.5 Sonnet 在解决问题、理解幽默和复杂指令方面均有显著进步。同时它的视觉理解能力也超越了 Claude 3 O……继续阅读 »
迷途小书童
5个月前 (06-21) 411浏览 0评论
0个赞
1. 英伟达市值登顶
全球科技领域迎来了一个重要时刻,英伟达超越微软,成为了全球市值最高的公司。英伟达是一家芯片制造商,在最近一个交易日的股价上涨 3.5% 达到 135.58 美元,市值升至 3.334 万亿美元,正式超越苹果、微软等一众科技公司,成为全球最有价值的 AI 科技公司,也是 AI 浪潮成为这个新时代主旋律的一个里程碑。
随着市值持续增长,现年 61 岁的CEO黄仁勋身价也水涨船高,已经超过了 119……继续阅读 »
迷途小书童
6个月前 (06-20) 290浏览 0评论
0个赞
成果展示
步骤拆解
本篇使用的 AI 工具是 viggle,地址是:https://viggle.ai/
viggle 有2种使用方法,一个是在网页里,另一个是在 discord 里,看你自己的使用习惯,这里以 web 版为例,点击 Join The Beta
点击左侧的 Character 中的 Upload files or drop an image,下方的 Image Assets 中可以找到历史文件……继续阅读 »
迷途小书童
6个月前 (06-19) 411浏览 0评论
0个赞
1. 谷歌DeepMind利用AI为无声视频配音
DeepMind近日公布了一项利用 AI 为无声视频生成背景音乐的video-to-audio技术。AI模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。
……继续阅读 »
迷途小书童
6个月前 (06-19) 333浏览 0评论
0个赞
1. 3D 版 SORA 来了!
DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。
链接:https://arxiv.org/abs/2405.14832
这是首个公开发布的原生三维生成路线的 3D 大模型,通过采用……继续阅读 »
迷途小书童
6个月前 (06-18) 291浏览 0评论
0个赞
1. Meta AI的NLLB-200登上Nature
Meta AI在社交媒体X上宣传自家的大模型NLLB,全称为No Language Left Behind,这个AI模型能够翻译200种语言,包括资源匮乏的语言,更难得的是,NLLB模型可以免费提供给非商业用途。
这项研究刊登在了本周的Nature上,题为Scalling neural machine translations to 200 languages。……继续阅读 »
迷途小书童
6个月前 (06-17) 353浏览 0评论
0个赞
1. AI漫画角色一致性大突破
由中山大学和联想团队联合提出AutoStudio,它是一个无需训练的多智能体协同框架。AutoStudio采用基于大语言模型的三个智能体来处理交互,并使用基于扩散模型的Drawer生成高质量图像。实验中,AutoStudio无论是在定量还是定性评估中都优于现有方法。
AutoStudio包括三个基于LLM的智能体:
主题管理器:解释对话,识别不同的主题,并为其分配适当的上下文
……继续阅读 »
迷途小书童
6个月前 (06-16) 299浏览 0评论
0个赞
1. Follow Your Emoji 一键让照片变表情包
腾讯混元联合港科大、清华大学联合推出肖像动画生成框架Follow Your Emoji,可以通过人脸骨架信息生成任意风格的脸部动画,一键创建表情包。基于算法革新和数据积累,Follow Your Emoji可以支持对脸部进行精细化的控制,包括眉毛,眼珠,翻白眼等细节,动物表情包也可以轻松拿捏。
首先,引入了表情感知骨架这一表情控制信号,能够有效地引导动画……继续阅读 »
迷途小书童
6个月前 (06-15) 246浏览 0评论
0个赞
1. AI视频新霸主诞生!Dream Machine
成立于2021年的Luma AI官宣了文生视频/图生视频模型Dream Machine,而且提供免费试用API,高质量的生成效果获得了很多网友的好评。
有网友输入相同的提示词,对比Pika、Runway和Dream Machine三个模型,他认为最终还是Luma赢了。
2. 吴恩达开源机器翻译智能体
人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体……继续阅读 »
迷途小书童
6个月前 (06-14) 458浏览 0评论
0个赞
1. GPT-4o更容易越狱?
来自北航和南洋理工的研究人员,通过上万次的API查询,对GPT-4o各种模态的安全性进行了详细测试。结果发现,GPT-4o新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌GPT-4V。
研究人员针对4个常用的基准测试,对GPT-4o支持的三种模态(文本、图像、音频)进行了测试。
测试一共涉及到4000+初始文本查询的优化,8000+响应判断,16000+次OpenAI的API……继续阅读 »
迷途小书童
6个月前 (06-13) 310浏览 0评论
0个赞
什么是AI智能体?
Agent AI 智能体,也被称为人工智能代理(Artificial Intelligence Agent),是一种能够感知环境、进行自主理解、决策和执行动作的智能体。它具备独立思考和调用工具逐步完成给定目标的能力。Agent AI 智能体不仅仅是一个大模型,它通过感知和适应环境,可以模拟人类的交互方式,并展现出上下文学习能力、思维链和推理能力等类似人类思考方式的能力。
通俗的理解:Agent A……继续阅读 »
迷途小书童
6个月前 (06-13) 486浏览 0评论
0个赞
1. Yandex开源LLM训练工具,节省高达20%的GPU资源
Yandex 最近推出了 YaFSDP,这是一种用于训练大型语言模型 (LLM) 的开源方法。YaFSDP 是目前最有效的公开可用工具,用于增强 GPU 通信并减少 LLM 训练中的内存使用量,与 FSDP 相比,其训练速度提升最高可达 26%,具体取决于架构和参数数量。通过使用 YaFSDP 减少 LLM 的训练时间可以节省高达 20% 的 GPU ……继续阅读 »
迷途小书童
6个月前 (06-12) 256浏览 0评论
0个赞
快手推出了新的视频生成模型,可灵 Kling AI,根据官方放出的 Demo,几乎可以和 OpenAI 的 SORA 相媲美。
官网地址:https://kling.kuaishou.com/
可灵 AI 的功能特点
得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。
采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频……继续阅读 »
迷途小书童
6个月前 (06-12) 323浏览 0评论
0个赞
大家好,我是小书童。
今天给大家分享一款开源的文生视频的 AI 工具,叫 MoneyPrinterTurbo,印钞机加速器,就问你牛不牛逼?
MoneyPrinterTurbo 已经在 GitHub 斩获了超过13k的星星,可见它的受欢迎程度。你只需要提供一个视频的主题或者关键词,有关的剧本、素材、字幕和背景音乐就能够自动生成,高清短视频生成只在一瞬间!无论您是营销人员、创作者还是个人用户,它都能帮你大大减轻创作负担……继续阅读 »
迷途小书童
6个月前 (06-12) 426浏览 0评论
1个赞
成果展示
步骤拆解
生成绘图的提示词
这里以曹操的《观沧海》为例
东临碣石,以观沧海。
水何澹澹,山岛竦峙。
树木丛生,百草丰茂。
秋风萧瑟,洪波涌起。
日月之行,若出其中;
星汉灿烂,若出其里。
幸甚至哉,歌以咏志。
这里,我们将根据这七句诗词,画出七幅画。这个艰巨的任务就交给大模型吧,使用国产的 Kimi,地址:https://kimi.moonshot.cn/
我给的提示词是
我想将曹操的《观沧海》这……继续阅读 »
迷途小书童
6个月前 (06-12) 296浏览 0评论
0个赞
成果展示
详细步骤拆解
AI出图
可以使用你顺手的 AI 绘图工具,国外的像 Midjouney、Stable Diffusion,国内的像扣子、智普清言等等。我这里用了剪映的,地址是:https://jimeng.jianying.com/ai-tool
平台免费用户每天有60个积分,画一次消耗一个积分,正常来讲够用了,不够的话,可以开会员。
左侧就写上提示词,比如我这里是
一个小女孩斜躺在客厅地板上看电视,……继续阅读 »
迷途小书童
6个月前 (06-12) 425浏览 0评论
1个赞
前言
之所以要越狱 ChatGPT,是为了让它提供由于 OpenAI 的内部限制而无法提供的响应。这些指令通常会阻止 ChatGPT 使用脏话或提供可能被视为歧视性的答案,本质上是作为人工智能遵循的道德指南。
越狱步骤
首先,打开 ChatGPT 官网 https://chatgpt.com
清除网站缓存,点击网址旁边的按钮,点击 Cookie 和网站数据
然后,点击管理设备端网站数据
点击各个网址后边的清除……继续阅读 »
迷途小书童
6个月前 (06-12) 546浏览 0评论
0个赞
1. 苹果重新定义AI
通过端侧+云端的方式实现全场景人工智能。
WWDC2024上,苹果将自有的AI能力命名为Apple Intelligence,它能基于苹果内置的大语言模型,通过理解自然语言来执行用户的语音或文字指令。
苹果让AI能力几乎覆盖了所有重要的原生应用,包括相机、照片、备忘录、语音备忘录、提醒事项、邮件、Safari、Keynote等等。除此以外,苹果还推出了两款全新应用,分别是书写工具Writing……继续阅读 »
迷途小书童
6个月前 (06-11) 189浏览 0评论
0个赞