1. GPT-4o更容易越狱?
来自北航和南洋理工的研究人员,通过上万次的API查询,对GPT-4o各种模态的安全性进行了详细测试。结果发现,GPT-4o新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌GPT-4V。
研究人员针对4个常用的基准测试,对GPT-4o支持的三种模态(文本、图像、音频)进行了测试。
测试一共涉及到4000+初始文本查询的优化,8000+响应判断,16000+次OpenAI的API查询。
基于此,研究人员撰写了详细的报告,给出了关于GPT-4o的安全性的三点见解:
GPT-4o对文本越狱攻击的安全性比之前有所提升,但文本模态越狱攻击可迁移性强,可通过多模态形式攻击;
新引入的音频模态为GPT-4o的越狱攻击暴露了新的攻击面;
当前的黑盒多模态越狱攻击方法几乎无效,但实验表明GPT-4o多模态层面的安全性弱于GPT-4V。
2. 微软Copilot GPTs下月停服!
微软发布公告,Copilot GPTs将于7月10日起停服,用户已经创建的GPTs将被清空。微软给出的官方解释是公司战略调整 — 正在将GPT的重点转向商业和企业场景,背后原因可能是缺乏商业回报。Copilot GPTs关闭引发了用户不满,批评者质疑此举会切断创新并削减消费者对于产品的信任。距离此项功能的发布仅仅过去了3个月的时间。
3个月的时间,足够AI圈发生很多大事,可是,对于一个只存活了3个月的产品而言,不能不称之为短命。
3. Stable Diffusion 3开源倒计时
Stable Diffusion 3,大概率会在近日开源。两个月前,Stable Diffusion 3一横空出世,立刻在人类偏好评估中斩下DALL-E 3和Midjourney v6,一举成为该领域的SOTA。
ComfyUI已经提交了对SD3支持的版本。
4. 美图公司推出AI短片创作工具MOKI
美图称与常规文生视频产品不同,MOKI 可实现内容和成本的双重可控,目前可以进行多种视频场景的 AI 短片创作。MOKI 可在脚本、视觉风格、角色等前期设定完成后,AI 自动生成分镜图并转为视频素材,通过智能剪辑、AI 配乐、AI 音效、自动字幕等功能串联素材并实现成片。
该产品在2024年7月31日开放试用。