1. 法国版开源GPT-4o
由法国8人团队打造的原生多模态 Moshi
,已经实现了接近 GPT-4o
的水平,现场演示几乎0延迟。团队仅用了半年的时间,从头完成了模型的训练。
目前 Moshi
还处在实验原型阶段,设计初衷是为了理解和表达情感,能够支持听、说、看,可以用70种不同情绪和风格说话,甚至随时被打断,可以实现最低160ms端到端延迟。
不仅如此,最小版本的 Moshi
还可以在笔记本电脑,或者消费级 GPU
上运行。
申请试用地址:https://moshi.chat/?queue_id=talktomoshi
目前还不需要太长的排队,进入页面后,使能麦克风,然后就可以直接对话了,大模型语音进行回复,同时还有文字版本的内容输出
2. Meta发布最新3D Gen模型
Meta
的 GenAI
团队在最新研究中介绍了 Meta 3D Gen
模型:可以在不到1分钟的时间内从文本直接端到端生成 3D
作品。
生成的不仅纹理清晰、形态逼真自然,而且生成速度比其他替代方案加快了3-60倍。
目前,模型还没有开放试用,API
以及相应的代码也没有放出,等进一步的消息。
3. AI图片去水印
百度 AI
去水印助手
4. AI视频去水印
付费软件,金舟水印助手