每日AI资讯-20240705 - 迷途小书童的Note迷途小书童的Note

文章目录

1. 法国版开源GPT-4o

由法国8人团队打造的原生多模态 Moshi，已经实现了接近 GPT-4o 的水平，现场演示几乎0延迟。团队仅用了半年的时间，从头完成了模型的训练。

目前 Moshi 还处在实验原型阶段，设计初衷是为了理解和表达情感，能够支持听、说、看，可以用70种不同情绪和风格说话，甚至随时被打断，可以实现最低160ms端到端延迟。

不仅如此，最小版本的 Moshi 还可以在笔记本电脑，或者消费级 GPU 上运行。

目前还不需要太长的排队，进入页面后，使能麦克风，然后就可以直接对话了，大模型语音进行回复，同时还有文字版本的内容输出

Meta 的 GenAI 团队在最新研究中介绍了 Meta 3D Gen 模型：可以在不到1分钟的时间内从文本直接端到端生成 3D 作品。

生成的不仅纹理清晰、形态逼真自然，而且生成速度比其他替代方案加快了3-60倍。

目前，模型还没有开放试用，API 以及相应的代码也没有放出，等进一步的消息。

百度 AI 去水印助手

付费软件，金舟水印助手