1. Anthropic发布Claude 3.5 Sonnet
Anthropic 推出了 Claude 3.5 Sonnet。Claude 3.5 Sonnet 在各种评测中都超越了竞争对手和 Claude 3 Opus,同时仍保持着 Claude 3 Sonnet 的速度和成本。
Claude 3.5 Sonnet 在解决问题、理解幽默和复杂指令方面均有显著进步。同时它的视觉理解能力也超越了 Claude 3 Opus,能准确地从不完整的图像中提取文本信息。此外,它还展现出了出色的代码编写和调试能力。
除了模型本身的进步,Anthropic还推出了Artifacts功能,让用户能实时编辑和构建 Claude 生成的内容,为 Claude 从对话型 AI 向协作型工作环境的演进迈出了关键一步。
接下来,Anthropic将陆续推出 Claude 3.5 Haiku 和 Claude 3.5 Opus,并将持续优化 Claude 在智能性、速度和成本效率之间的平衡。
2. 中国团队推出百万高质量视频-字幕数据
来自中国科学技术大学、北京大学、上海 AI Lab等团队的研究人员发布了 ShareGPT4Video系列,旨在提升视频理解和生成能力。
研究者们精心设计了一种差分滑窗视频描述(Differential Sliding-Window Captioning, DiffSW)策略,该策略可以稳定且高效地为任意分辨率,宽高比和长度的视频生成高质量描述。具体来说,每次送入GPT4V的输入是当前关键帧,上一关键帧以及上一关键帧对应的差分描述,旨在让GPT4V根据观察两帧之间的时间与空间变化总结出当前帧相对于上一帧的重要空间、时序变化,即当前帧与上一帧对应的差分描述。最终,所有差分描述会连同时间戳一起送入GPT4中从而总结出最终的关于整个视频的高质量字幕。
项目地址:https://sharegpt4video.github.io/
3. ChatTTS工具包
ChatTTS是专门为对话场景设计的文本转语音模型。它支持英文和中文两种语言。ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人;能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
项目地址:https://chattts.com/
本地一键包下载地址:https://pan.quark.cn/s/8a606573efc2
4. AI网站制作工具Durable
Durable AI是基于Ai技术的网站构建工具,可以帮助用户快速创建专业级别的商业网站。
网站地址:https://durable.co/