1. 谷歌DeepMind利用AI为无声视频配音
DeepMind近日公布了一项利用 AI 为无声视频生成背景音乐的video-to-audio技术。AI模型首先会将用户输入的视频进行拆解,此后结合用户的用户文字提示,利用扩散模型反复运算,最终以生成与视频画面协调的背景声音,例如输入一条“在黑暗中行走”的无声视频,再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示,相关模型就能生成恐怖风格的背景音效。
2. 千脑计划启动
一项名为千脑计划(Thousand Brains Project)的宏伟新计划正式启动,其目标是开发一种全新的人工智能框架。千脑计划的名称灵感来自大脑皮层的结构;它由数千个所谓的皮质柱组成,每个皮质柱又分为多层神经元。人类大脑有大约 150,000 个皮质柱,每个皮质柱本质上都是自己的学习机器。
研究人员认为,深度网络本质上会生成一个单一的世界模型,逐步处理从简单特征到复杂对象的数据。一旦我们学会了如何构建一个皮质柱,我们就可以构建任意数量的皮质柱。
盖茨基金会将在两年内为千脑计划提供至少 269 万美元。
3. 文生视频制作工具
提供提示词,自动生成视频、自动配音、自动上字幕
4. 开源新闻汇总报告生成器
Agently新闻汇总报告生成器是一个基于Agently AI应用开发框架开发的应用项目。本项目构建了基于大语言模型驱动的全自动工作流,能够根据用户输入的主题关键词,自动完成新闻汇总报告的结构设计、栏目组稿(含新闻检索、筛查、总结、栏目信息撰写)及报告MarkDown格式文件的输出全过程。
项目地址:https://github.com/AgentEra/Agently-Daily-News-Collector