欢迎访问我的网站,希望内容对您有用,感兴趣的可以加入我们的社群。

每日AI资讯-20240614

AI资讯 迷途小书童 1个月前 (06-14) 248次浏览 0个评论

1. AI视频新霸主诞生!Dream Machine

成立于2021年的Luma AI官宣了文生视频/图生视频模型Dream Machine,而且提供免费试用API,高质量的生成效果获得了很多网友的好评。

有网友输入相同的提示词,对比Pika、Runway和Dream Machine三个模型,他认为最终还是Luma赢了。

2. 吴恩达开源机器翻译智能体

人工智能著名学者、斯坦福大学教授吴恩达一直非常推崇智能体,曾在个人博客着重指出,AI 智能体工作流将会在今年推动人工智能取得长足进步,AI 智能体的未来潜力无限。

项目链接:https://github.com/andrewyng/translation-agent

这是一个使用 Python 演示的反思智能体工作流的机器翻译示例。主要步骤如下:

  • 输入 prompt,使大型语言模型(LLM)将文本从 source_language 翻译成 target_language
  • 让 LLM 反思翻译结果,并提出建设性的改进建议
  • 利用这些建议改进翻译

3. IDC发布大模型实测报告

全球领先的国际数据公司(IDC) 最新发布的大模型实测报告《中国大模型市场主流产品评估,2024》从基础能力到应用能力 7 大维度对 11 家大模型厂商的 16 款市场主流产品进行实测。

报告显示,百度文心大模型整体竞争力位于领先水平,产品能力处于第一梯队,是唯一一家在 7 大维度上均为优势厂商的企业。文心一言、文心一格在问答理解类、推理类、创作表达类、数学类、代码类等基础能力,toC 通用场景类、toB 特定行业类等应用能力等 7 大维度均具备领先优势。其他评测厂商中,阿里获 6 项优势维度,OpenAI GPT-4 和商汤分获 5 项。

IDC 测试题目也涵盖方方面面,分为基础能力和应用能力两个大类共 7 个维度:基础能力包括问答理解类、推理类、创作表达类、数学类、代码类;应用能力主要包含 toC 通用场景类和 toB 特定行业类,每一类单独计分。

4. 复旦推出通用智能体平台AgentGym

复旦大学语言与视觉团队推出的 AgentGym 平台,打通了大语言模型智能体「数据采样、训练微调、自我进化、能力评测」全流程。基于该平台提出的 AgentEvol 算法,首次探索了通用智能体的自我进化能力,并在多项智能体任务上表现非凡,与 GPT-4、Claude 等 SOTA 模型比肩。

AgentGym代码仓库: https://github.com/WooooDyy/AgentGym

喜欢 (0)

您必须 登录 才能发表评论!