大家好,我是小书童。
继 Devin
之后,又一个 AI
软件工程师出圈了。它就是 Genie
,号称目前地表最强,用官方的描述就是
它能够像人类工程师一样解决现实生活中的软件问题。
Genie
是迄今为止世界上最好的人工智能软件工程师。在行业标准基准 SWE-Bench
上得分为 30%,比之前亚马逊 Q
和 Factory
的 Code Droid
(两者在 SWE-Bench
上得分均为 19%)的 SOTA
得分高出 56%,Cognition
的 Devin
(在 SWE-Bench
基准的一小部分上得分为 13.8%)提高了 118%。由于 Devin
在 SWE-Bench
上的 2294 项任务中只跑了 500 项,它的分数为 3.44%。
下面,我们通过官方的介绍来看看 Genie
到底强在哪?
Genie
通过直接与 GitHub
问题跟踪器集成,大大简化了工作流程。通过导入问题,Genie
确保完全理解特定任务和目标。集成使 Genie
能够基于问题的要求创建工作的详细规范,减少手动输入,并使其能够立即从您的 GitHub
问题中解决复杂问题。
Genie
配备了一套全面的工具套件,旨在与您的代码库和外部来源无缝集成。不管是文件搜索、文件夹搜索、互联网搜索还是执行 git
命令,Genie
都有能力应对各种挑战。借鉴了对数百万开发者决策的培训,Genie
擅长为每项任务选择最合适的工具。这确保了每个问题都能以精确和高效的方式解决,提升开发工作流程。
规划是成功软件开发的基石,Genie
在这方面表现出色。一旦收集到必要的上下文,Genie
就能构建一个详细和结构化的计划,精确地描述每个步骤。这个计划融合了先进的 RAG
和工具选择,确保每个方面都根据项目独特的要求进行定制。
Genie
的编码能力大大领先于其它大模型。它在大量数据集上进行训练,生成符合项目风格和架构的高质量代码。Genie
执行原地编辑,无需进行不必要的重写即可无缝地优化您的代码。
验证在软件开发中至关重要。通过运行全面的测试并分析结果,Genie
确保其解决方案的可靠性。当初始尝试不足时,Genie
会自动迭代、重新规划并重新执行,直到成功。这种持续改进的循环,得益于 Genie
的上下文窗口支持,确保代码的稳健和可靠。
赶快加入试用队列试用吧,地址是:https://cosine.sh/register 。
让人惊讶的是,目前公司团队只有5个人,真的太牛了。