欢迎访问我的网站,希望内容对您有用,感兴趣的可以加入我们的社群。

地表最强AI软件工程师–Genie

AIGC 迷途小书童 1个月前 (08-14) 215次浏览 0个评论

大家好,我是小书童。

Devin 之后,又一个 AI 软件工程师出圈了。它就是 Genie,号称目前地表最强,用官方的描述就是

它能够像人类工程师一样解决现实生活中的软件问题。

Genie 是迄今为止世界上最好的人工智能软件工程师。在行业标准基准 SWE-Bench 上得分为 30%,比之前亚马逊 QFactoryCode Droid(两者在 SWE-Bench 上得分均为 19%)的 SOTA 得分高出 56%,CognitionDevin(在 SWE-Bench 基准的一小部分上得分为 13.8%)提高了 118%。由于 DevinSWE-Bench 上的 2294 项任务中只跑了 500 项,它的分数为 3.44%。

下面,我们通过官方的介绍来看看 Genie 到底强在哪?

Genie 通过直接与 GitHub 问题跟踪器集成,大大简化了工作流程。通过导入问题,Genie 确保完全理解特定任务和目标。集成使 Genie 能够基于问题的要求创建工作的详细规范,减少手动输入,并使其能够立即从您的 GitHub 问题中解决复杂问题。

Genie 配备了一套全面的工具套件,旨在与您的代码库和外部来源无缝集成。不管是文件搜索、文件夹搜索、互联网搜索还是执行 git 命令,Genie 都有能力应对各种挑战。借鉴了对数百万开发者决策的培训,Genie 擅长为每项任务选择最合适的工具。这确保了每个问题都能以精确和高效的方式解决,提升开发工作流程。

规划是成功软件开发的基石,Genie 在这方面表现出色。一旦收集到必要的上下文,Genie 就能构建一个详细和结构化的计划,精确地描述每个步骤。这个计划融合了先进的 RAG 和工具选择,确保每个方面都根据项目独特的要求进行定制。

Genie 的编码能力大大领先于其它大模型。它在大量数据集上进行训练,生成符合项目风格和架构的高质量代码。Genie 执行原地编辑,无需进行不必要的重写即可无缝地优化您的代码。

验证在软件开发中至关重要。通过运行全面的测试并分析结果,Genie 确保其解决方案的可靠性。当初始尝试不足时,Genie 会自动迭代、重新规划并重新执行,直到成功。这种持续改进的循环,得益于 Genie 的上下文窗口支持,确保代码的稳健和可靠。

赶快加入试用队列试用吧,地址是:https://cosine.sh/register

让人惊讶的是,目前公司团队只有5个人,真的太牛了。

喜欢 (1)

您必须 登录 才能发表评论!