地表最强AI软件工程师-Genie - 迷途小书童的Note迷途小书童的Note

大家好，我是小书童。

继 Devin 之后，又一个 AI 软件工程师出圈了。它就是 Genie，号称目前地表最强，用官方的描述就是

它能够像人类工程师一样解决现实生活中的软件问题。

Genie 是迄今为止世界上最好的人工智能软件工程师。在行业标准基准 SWE-Bench 上得分为 30%，比之前亚马逊 Q 和 Factory 的 Code Droid（两者在 SWE-Bench 上得分均为 19%）的 SOTA 得分高出 56%，Cognition 的 Devin（在 SWE-Bench 基准的一小部分上得分为 13.8%）提高了 118%。由于 Devin 在 SWE-Bench 上的 2294 项任务中只跑了 500 项，它的分数为 3.44%。

下面，我们通过官方的介绍来看看 Genie 到底强在哪？

Genie 通过直接与 GitHub 问题跟踪器集成，大大简化了工作流程。通过导入问题，Genie 确保完全理解特定任务和目标。集成使 Genie 能够基于问题的要求创建工作的详细规范，减少手动输入，并使其能够立即从您的 GitHub 问题中解决复杂问题。

Genie 配备了一套全面的工具套件，旨在与您的代码库和外部来源无缝集成。不管是文件搜索、文件夹搜索、互联网搜索还是执行 git 命令，Genie 都有能力应对各种挑战。借鉴了对数百万开发者决策的培训，Genie 擅长为每项任务选择最合适的工具。这确保了每个问题都能以精确和高效的方式解决，提升开发工作流程。

规划是成功软件开发的基石，Genie 在这方面表现出色。一旦收集到必要的上下文，Genie 就能构建一个详细和结构化的计划，精确地描述每个步骤。这个计划融合了先进的 RAG 和工具选择，确保每个方面都根据项目独特的要求进行定制。