工具人的天花板！当我用Eagle DevAgent 做了一次Code Review

随着技术的不断更迭和进步，Eagle DevAgent将成为开发者的有力助手，帮助团队提高工作效率，尤其在企业级项目的代码评审上可以助团队一臂之力

clzz

1415人浏览 · 2024-12-27 09:51:03

clzz · 2024-12-27 09:51:03 发布

在实际开发中，使用AI工具时我们难免会有一些顾虑，主要来源于AI生成代码的过程、原理和结果的不可控性。其实，这种“不可控”特性，恰恰可以看作是技术创新的一个重要推动力。

如果把AI比作我们种的一棵番茄苗，提供充足的水分和养料之后，它肯定会长大，但最终能结多少番茄，果子好不好，未必完全能由我们控制。当然希望它枝繁叶茂、硕果累累，但它可能会因为光照和环境的因素，长出我们完全没有想到的样子。

这就是 AI 在生成代码时可能存在的不可控性。

在软件开发的过程中，有一个环节其实可以绕开 AI 生成代码的“不确定性”——代码评审（Code Review）。

一、AI做代码评审的效果

在代码评审中，我们通常关注三个方面：首先是代码风格；其次是功能完整性；最后是逻辑正确性。

其中，代码风格的评审难度最低。用Sonar工具辅助检查，找到代码格式上的问题通常很简单。

功能完整性的评审则需要开发者逐一讲解代码，结合需求文档进行对照分析，这个过程相对高效。

相比之下，逻辑正确性的检查则是最费时费力的部分。评审人员不仅需要深入理解需求，还要根据需求分析代码逻辑，确保代码本身没有问题，同时还需要考虑很多非功能性因素。

虽然我们可以通过Bug数等指标来记录代码评审的成果，但要真正监控评审质量，目前为止应该还没有特别靠谱的办法。

即便有了监控手段，不同的项目、功能和团队也会根据实际情况在质量和人力投入之间做出平衡。换句话说，开发过程中，代码评审的执行方式和效果需要根据实际情况做灵活调整。说白了，理想状态看上去很美，但实际中总会碰到各种限制，比如需求范围、人手分配、交付时间和质量这等等，总得排个优先级。

怎么办呢？我们不妨试试AI。

至少，用AI做代码评审就不用担心“生成代码”时的各种不确定性。而且，AI给出的修改建议通常一目了然，哪里重要先改哪里，一点也不拖泥带水。更绝的是，AI绝不会因为加班、挑刺或者被忽略而生气，真的是完美的“工具人天花板”！

Eagle DevAgent 就是这样一款能被你当成是性格温良态度一流的程序员同事的AI工具。接下来，我们一起看看Eagle DevAgent在这三类评审中的表现究竟如何。

1、代码风格

2、功能完整性检查

3、逻辑正确性检查

（说明：以上 GIF图均做了 2 倍速加速处理）

二、AI在代码评审中的检查点

代码风格和功能完整性的检查标准比较明确，技术上并没有太大难度，Eagle DevAgent在这方面的表现也非常稳定。但到了逻辑正确性这种目标不太清晰的场景，AI给出的评审建议又是怎么做出来的呢？根据实际使用经验，Eagle DevAgent 主要依靠两种方法来做判断：

1、看需求文档：如果有需求文档，Eagle DevAgent 会根据文档内容来评估代码的实现是否符合要求。

2、凭借自身模型能力：没有文档也不慌，Eagle DevAgent会依据自己的知识库和模型能力独立分析代码。

比如，前面在测试下单系统时，Eagle DevAgent 会自动扫描项目里的代码，找到像Order Controller 这样的模块，以及相关的用户故事和测试案例，然后根据需求给出优化建议。更有意思的是，它还能直接分析代码本身，独立发现需要改进的地方，比如提醒你完善异常处理、日志记录，或者优化高并发处理等非功能性细节。总之，它能做到的比你想象中还多。

三、一致性问题

所谓的一致性问题，或者叫“对齐问题”，是尤瓦尔·赫拉利在《智人之上——从石器时代到 AI 时代的信息网络简史》里提到的一个困扰人类社会数千年的难题。

赫拉利举了一个很典型的例子：假设我们给计算机设定了一个目标，比如“让YouTube的日活跃时间达到10亿小时”，计算机会尽力用各种方法实现这个目标。但由于计算机的运作方式和人类差异太大，计算机采取的方法往往会完全出乎人类预料，甚至可能带来意想不到的风险，偏离最初设定的目标。他还指出，所谓一致性问题的核心就是：我们奖励了A行为，却期望得到B结果。

其实，这个问题在很多场景下都很常见。就拿刚刚过去的双十一、双十二来说吧。我们既希望有更多用户来参加秒杀，又希望他们都只是分母。那么在设计系统时，到底应该先满足“让更多人参与”，还是“让秒杀更顺畅”呢？假如秒杀数量有限，参加的用户越多，抢不到的人就越多，失望和不满就会增加，购物流程也就会拉得更长。如何平衡这些目标，实现“既要又要还要”，这就涉及到一致性问题。

人和人的沟通，有时只需要一个眼神就足够，因为我们在日常生活中积累了共同的理解，让我们有深厚的共识。这些“看不见”的共识，在我们进行复杂交流时发挥着重要作用。

然而，当我们想让AI参与到这个过程中时，就遇到问题了——

· 如果我们想让AI完成某个功能，怎么向他描述需求？

· 我们表达的需求和真实的意图是不是一致的？

· AI经由算法生成的“共识”如何让我们理解？

· 人脑和AI在处理海量上下文信息时的差异有多大？

对于这些，我们目前都无法准确预见。再加上所谓的一致性问题以及使用者和AI在信息理解上的差异。

现阶段AI产出的效果和我们的需求，仍然会存在一些不匹配，或者说 AI 偶尔也会“犯错”。但是随着数据精准度的提高、上下文处理能力的增强，或者提示词的不断优化等技术进步，AI“犯错”的概率是能在可控范围内减少的。

基于以上的测试与分析，我们能相信，随着技术的不断更迭和进步，Eagle DevAgent将成为开发者的有力助手，帮助团队提高工作效率，尤其在企业级项目的代码评审上可以助团队一臂之力。