AI代码工具普及加深依赖：开发者体感提效，实测却未必更快

AI代码工具市场快速扩张，围绕其副作用的争议也在持续升温。图片来源：Shutterstock

随着AI代码工具迅速普及，开发者对这类工具的依赖正在持续加深，甚至已影响到相关生产力实验的开展。

据TechCrunch于5月29日（当地时间）报道，AI研究机构METR表示，部分开发者对AI工具的依赖程度已经高到不愿参与相关实验。

当前争议的核心，在于开发者对“效率提升”的主观感受与实际结果之间的落差。METR在2025年发布的一项针对开源开发者的研究，对比了不借助AI与使用AI工具辅助开发时的耗时差异。结果显示，参与者普遍认为AI提高了效率，但实际测量却得出相反结论：尽管代码生成更快，排查和修复问题、等待模型响应等环节耗时增加，最终拉长了整体开发时间。

METR原计划于2026年2月复现实验，以验证AI能力提升及开发者熟练度变化是否会改变结果，但最终不得不调整研究设计。原因在于，不少开发者明确表示不愿在不使用AI的条件下工作，对参与实验表现出明显抵触。此后，METR于5月改为面向技术岗位从业者开展问卷调查。调查结果显示，受访者普遍认为，AI让自己在组织中的价值提升了一倍。

不过在企业实际运营中，这类主观评价正受到越来越多质疑。今年以来流行的“Tokenmaxxing”，指的是把AI使用量、尤其是Token消耗，直接当作生产力指标。Amazon因员工过度运行AI代理而推高成本，已停止内部Token追踪排行榜“Kirorank”的运营。

The Information此前也报道称，Uber在2026年的AI预算在4个月内即告用尽。Uber首席运营官Andrew Macdonald表示，这些投入并未转化为项目成果，也没有带来相应的生产力提升。

也有观点认为，问题并不在于生成速度本身，而在于后续成本。程序员兼作者James Shore在Hacker News发文称，即便AI能将写代码速度提高一倍，也必须确认长期维护成本是否同步下降；否则，本质上只是以短期提速换来长期维护负担。其警示在于，AI快速生成的代码，最终仍需要由人长期接手和维护。

围绕这一问题，相关指标也开始出现。代理类创业公司EntelligenceAI创始人兼CEO Aishwarya Sankar称，企业消耗的Token中，有44%被用于修复由AI生成代码引发的bug。代码评审工具公司CodeRabbit则表示，其对开源Pull Request的分析显示，AI生成代码带来的问题数量为人工编写代码的1.7倍。不过，这些数据均来自相关工具供应商，本身也存在一定局限。

独立研究同样得出了相近结论。新加坡管理大学研究团队在4月发布的报告指出，AI生成代码可能在后续真实项目中带来长期维护成本。这意味着，AI或许能够在短期内提速，但并不必然带来长期收益。

在应对路径上，市场目前提出了两种不同方向：一是继续加大AI使用，二是重新界定人的角色。开发AI编码代理“Devin”的Cognition CEO Scott Wu认为，AI代理已经能够独立完成部分工作，但实际能力仍取决于任务类型，当前大致介于初级和中级开发者之间，尚未到可以完全托付工作的阶段。

相比之下，新加坡管理大学研究团队提出了更为保守的运营原则：开发者需要像理解编程语言一样，准确掌握AI的优势与局限，并建立面向AI的高标准质量保障体系；对于AI产出，应当像审查初级开发者代码一样进行细致审核，而软件架构、安全设计等全局性工作，仍应由人主导。

AI代码工具已经成为开发现场的基础工具，但其导入效果已很难仅凭“生产力提升”来判断。接下来，市场关注的重点或将从代码生成速度，进一步转向代码能否以更低成本完成长期维护与验证。

Yoonseo Lee yslee@d-today.co.kr

关键词