AI代码工具市场快速扩张,围绕其副作用的争议也在持续升温。图片来源:Shutterstock

随着AI代码工具迅速普及,开发者对这类工具的依赖正在持续加深,甚至已影响到相关生产力实验的开展。

据TechCrunch于5月29日(当地时间)报道,AI研究机构METR表示,部分开发者对AI工具的依赖程度已经高到不愿参与相关实验。

当前争议的核心,在于开发者对“效率提升”的主观感受与实际结果之间的落差。METR在2025年发布的一项针对开源开发者的研究,对比了不借助AI与使用AI工具辅助开发时的耗时差异。结果显示,参与者普遍认为AI提高了效率,但实际测量却得出相反结论:尽管代码生成更快,排查和修复问题、等待模型响应等环节耗时增加,最终拉长了整体开发时间。

METR原计划于2026年2月复现实验,以验证AI能力提升及开发者熟练度变化是否会改变结果,但最终不得不调整研究设计。原因在于,不少开发者明确表示不愿在不使用AI的条件下工作,对参与实验表现出明显抵触。此后,METR于5月改为面向技术岗位从业者开展问卷调查。调查结果显示,受访者普遍认为,AI让自己在组织中的价值提升了一倍。

不过在企业实际运营中,这类主观评价正受到越来越多质疑。今年以来流行的“Tokenmaxxing”,指的是把AI使用量、尤其是Token消耗,直接当作生产力指标。Amazon因员工过度运行AI代理而推高成本,已停止内部Token追踪排行榜“Kirorank”的运营。

The Information此前也报道称,Uber在2026年的AI预算在4个月内即告用尽。Uber首席运营官Andrew Macdonald表示,这些投入并未转化为项目成果,也没有带来相应的生产力提升。

也有观点认为,问题并不在于生成速度本身,而在于后续成本。程序员兼作者James Shore在Hacker News发文称,即便AI能将写代码速度提高一倍,也必须确认长期维护成本是否同步下降;否则,本质上只是以短期提速换来长期维护负担。其警示在于,AI快速生成的代码,最终仍需要由人长期接手和维护。

围绕这一问题,相关指标也开始出现。代理类创业公司EntelligenceAI创始人兼CEO Aishwarya Sankar称,企业消耗的Token中,有44%被用于修复由AI生成代码引发的bug。代码评审工具公司CodeRabbit则表示,其对开源Pull Request的分析显示,AI生成代码带来的问题数量为人工编写代码的1.7倍。不过,这些数据均来自相关工具供应商,本身也存在一定局限。

独立研究同样得出了相近结论。新加坡管理大学研究团队在4月发布的报告指出,AI生成代码可能在后续真实项目中带来长期维护成本。这意味着,AI或许能够在短期内提速,但并不必然带来长期收益。

在应对路径上,市场目前提出了两种不同方向:一是继续加大AI使用,二是重新界定人的角色。开发AI编码代理“Devin”的Cognition CEO Scott Wu认为,AI代理已经能够独立完成部分工作,但实际能力仍取决于任务类型,当前大致介于初级和中级开发者之间,尚未到可以完全托付工作的阶段。

相比之下,新加坡管理大学研究团队提出了更为保守的运营原则:开发者需要像理解编程语言一样,准确掌握AI的优势与局限,并建立面向AI的高标准质量保障体系;对于AI产出,应当像审查初级开发者代码一样进行细致审核,而软件架构、安全设计等全局性工作,仍应由人主导。

AI代码工具已经成为开发现场的基础工具,但其导入效果已很难仅凭“生产力提升”来判断。接下来,市场关注的重点或将从代码生成速度,进一步转向代码能否以更低成本完成长期维护与验证。

关键词

#AI代码工具 #开发者生产力 #METR #Tokenmaxxing #Amazon #Uber #Devin #Cognition #长期维护成本 #代码质量
版权所有 © DigitalToday。未经授权禁止转载或传播。