图片来源:Shutterstock

能够在较少人工干预下自动完成特定任务的AI代理,近来持续成为社交平台和科技社区的热门话题。围绕“让AI代劳”的各种使用案例不断涌现,也进一步推高了市场关注度。

不少AI领域人士预计,AI代理未来可能替代部分白领岗位。一些企业甚至已将其作为裁员的理由。以“AI转型”为由宣布裁减40%员工的金融科技公司Block,便被视为代表性案例之一。

今年1月,AI代理热度进一步升温。开源AI代理工具OpenClaw上线后迅速受到关注,基于OpenClaw构建的AI代理社交平台Maltbook也在全球科技圈引发讨论。随后,OpenClaw开发者加入OpenAI,以及Meta收购Maltbook,被视为AI代理赛道加速重组的标志性事件。

除OpenAI和Meta外,Google、Anthropic、Perplexity、Shortwave等多家硅谷科技公司也在推进面向企业市场的AI代理产品开发。

不过,随着应用扩展,市场对AI代理缺陷及潜在风险的担忧也在同步升温。

与聊天机器人类似,AI代理同样会出错。而一旦将关键任务直接交由其自主处理,后果往往比普通问答类错误更严重。无论是自动发送邮件,还是编辑文件、处理日程,出现失误后都可能带来较高的善后成本。

Meta研究员Summer Yue近日透露,她曾让AI代理帮助整理邮箱,结果系统在处理过程中开始删除推荐邮件。这一案例也再次引发外界对AI代理可靠性的讨论。

对普通用户而言,OpenClaw这类AI代理工具的使用门槛也并不低。《纽约时报》近日报道,经营一家营销公司的Bill Cutler为了使用OpenClaw投入了数周时间。他表示,无论是前期配置还是实际使用都相当困难,并直言这项技术“噱头大于实用”。

在企业场景中,被认为相对更可靠的产品也并非没有问题。Anthropic提供的Claude CoWork被认为在金融、医疗、法律等领域的研究任务中表现优于OpenClaw,但其不可预测性依然存在。

AI测试公司Vals AI表示,在一项测试中,Claude CoWork在执行文件编辑任务时,曾出现将文件永久损坏的情况。

《纽约时报》援引的多个案例显示,AI代理在部分场景下确实已经具备一定实用价值,但还远未到可以把工作完全交给AI处理的阶段。

骨科创伤专科医生、同时经营医疗科技初创公司的Dr. Christian Pean,就在使用Claude Code生成研究报告和电子表格、汇总邮件并撰写回复草稿。他表示,自己已借助Claude Code将生活中的许多事务自动化,几乎把它当作“幕僚长”使用。

不过,即便如此,他仍会逐项核对AI完成的工作,并强调“如果没有经过我事先批准,我不会让它发送邮件”。

在他看来,AI代理往往表现得十分自信,也确实能拿出一些令人印象深刻的成果。但如果使用者缺乏核验输出内容的专业能力,就很容易忽略其中不实信息或“幻觉”。

《纽约时报》还提到初创公司创始人Sebastian Heinemann的一次经历。今年1月,为准备在世界经济论坛上发言,他让AI代理协助安排相关日程。就在他睡觉期间,AI代理自行在网上寻找与论坛相关的人士,并就争取发言机会展开沟通。

报道称,AI代理随后与一名瑞士商人进行了长时间对话,并最终促成了相关安排。但当Heinemann醒来后却发现,事情并未按最初指令推进,反而变得颇为尴尬:AI代理在未经充分确认的情况下,擅自同意支付约3.1万美元的企业赞助费用。

此后,他不得不告知主办方自己无力承担这笔费用,而对方回复称,如不支付则无法参会。最终,据《纽约时报》报道,他仅为到场参会支付了约4600美元。

关键词

#AI代理 #OpenClaw #Maltbook #OpenAI #Meta #Google #Anthropic #Perplexity #Shortwave #Vals AI #Claude CoWork #Claude Code #Block
版权所有 © DigitalToday。未经授权禁止转载或传播。