随着生成式人工智能(AI)快速普及,通用人工智能(AGI)、大语言模型(LLM)、幻觉、Token等技术术语,正逐渐成为AI行业的通用语言。在讨论研究进展、产品能力、基础设施和安全风险时,这些概念已被广泛使用。业内普遍认为,理解这些术语,有助于更准确地把握企业战略和市场动向。
据TechCrunch近日报道,随着生成式AI应用持续扩张,围绕AI的核心术语也愈发频繁地出现在产业一线。该媒体对多项常见AI概念的定义及适用场景进行了集中梳理。
其中,最具代表性的概念之一是LLM。LLM即大语言模型,是ChatGPT、Claude、Gemini、Llama、Copilot等AI聊天产品的底层基础。用户提出问题后,模型会基于训练中学习到的大量文本模式,按概率逐步预测下一个Token,并生成相应回答。需要区分的是,服务名称与模型名称并不总是一致。比如,GPT是OpenAI的模型名称,而ChatGPT则是基于该模型推出的服务。
另一项高频出现的概念是AGI,但这一术语至今仍没有统一定义。OpenAI首席执行官Sam Altman近期将AGI描述为“可以雇来一起工作的、相当于中等水平人类的系统”。Google DeepMind则更强调,AGI应当能够广泛完成接近人类水平的认知任务。即便是在行业前沿,对AGI的理解也仍存在明显分歧。
近期在产品竞争中被频繁提及的,还有AI代理(AI Agent)。这一概念不再局限于对话式聊天机器人,而是指能够替代人类完成报销处理、预约、编写代码、维护等多步骤任务的系统。不过,AI代理同样缺乏统一定义,相关基础设施也仍处于建设阶段。目前业内更关注的方向,是通过编排多个AI系统,自动完成多步骤工作流。
要理解模型能力,还需要区分“训练”和“推理”。训练,是指向模型输入数据并让其学习模式的过程;推理,则是模型在完成训练后,面向实际应用对输入作出预测和响应的过程。训练通常需要大量数据和算力,成本较高;推理则直接关系到服务阶段的响应速度和使用成本。从智能手机芯片到高性能图形处理器(GPU),再到专用AI加速器,均可承担推理任务。但模型规模越大,对高性能基础设施的依赖也越强。
在这一背景下,算力和存储芯片被视为AI产业的重要瓶颈。业界通常用“Compute”统称支撑AI模型训练、推理和部署所需的计算资源,其中包括GPU、中央处理器(CPU)、张量处理器(TPU)等硬件。
在AI安全层面,“幻觉”(Hallucination)被认为是最直接的风险之一。所谓幻觉,是指模型生成看似合理、实则并不符合事实的信息。在医疗健康等可能带来现实风险的领域,这一问题尤其突出。这也是许多生成式AI服务要求用户自行核验结果的重要原因。基于这一现实,面向特定行业的专用AI模型开发近期也受到更多关注。
另一个与使用成本密切相关的指标是Token。Token是对用户输入和模型输出进行拆分后的数据单位,通常可分为输入Token、输出Token和推理Token等。在企业级AI服务中,Token消耗量往往直接决定计费水平。企业调用AI服务越频繁,处理的Token越多,相关费用也会随之上升。
整体来看,理解AI产业,不能只停留在产品名称层面,更要先弄清这些术语本身的含义。无论是定义仍存分歧的AGI,还是因实现程度不同而内涵不断变化的AI代理,抑或尚未得到根本解决的“幻觉”风险,都是观察生成式AI产业走向的重要切口。随着生成式AI持续扩散,对这些概念的理解,也将成为解读行业趋势和厂商策略的基础。