AGI、LLM、幻觉、Token热度攀升，TechCrunch盘点AI核心术语

随着生成式人工智能（AI）快速普及，通用人工智能（AGI）、大语言模型（LLM）、幻觉、Token等技术术语，正逐渐成为AI行业的通用语言。在讨论研究进展、产品能力、基础设施和安全风险时，这些概念已被广泛使用。业内普遍认为，理解这些术语，有助于更准确地把握企业战略和市场动向。

据TechCrunch近日报道，随着生成式AI应用持续扩张，围绕AI的核心术语也愈发频繁地出现在产业一线。该媒体对多项常见AI概念的定义及适用场景进行了集中梳理。

其中，最具代表性的概念之一是LLM。LLM即大语言模型，是ChatGPT、Claude、Gemini、Llama、Copilot等AI聊天产品的底层基础。用户提出问题后，模型会基于训练中学习到的大量文本模式，按概率逐步预测下一个Token，并生成相应回答。需要区分的是，服务名称与模型名称并不总是一致。比如，GPT是OpenAI的模型名称，而ChatGPT则是基于该模型推出的服务。

另一项高频出现的概念是AGI，但这一术语至今仍没有统一定义。OpenAI首席执行官Sam Altman近期将AGI描述为“可以雇来一起工作的、相当于中等水平人类的系统”。Google DeepMind则更强调，AGI应当能够广泛完成接近人类水平的认知任务。即便是在行业前沿，对AGI的理解也仍存在明显分歧。

近期在产品竞争中被频繁提及的，还有AI代理（AI Agent）。这一概念不再局限于对话式聊天机器人，而是指能够替代人类完成报销处理、预约、编写代码、维护等多步骤任务的系统。不过，AI代理同样缺乏统一定义，相关基础设施也仍处于建设阶段。目前业内更关注的方向，是通过编排多个AI系统，自动完成多步骤工作流。

要理解模型能力，还需要区分“训练”和“推理”。训练，是指向模型输入数据并让其学习模式的过程；推理，则是模型在完成训练后，面向实际应用对输入作出预测和响应的过程。训练通常需要大量数据和算力，成本较高；推理则直接关系到服务阶段的响应速度和使用成本。从智能手机芯片到高性能图形处理器（GPU），再到专用AI加速器，均可承担推理任务。但模型规模越大，对高性能基础设施的依赖也越强。

在这一背景下，算力和存储芯片被视为AI产业的重要瓶颈。业界通常用“Compute”统称支撑AI模型训练、推理和部署所需的计算资源，其中包括GPU、中央处理器（CPU）、张量处理器（TPU）等硬件。

在AI安全层面，“幻觉”（Hallucination）被认为是最直接的风险之一。所谓幻觉，是指模型生成看似合理、实则并不符合事实的信息。在医疗健康等可能带来现实风险的领域，这一问题尤其突出。这也是许多生成式AI服务要求用户自行核验结果的重要原因。基于这一现实，面向特定行业的专用AI模型开发近期也受到更多关注。

另一个与使用成本密切相关的指标是Token。Token是对用户输入和模型输出进行拆分后的数据单位，通常可分为输入Token、输出Token和推理Token等。在企业级AI服务中，Token消耗量往往直接决定计费水平。企业调用AI服务越频繁，处理的Token越多，相关费用也会随之上升。

整体来看，理解AI产业，不能只停留在产品名称层面，更要先弄清这些术语本身的含义。无论是定义仍存分歧的AGI，还是因实现程度不同而内涵不断变化的AI代理，抑或尚未得到根本解决的“幻觉”风险，都是观察生成式AI产业走向的重要切口。随着生成式AI持续扩散，对这些概念的理解，也将成为解读行业趋势和厂商策略的基础。

Yoonseo Lee yslee@d-today.co.kr

关键词