Red Hat将llm-d接入SoftBank AI-RAN编排器AITRAS

生成中...

Chi-gyu Hwang

发布时间 2026-03-10 15:20:22

搜索关键词

Red Hat于3月10日宣布，已与SoftBank Corp.合作，将开源框架llm-d集成到SoftBank AI-RAN编排器AITRAS中。

据介绍，llm-d由包括Red Hat在内的多家企业联合发起，面向无线接入网（RAN）环境，支持对大语言模型（LLM）推理进行动态、智能的分布式处理，以提升性能和效率。

Red Hat表示，随着AI-RAN技术加快落地，电信运营商关注的重点已不再只是将AI与RAN部署在同一硬件平台上，而是进一步转向如何实现高效管理和规模化扩展。

该公司指出，要推动AI-RAN走向商用，运营商需要以运行云原生网络功能（CNF）及相关应用的同等灵活性来承载AI工作负载。

基于这一需求，Red Hat正与SoftBank推进基于llm-d和vLLM的AI-RAN合作。

其中，vLLM支持在单个GPU节点上部署高性能模型，已成为AI推理领域的重要开源项目。但在复杂的多节点环境下，其部署和管理能力仍有一定局限。llm-d正是为解决这一问题而开发，可通过Kubernetes在多节点之间编排vLLM，将其能力扩展至分布式环境，并支持生产环境中的AI推理运行。

Chi-gyu Hwang delight@d-today.co.kr