搜索关键词 MoE模型
Industry
NVIDIA:AI芯片竞争转向端到端效率,Blackwell在MoE推理中较上一代Hopper快55倍
NVIDIA在首尔举行的开发者活动上表示,AI竞争重心正从单一芯片参数比拼转向覆盖预训练、后训练、推理及Agent应用的端到端效率。公司首次披露实测数据称,Blackwell GPU在混合专家(MoE)推理中的速度较上一代Hopper提升55倍,并介绍了NDFP4、PivotLM、NemoTron Cascade等多项提升训练与后训练效率的新进展。
Industry
NVIDIA在GTC 2026发布Vera Rubin并公布Groq 3 LPX,AI加速迈向制造、出行与医疗场景
在GTC 2026上,NVIDIA集中发布Vera Rubin平台、公布Groq 3 LPX推理架构以及Physical AI相关蓝图,并给出token成本降至原来十分之一、推理吞吐显著提升等关键指标。与此同时,全球AI工厂累计部署GPU已超过100万颗,业务布局也从数据中心进一步延伸至制造、道路出行和医疗等应用场景。Samsung Electronics、SK hynix等企业则在HBM与代工等环节提升参与度。
Games & Commerce
Kakao将AI组织整合至“AI Studio”体系,Jeong Sina兼任负责人
Kakao宣布对公司AI组织进行整合,统一纳入“AI Studio”体系,并由CEO Jeong Sina兼任AI Studio负责人直接统筹。公司表示,过去一年“Kanana”与AI Studio并行推进的实践表明,小团队快速验证MVP更贴近市场需求。此次调整后,模型研究组织也将全面转向工作室制,以加快AI技术向服务落地的转化速度。