搜索关键词 推理成本
AI & Enterprise
NVIDIA与Google Cloud加码AI合作,推出NVIDIA Vera Rubin A5X裸金属实例
NVIDIA与Google Cloud正进一步扩大在智能体AI和物理AI领域的合作。双方计划在Google Cloud AI超级计算机上推出基于Vera Rubin的A5X裸金属实例,并结合ConnectX-9 SuperNIC与Google网络技术构建超大规模AI集群。除基础算力外,合作还将延伸至Gemini预览版本、机密虚拟机以及企业级AI平台集成。
AI & Enterprise
AI推理能耗激增,行业转向“后Transformer”架构
随着AI应用加速普及,电力需求持续上升,基于Transformer的大语言模型在算力和能耗方面的瓶颈日益突出。研究显示,部分推理模型单次长提示词推理耗电可超过33Wh。业界正将目光转向更重视能效的“后Transformer”架构,并强调其需具备与现有基础设施兼容的能力。
AI & Enterprise
OpenAI与Anthropic推进IPO筹备:算力与推理成本高企,现金消耗承压
OpenAI与Anthropic正以今年为目标推进IPO筹备,但高昂的模型训练和推理成本仍是两家公司面临的核心挑战。《华尔街日报》援引融资前披露的财务文件称,OpenAI预计到2028年仅AI研究相关算力支出就将达到1210亿美元,现金消耗或达850亿美元。尽管两家公司收入增长迅速,市场对其盈利前景、收入统计口径差异及成本结构的关注仍在升温。
-
AI & Enterprise
Gartner:Token单价大跌,企业AI总成本未必同步下降
-
AI & Enterprise
Xiaomi发布万亿参数模型MiMo-V2-Pro,瞄准低成本推理
-
Industry
NVIDIA在GTC 2026发布Vera Rubin并公布Groq 3 LPX,AI加速迈向制造、出行与医疗场景
-
Industry
据传NVIDIA Rubin CPX或改用HBM,GDDR7方案再添变数
-
Industry
NVIDIA第四财季营收681.3亿美元,创单季新高
-
AI & Enterprise
DRAM价格飙升,内存编排成AI基础设施降本新焦点
-
AI & Enterprise
Alibaba发布Qwen 3.5:称多项基准测试表现优于美国同类模型
-
Games & Commerce
Naver、Kakao业绩创新高,今年加速AI Agent商业化
-
Games & Commerce
Naver称AI搜索带动广告增长,增量贡献达55% 年内拟将覆盖范围扩大至当前两倍
-
AI & Enterprise
OpenAI去年ARR突破200亿美元,数据中心容量增至1.9GW
-
AI & Enterprise
韩国“独立AI基础模型”首轮评估出炉:Naver Cloud、NC AI未入围,政府将追加公开遴选1个团队
-
AI & Enterprise
NVIDIA公布Vera Rubin:训练所需规模降至Blackwell四分之一
-
Industry
NVIDIA发布新一代AI平台Rubin:每token推理成本降至Blackwell十分之一