搜索关键词 万亿参数
AI & Enterprise
Cerebras上线Kimi K2.6企业级推理服务:速度达981 token/s
AI芯片设计公司Cerebras宣布,将拥有1万亿参数的Kimi K2.6开源权重模型引入企业级推理服务,实测推理速度达到981 token/s。在1万token输入、500 token输出的测试中,完整响应时间仅为5.6秒,而Kimi官方API端点为163.7秒。与此同时,Cerebras在上市申报文件中披露其2025年营收为5.1亿美元、净利润2.38亿美元,并已与OpenAI、AWS达成长期合作。
AI & Enterprise
日本加速布局AI生态:Station Ai携手SoftBank、NVIDIA扶持初创,Microsoft将投1.6万亿日元
日本正通过与全球科技企业深化合作,提升本土AI产业竞争力。Station Ai联合SoftBank、NVIDIA推出“AI Boost Program”,将为5家AI初创企业提供GPU资源、工程支持及业务对接服务;Microsoft也宣布将于2026年至2029年在日本投资1.6万亿日元。与此同时,日本政府计划自2026财年起5年内投入1万亿日元,支持1万亿参数基础模型研发。
AI & Enterprise
DeepSeek发布V4系列模型:开源低价,对标Opus 4.7和GPT-5.5
中国AI公司DeepSeek推出V4系列模型,主打开源和低价。其中,V4 Pro采用1.6万亿参数MoE架构,支持100万token上下文;V4 Pro和V4 Flash均基于约33万亿token完成训练,多项基准测试表现接近Opus 4.7和GPT-5.5。市场分析认为,其性价比优势或推动企业采用,但地缘政治和使用依赖风险仍需关注。
-
AI & Enterprise
中国AI企业减少最新模型开源,转向云平台和API商业化
-
AI & Enterprise
Gartner:Token单价大跌,企业AI总成本未必同步下降
-
AI & Enterprise
Xiaomi发布万亿参数模型MiMo-V2-Pro,瞄准低成本推理
-
Industry
NVIDIA在GTC 2026发布Vera Rubin并公布Groq 3 LPX,AI加速迈向制造、出行与医疗场景
-
AI & Enterprise
NVIDIA转向机架级AI系统设计:从GPU销售迈向AI工厂布局
-
AI & Enterprise
SambaNova洽谈超过3.5亿美元新融资,Intel或投1.5亿美元