搜索关键词 Kimi-K2.6
AI & Enterprise
NVIDIA发布5500亿参数开源大模型Nemotron 3 Ultra,Vera Rubin平台进入量产阶段
NVIDIA发布参数规模达5500亿的开源大模型Nemotron 3 Ultra,并表示将于本周正式开源发布。与此同时,下一代AI服务器平台Vera Rubin也已进入量产阶段,以Rubin GPU和自研Vera CPU为核心,瞄准企业级AI及Agent AI带动的数据中心需求。
AI & Enterprise
Cerebras上线Kimi K2.6企业级推理服务:速度达981 token/s
AI芯片设计公司Cerebras宣布,将拥有1万亿参数的Kimi K2.6开源权重模型引入企业级推理服务,实测推理速度达到981 token/s。在1万token输入、500 token输出的测试中,完整响应时间仅为5.6秒,而Kimi官方API端点为163.7秒。与此同时,Cerebras在上市申报文件中披露其2025年营收为5.1亿美元、净利润2.38亿美元,并已与OpenAI、AWS达成长期合作。
AI & Enterprise
“AI IQ”上线:用单一分数比较GPT-5.5、Gemini和Claude等模型
工程师兼创业者Ryan Shay推出“AI IQ”项目,将多项公开基准成绩换算为“估算IQ”并汇总为单一分数,用于比较GPT-5.5、Gemini、Claude等主流模型。该项目还提供时间趋势、厂商分组和成本测算等视图,但以单一分数概括模型能力的做法也引发争议。