搜索关键词 推理市场
AI & Enterprise
Cerebras上线Kimi K2.6企业级推理服务:速度达981 token/s
AI芯片设计公司Cerebras宣布,将拥有1万亿参数的Kimi K2.6开源权重模型引入企业级推理服务,实测推理速度达到981 token/s。在1万token输入、500 token输出的测试中,完整响应时间仅为5.6秒,而Kimi官方API端点为163.7秒。与此同时,Cerebras在上市申报文件中披露其2025年营收为5.1亿美元、净利润2.38亿美元,并已与OpenAI、AWS达成长期合作。
Industry
Semifive与ICY Tech基于Samsung Foundry 8nm eMRAM的边缘AI芯片成功流片
Semifive与ICY Tech宣布,基于Samsung Foundry 8nm eMRAM工艺的边缘AI芯片已完成流片。双方表示,这是亚洲首个8nm eMRAM用于商用量产产品的案例。该项目将ICY Tech的PNM技术与Semifive的SoC设计平台结合,支持在设备端离线运行最高20亿(2B)参数模型,应用场景涵盖AI PC、私有AI代理和机器人等。
AI & Enterprise
FT:Huawei今年有望跃居中国AI芯片市场份额首位,收入或增长超过60%
据英国《金融时报》报道,Huawei今年有望在中国AI芯片市场占据最大份额,主要受益于中国科技企业对最新Ascend 950PR处理器的大规模采购。按目前在手订单估算,Huawei今年AI芯片收入或达120亿美元,较2025年的75亿美元增长超过60%。在中美双方监管限制下,NVIDIA在中国市场的出货仍面临阻碍。
-
AI & Enterprise
韩国推进“K-Nvidia培育项目”,拟借“国民增长基金”加码AI半导体
-
AI & Enterprise
Jensen Huang:企业都应布局OpenClaw和Agentic systems,“这就是新的计算机”
-
Industry
NVIDIA拟于3月发布AI推理专用芯片 或在GTC亮相
-
Industry
据传NVIDIA Rubin CPX或改用HBM,GDDR7方案再添变数
-
Industry
AccessLab推出Arm服务器V-Raptor Q100,搭载Qualcomm Technologies AI推理卡
-
AI & Enterprise
AI并购持续升温:Nvidia、Meta、SoftBank接连出手
-
AI & Enterprise
NVIDIA据称拟以约200亿美元收购Groq,瞄准AI推理基础设施新空间