搜索关键词 推理速度
AI & Enterprise
Cerebras上线Kimi K2.6企业级推理服务:速度达981 token/s
AI芯片设计公司Cerebras宣布,将拥有1万亿参数的Kimi K2.6开源权重模型引入企业级推理服务,实测推理速度达到981 token/s。在1万token输入、500 token输出的测试中,完整响应时间仅为5.6秒,而Kimi官方API端点为163.7秒。与此同时,Cerebras在上市申报文件中披露其2025年营收为5.1亿美元、净利润2.38亿美元,并已与OpenAI、AWS达成长期合作。
AI & Enterprise
Red Hat发布Red Hat AI 3.4:推理速度最高提升至3倍,拓展航天与汽车合作
Red Hat在Red Hat Summit 2026上发布Red Hat AI 3.4,进一步强化大规模AI推理和Agentic AI的部署能力。新版本新增模型服务,并引入“推测解码”技术,可将推理速度最高提升至3倍。与此同时,Red Hat还扩大了与NVIDIA、Voyager Technologies及Nissan的合作,布局航天计算和软件定义车辆等领域。
AI & Enterprise
Kakao一季度营收和营业利润双双创同期新高,加速将KakaoTalk升级为Agentic AI平台
Kakao公布2026年第一季度业绩:合并营收1.9421万亿韩元、营业利润2114亿韩元,均创历史同期新高。公司表示,平台业务增长与运营效率提升共同推动盈利改善,并将加快推进KakaoTalk向Agentic AI平台升级,年内推出1500亿参数的Kanana 2.5并拓展相关服务与合作,预计到年底可使用Kanana的用户规模将达到3100万。
-
AI & Enterprise
Google发布Gemma 4开放权重模型,可在低功耗设备端本地运行复杂推理
-
Industry
Google推出TurboQuant压缩KV缓存,SK hynix、Samsung Electronics等存储股走低
-
AI & Enterprise
iPhone本地运行近400B参数大模型迎来新进展
-
AI & Enterprise
Gimlet Labs完成8000万美元A轮融资,发力“多芯片推理云”
-
AI & Enterprise
Qualcomm发布Snapdragon Wear Elite:3nm可穿戴旗舰芯片,CPU性能最高可提升5倍
-
AI & Enterprise
OpenAI发布GPT-5.3 Codex,主打“代理式编码”瞄准AI编程赛道
-
AI & Enterprise
LG AI Research发布自主基础模型K-EXAONE:政府项目首轮测评平均得分72分