搜索关键词 低时延
AI & Enterprise
AI智能体兴起,AI基础设施重心转向CPU
随着AI智能体加速普及,长期由GPU主导的AI基础设施正逐步将重心转向CPU。Amazon News指出,智能体在执行多步骤任务时,除推理外还会产生大量逻辑处理、文件处理、网络调用和代码执行需求;AWS Graviton主要面向常驻运行、低时延负载,用于支撑高频工具调用和执行循环。
Industry
NVIDIA:AI芯片竞争转向端到端效率,Blackwell在MoE推理中较上一代Hopper快55倍
NVIDIA在首尔举行的开发者活动上表示,AI竞争重心正从单一芯片参数比拼转向覆盖预训练、后训练、推理及Agent应用的端到端效率。公司首次披露实测数据称,Blackwell GPU在混合专家(MoE)推理中的速度较上一代Hopper提升55倍,并介绍了NDFP4、PivotLM、NemoTron Cascade等多项提升训练与后训练效率的新进展。
AI & Enterprise
Databricks高管:企业AI选型更看重成本和时延,开源小模型更受青睐
Databricks高级副总裁David Meyer表示,前沿大模型虽然更擅长处理复杂任务,但在单据纠错等企业基础流程中,往往会直接改写错误内容,而不是识别并标记问题项。随着企业对高并发、低成本和低时延的需求上升,经过强化学习优化的开源小模型以及多模型协同方案正更受青睐,企业级AI竞争焦点也正从模型规模转向实际运行效率与单位成本。
-
AI & Enterprise
Oracle携手AWS推出私有直连服务,实现OCI与AWS云基础设施互联
-
AI & Enterprise
Lenovo完成收购Infinidat,强化企业级存储布局
-
Games & Commerce
Razer 推出 Hammerhead V3 HyperSpeed 真无线游戏耳机:主打低时延与多设备切换
-
AI & Enterprise
上海近海海底数据中心投运:直连海上风电,规划容量24MW
-
Telecommunications & Media
SK Telecom提速“AI高速公路”布局 年内推动5G SA商用落地
-
Industry
Lenovo推出两款ThinkEdge工业边缘AI新品,加码工业现场应用
-
AI & Enterprise
ITCEN CLOIT获“华城AI自动驾驶枢纽”贡献奖
-
AI & Enterprise
LG Uplus与LG Electronics达成6G合作,联合推进AI通信技术标准化
-
Telecommunications & Media
Apple推出Safari 26.4:新增44项WebKit功能,修复191项问题
-
AI & Enterprise
Samsung SDS上线韩国首个B300 GPUaaS,瞄准企业级AI推理
-
Industry
Qualcomm:AI将成为新的UI,端侧AI版图从手机拓展至PC
-
AI & Enterprise
NVIDIA发布Groq 3 LPU,瞄准多智能体推理
-
Industry
Jensen Huang到访GTC 2026 Samsung Electronics展台,并为HBM4与Groq晶圆签名
-
AI & Enterprise
NVIDIA与Palantir联手布局主权AI,推出AIOS-RA参考架构
-
Telecommunications & Media
AI与6G共振,智能眼镜成通信行业新变量