搜索关键词 内存瓶颈
Industry
SK hynix量产192GB SOCAMM2内存模组,面向AI服务器
SK hynix宣布量产面向下一代AI服务器的192GB SOCAMM2内存模组。该产品采用10纳米级第六代(1c)LPDDR5X低功耗DRAM,并按NVIDIA下一代平台Vera Rubin的需求设计。公司表示,其带宽较传统RDIMM提升逾2倍,能效提升逾75%,并已针对全球CSP客户需求建立稳定的量产供应体系。
Industry
Claude Code代码泄露引发关注:AI代理或令内存与半导体需求超预期
Anthropic旗下AI编程代理Claude Code因打包失误导致内部代码暴露。泄露内容显示,该产品在单台PC空载状态下内存占用约15GB,活跃状态最高可升至空载时的8至9倍,并已具备常驻式代理和多代理相关设计。业内据此判断,市场此前对AI代理基础设施消耗的评估可能偏低,内存及相关半导体需求存在上修空间。
AI & Enterprise
Google Research发布TurboQuant:AI模型内存占用最低可降至原来的1/6
Google Research、DeepMind与纽约大学联合推出新一代量化算法TurboQuant,KAIST电气与电子工程学院教授Insu Han参与相关研究。该技术通过两阶段量化压缩模型内部表示,并结合QJL(Quantized Johnson-Lindenstrauss)1比特表征,在几乎不影响精度的情况下,可将内存占用最多压缩至原来的1/6,重点缓解AI推理阶段的内存压力。