搜索关键词 小模型
AI & Enterprise
Qualcomm发布HBC架构,计划于2027年中推出AI250推理加速器
Qualcomm发布新型内存架构HBC,采用近存计算设计,将LPDDR内存直接堆叠在计算芯片上,宣称最高可实现133TB/s的内存带宽。公司计划于2027年中推出搭载该架构的AI推理加速器AI250,并将能效作为数据中心AI推理市场的核心卖点之一。与此同时,Qualcomm还披露了与Meta、Microsoft的合作情况。
AI & Enterprise
Gartner预计:到2028年AI编程成本将超过开发者平均年薪
Gartner预计,到2028年,企业使用AI编程工具的成本将超过开发者平均年薪。推动成本上升的主要因素包括大语言模型令牌消耗增加,以及计费模式由按席位转向按用量。与此同时,部分供应商在令牌计量口径和计费规则上的透明度不足,也加大了企业的成本预测难度。Gartner建议企业尽快建立治理与成本控制机制。
AI & Enterprise
Microsoft通过Azure向中国科技巨头提供GPT服务,OpenAI对华“间接供应”路径浮现
在OpenAI和Anthropic未直接进入中国市场的情况下,Microsoft正通过Azure向多家中国大型科技公司提供GPT模型服务,承接相关需求。随着中国市场对AI模型调用需求升温,Microsoft相关业务收入随之增长;与此同时,使用海外数据中心、模型蒸馏防护等问题也成为市场关注焦点。
-
AI & Enterprise
Microsoft称AI单次请求耗电或远低于既有估算,回应“ChatGPT单次提问的耗电量约为谷歌搜索的10倍”说法
-
AI & Enterprise
企业AI成本攀升,大模型主导地位松动
-
AI & Enterprise
Mustafa Suleyman:依赖“蒸馏”的中国开源AI模型存在上限,Microsoft自研模型坚持“零蒸馏”
-
AI & Enterprise
苹果新版 Siri 渲染图流出:采用端云混合架构,部分请求或接入 Gemini
-
AI & Enterprise
Dell Technologies谈AI时代“Tokenomics”:企业需重构基础设施布局
-
AI & Enterprise
Salesforce CEO:今年拟投入3亿美元采购Anthropic Token
-
AI & Enterprise
Ming-Chi Kuo:OpenAI正与MediaTek、Qualcomm开发智能手机AI芯片,目标2028年量产
-
AI & Enterprise
Databricks高管:企业AI选型更看重成本和时延,开源小模型更受青睐
-
AI & Enterprise
a16z合伙人:AI竞争重心转向资本,模型开发门槛下降
-
AI & Enterprise
Meta推出Muse Spark,AI模型与“AI原生”基础设施赛道同步升温
-
AI & Enterprise
中国AI企业减少最新模型开源,转向云平台和API商业化
-
AI & Enterprise
Gartner:Token单价大跌,企业AI总成本未必同步下降
-
AI & Enterprise
Mistral AI推出企业定制模型平台Forge,支持用自有数据从零训练
-
AI & Enterprise
Augment Code发布“模型上下文协议”,提升AI代理代码理解能力