搜索关键词 Kimi 2.7
AI & Enterprise
成本驱动下中国开源AI模型获美企关注:Coinbase测试GLM 5.2,Microsoft评估DeepSeek
随着AI投入持续攀升,部分美国科技公司正将目光转向成本更低的中国开源AI模型。Coinbase正在测试在其LLM网关中默认接入Z.ai的GLM 5.2、Moonshot AI的Kimi 2.7等模型;Microsoft也在评估DeepSeek V4微调版本及其他开源模型,作为OpenAI和Anthropic方案的低成本替代选择。业内认为,开源带来的可控性以及监管因素,正共同推动这类模型在企业端的采用。
AI & Enterprise
Coinbase公开AI降本方法:调整默认模型、优化路由、提升缓存复用
随着企业AI使用量不断上升,成本控制正成为新的管理重点。Coinbase近日披露,其通过调整默认模型、优化模型路由和提高缓存复用率,在Token消耗持续增长的情况下将AI成本压降近50%。Microsoft的Nicholas Bustamante则提出“Token工程”和“后台Agent”概念,并预计未来Token定价可能转向按可接受时延分层。
AI & Enterprise
企业AI加速降本:模型路由、开源定制与用量管控成主流手段
随着企业加快部署AI,成本控制正成为新课题。越来越多公司开始通过模型路由按任务复杂度分配不同模型,引入开源模型进行定制开发,并对员工可用模型及Token用量实施管理,以降低整体支出。OpenRouter称,6月第二周开源模型处理的Token占比已升至约65%;AI客服公司Fin转向基于open-weight模型的定制方案后,每年节省数亿美元。