搜索关键词 本地运行
AI & Enterprise
企业AI成本攀升,大模型主导地位松动
随着企业部署AI的成本持续上升,市场正从优先采用前沿大模型,转向成本更低的中小模型和开源方案。Coinbase CEO Brian Armstrong预计,未来12至18个月内,约80%的工作将转向成本降低99%的模型;Lindy、Harvey等公司也相继披露,在不牺牲效果的前提下,推理成本已明显下降。
AI & Enterprise
Google发布Gemma 4 QAT:面向手机和笔记本降低端侧内存需求
Google发布Gemma 4 QAT,将量化模拟前移至训练阶段,以降低模型在手机、轻薄笔记本等设备上的运行内存需求。此次发布覆盖Gemma 4全系,并提供移动端优化型号,免费开放使用,且官方支持llama.cpp、Ollama、LM Studio等本地运行环境。
Games & Commerce
Jensen Huang访韩首站现身T1,向Faker赠送亲笔签名GeForce RTX 5090
NVIDIA首席执行官Jensen Huang访韩后的首个公开行程是前往T1基地营,与Faker等T1《英雄联盟》战队队员会面。他在现场向Faker赠送了一块亲笔签名的GeForce RTX 5090,并称其为“全球唯一一块”。活动中,NVIDIA还介绍了AI PC架构RTX Spark,可同时处理多套软件栈,并支持在本地运行AI代理。
-
AI & Enterprise
Computex 2026加速转向AI:不再只是PC展会
-
AI & Enterprise
Microsoft升级Agent平台,推出Microsoft IQ、Microsoft Scout与MAI模型
-
AI & Enterprise
Cisco发布Cloud Control,整合AI代理管理与安全运营
-
Industry
NVIDIA发布RTX Spark:瞄准Windows笔记本本地大模型运行
-
AI & Enterprise
WWDC将近,Apple主打端侧AI 突出自研芯片、隐私与成本优势
-
AI & Enterprise
Prism ML发布Bonsai Image 4B:iPhone端侧出图约12秒
-
AI & Enterprise
TheVentures完成对端侧AI初创公司Out of set的种子轮投资
-
AI & Enterprise
Cactus Compute推出轻量工具调用模型Needle,可在入门级智能手机端侧运行
-
Telecommunications & Media
Tim Cook:Mac mini和Mac Studio供应紧张或将持续数月
-
Industry
HP发布新一代AI PC与工作站,加码端侧AI布局
-
Industry
NVIDIA加码Claw生态,率先在韩国布局本地AI算力需求
-
AI & Enterprise
Weekley推出本地AI代理Aulo:可离线运行,强调本地学习与隐私保护
-
Industry
PC用DRAM涨幅趋缓,AI PC与高端显示器能否带动下半年需求回暖
-
AI & Enterprise
Weekly在韩国和美国上线本地部署AI平台Owllo
-
AI & Enterprise
软件企业重构AI定价:从按用量转向按成果收费