搜索关键词 预训练
Industry
NVIDIA:AI芯片竞争转向端到端效率,Blackwell在MoE推理中较上一代Hopper快55倍
NVIDIA在首尔举行的开发者活动上表示,AI竞争重心正从单一芯片参数比拼转向覆盖预训练、后训练、推理及Agent应用的端到端效率。公司首次披露实测数据称,Blackwell GPU在混合专家(MoE)推理中的速度较上一代Hopper提升55倍,并介绍了NDFP4、PivotLM、NemoTron Cascade等多项提升训练与后训练效率的新进展。
AI & Enterprise
Google DeepMind成立专项团队,强化Gemini代码能力
据报道,Google DeepMind已成立专项团队,专门提升AI代码模型在开发全新软件等复杂编程任务中的表现,团队由研究工程师Sebastian Borgeaud负责。与此同时,Google正加大内部代码模型的开发投入,并推动员工更多使用内部代理工具。Anthropic及其代码工具被视为Google当前面临的重要竞争压力。
AI & Enterprise
a16z合伙人:AI竞争重心转向资本,模型开发门槛下降
a16z合伙人Martin Casado表示,AI创新正越来越取决于数据、算力和资金等投入能力,模型开发也未必如外界想象般高不可攀。他认为,大规模预训练阶段已接近尾声,强化学习可能成为下一阶段的重要推动力。不过,AI公司的商业模式和经济性仍存在较大不确定性。
-
Industry
Physical Intelligence发布机器人模型π0.7:可通过能力组合完成未覆盖训练数据的任务
-
Games & Commerce
Valve或正在开发“SteamGPT”,借生成式AI强化Steam风控与运营
-
AI & Enterprise
韩国国家AI战略委员会就“独派模”召开座谈会,聚焦训练数据获取瓶颈
-
AI & Enterprise
Krafton发布AI模型品牌Raon,四款基础模型在Hugging Face开源
-
AI & Enterprise
OpenAI与Anthropic加速布局AI代理,下一代模型竞争升温
-
AI & Enterprise
OpenAI终止Sora,并称下一代模型“Spud”已完成预训练
-
Industry
ASML选定Mistral AI为合作伙伴,半导体行业加速布局定制AI
-
AI & Enterprise
KT亮相MWC26,展示司法与教育AI应用成果并发力公共领域AX
-
AI & Enterprise
韩国“自主AI基础模型”项目进入第二阶段 自主性认定标准仍未明确
-
AI & Enterprise
KT将携自研大模型Mi:dm K亮相MWC26,面向韩国企业及公共部门场景
-
AI & Enterprise
韩国“独立AI基础模型”项目增补后形成四强竞争,独立性认定标准受关注
-
AI & Enterprise
KAIST与Korea University提出跨AI模型适配知识迁移技术
-
AI & Enterprise
Microsoft推出物理AI机器人模型Rho-alpha
-
AI & Enterprise
Trillionlabs将参与韩国“独立AI基础模型”增补招标,主打从底层架构起自主研发
-
AI & Enterprise
Kakao升级开源语言模型Kanana-2,新增4款模型强化Agent AI能力