简体中文 < 文章列表 - 数字今日 (DigitalToday)

搜索关键词 GPQA Diamond

AI & Enterprise

Upstage开源大模型Solar Open 2，聚焦AI代理能力

Upstage发布面向AI代理场景的开源大语言模型Solar Open 2，并已在Hugging Face开放模型权重。该模型总参数规模为250B，采用MoE架构，实际运行时激活15B参数，上下文窗口最长可达100万 token；公司称，其在多项基准测试中超过多款同类模型，并计划以此向多个行业拓展AX服务。

AI & Enterprise

DeepSeek发布V4系列模型：开源低价，对标Opus 4.7和GPT-5.5

中国AI公司DeepSeek推出V4系列模型，主打开源和低价。其中，V4 Pro采用1.6万亿参数MoE架构，支持100万token上下文；V4 Pro和V4 Flash均基于约33万亿token完成训练，多项基准测试表现接近Opus 4.7和GPT-5.5。市场分析认为，其性价比优势或推动企业采用，但地缘政治和使用依赖风险仍需关注。

AI & Enterprise

Google DeepMind发布Gemma 4，性能升级并转向Apache 2.0开源许可

Google DeepMind正式推出开源模型Gemma 4，覆盖E2B、E4B等端侧版本，以及26B MoE、31B Dense等大模型，最高支持25.6万token上下文窗口。多项基准测试成绩较前代明显提升，其中AIME、Codeforces ELO和GPQA Diamond表现尤为突出：Gemma 4 31B在GPQA Diamond上取得84.3%，26B MoE取得82.3%。与此同时，Gemma 4改用Apache 2.0许可，进一步降低了商业化应用和二次开发门槛。

AI & Enterprise

Upstage推出大语言模型Solar Pro 3：参数规模升至1020亿

2026.03.24 17:30