搜索关键词 GPQA Diamond
AI & Enterprise
DeepSeek发布V4系列模型:开源低价,对标Opus 4.7和GPT-5.5
中国AI公司DeepSeek推出V4系列模型,主打开源和低价。其中,V4 Pro采用1.6万亿参数MoE架构,支持100万token上下文;V4 Pro和V4 Flash均基于约33万亿token完成训练,多项基准测试表现接近Opus 4.7和GPT-5.5。市场分析认为,其性价比优势或推动企业采用,但地缘政治和使用依赖风险仍需关注。
AI & Enterprise
Google DeepMind发布Gemma 4,性能升级并转向Apache 2.0开源许可
Google DeepMind正式推出开源模型Gemma 4,覆盖E2B、E4B等端侧版本,以及26B MoE、31B Dense等大模型,最高支持25.6万token上下文窗口。多项基准测试成绩较前代明显提升,其中AIME、Codeforces ELO和GPQA Diamond表现尤为突出:Gemma 4 31B在GPQA Diamond上取得84.3%,26B MoE取得82.3%。与此同时,Gemma 4改用Apache 2.0许可,进一步降低了商业化应用和二次开发门槛。
AI & Enterprise
Upstage推出大语言模型Solar Pro 3:参数规模升至1020亿
Upstage于3月24日发布自研大语言模型Solar Pro 3,参数规模达到1020亿,较前代Solar Pro 2扩大逾3倍。公司表示,该模型在综合Agent能力、编程、指令跟随等多项基准测试中的表现较前代提升超过2倍,同时在模型成本和TPS与前代基本持平的情况下进一步增强了推理能力。目前,Solar Pro 3已可通过OpenRouter和Upstage API调用。