搜索关键词 AIME 2025 AI & Enterprise 美NIST旗下CAISI评测:DeepSeek V4 Pro接近GPT-5水平,与美国最新头部模型仍差约8个月 美国国家标准与技术研究院(NIST)旗下CAISI发布评测报告称,DeepSeek V4 Pro目前在中国同类模型中表现最强,但按综合表现判断,与美国最新头部模型相比仍有约8个月差距。报告显示,该模型综合评分较Kimi K2.5高约200分;在成本效率方面,较OpenAI GPT-5.4 mini高出41%至53%。 AI & Enterprise OpenAI将ChatGPT默认模型升级为GPT-5.5 Instant,可结合历史对话并调用Gmail内容 OpenAI已将ChatGPT默认模型从GPT-5.3 Instant升级为GPT-5.5 Instant。官方表示,新模型在法律、医疗、金融等敏感场景中可减少幻觉,同时延续低延迟表现;在AIME 2025和MMMU-Pro两项基准测试中的成绩也较上一代提升。新版本还可结合搜索工具、历史对话、文件和Gmail内容,生成更个性化的回复。
AI & Enterprise 美NIST旗下CAISI评测:DeepSeek V4 Pro接近GPT-5水平,与美国最新头部模型仍差约8个月 美国国家标准与技术研究院(NIST)旗下CAISI发布评测报告称,DeepSeek V4 Pro目前在中国同类模型中表现最强,但按综合表现判断,与美国最新头部模型相比仍有约8个月差距。报告显示,该模型综合评分较Kimi K2.5高约200分;在成本效率方面,较OpenAI GPT-5.4 mini高出41%至53%。
AI & Enterprise OpenAI将ChatGPT默认模型升级为GPT-5.5 Instant,可结合历史对话并调用Gmail内容 OpenAI已将ChatGPT默认模型从GPT-5.3 Instant升级为GPT-5.5 Instant。官方表示,新模型在法律、医疗、金融等敏感场景中可减少幻觉,同时延续低延迟表现;在AIME 2025和MMMU-Pro两项基准测试中的成绩也较上一代提升。新版本还可结合搜索工具、历史对话、文件和Gmail内容,生成更个性化的回复。
文章搜索 搜索 AI 编辑精选 热门 1 Samsung Electronics与SK hynix HBM4E供样时间拉开差距,量产节点成关键变量 2 Samsung Electronics 市值突破1万亿美元,成亚洲第二家万亿美元市值企业 3 韩国国会通过《AI数据中心产业振兴特别法》 为AI基础设施建设提速 4 韩国通过《国家研究数据管理与利用促进法》 国家研发数据管理纳入法制化 5 韩国拟向国家AI计算中心项目注资,支持引入1.5万枚AI芯片 6 SK Telecom2026年第一季度营业利润5376亿韩元,AI数据中心增长与无线业务回暖提振业绩 7 LG U+一季度营业利润增至2723亿韩元,AI数据中心、移动及家庭业务齐增长 8 Kakao一季度营收和营业利润双双创同期新高,加速将KakaoTalk升级为Agentic AI平台 9 Samsung SDS中标韩国证券存托结算院代币证券平台建设项目,计划2027年2月完成 10 韩国一季度GDP强于预期 海外投行纷纷上调今年增长预期 1 Perplexity面向所有Mac用户开放本地AI代理“Personal Computer” 2 Moonshot AI完成20亿美元融资,估值达200亿美元 3 Mozilla:Anthropic的AI模型Mythos帮助Firefox发现大量高危漏洞,4月修复423处 4 软件供应链攻击升温,AI 编程工具风险引关注,AI 代理安全并购提速 5 Kalshi获10亿美元F轮融资,估值达220亿美元 6 Claude Code 被指存在供应链攻击风险 7 HP发布新一代AI PC与工作站,加码端侧AI布局 8 Samsung Electro-Mechanics一季度营业利润增40%,单季营收首次突破3万亿韩元 9 Samsung Electronics与SK hynix HBM4E供样时间拉开差距,量产节点成关键变量 10 韩国最高法院终审维持二审判决:Ironmace因侵犯商业秘密赔偿Nexon约57.65亿韩元