搜索关键词 学术推理
AI & Enterprise
“AI IQ”上线:用单一分数比较GPT-5.5、Gemini和Claude等模型
工程师兼创业者Ryan Shay推出“AI IQ”项目,将多项公开基准成绩换算为“估算IQ”并汇总为单一分数,用于比较GPT-5.5、Gemini、Claude等主流模型。该项目还提供时间趋势、厂商分组和成本测算等视图,但以单一分数概括模型能力的做法也引发争议。
AI & Enterprise
Anthropic测试新模型引发安全板块承压,Ed Sim:AI将带动网络安全市场扩容
Anthropic测试新模型Claude Mythos的消息传出后,市场担心AI能力提升将挤压传统安全产品需求,相关安全公司股价承压。Boldstart Ventures创始人Ed Sim认为,更强的模型意味着更大的网络威胁,网络安全行业不会被取代,反而将因AI攻击升级迎来更多需求。
AI & Enterprise
OpenAI与Anthropic加速布局AI代理,下一代模型竞争升温
围绕可自主执行任务的AI代理,头部厂商正加快产品迭代。Anthropic为Claude Code和Claude Cowork新增直接操作用户电脑、自动模式等能力,OpenAI则为Codex引入插件支持,进一步拓展企业协作场景。与此同时,OpenAI与Anthropic的下一代模型进展相继浮出水面,OpenRouter数据还显示,中国AI模型自今年2月起Token消耗量已超过美国竞争对手。