搜索关键词 公开基准
AI & Enterprise
“AI IQ”上线:用单一分数比较GPT-5.5、Gemini和Claude等模型
工程师兼创业者Ryan Shay推出“AI IQ”项目,将多项公开基准成绩换算为“估算IQ”并汇总为单一分数,用于比较GPT-5.5、Gemini、Claude等主流模型。该项目还提供时间趋势、厂商分组和成本测算等视图,但以单一分数概括模型能力的做法也引发争议。
AI & Enterprise
RLWRLD发布机器人基础模型RLDX-1,瞄准五指灵巧操控
物理AI企业RLWRLD当地时间7日宣布,对外开源自研机器人基础模型RLDX-1。此次开源包括1个预训练版本和2个面向不同平台的中期训练版本,均为81亿参数规模。公司表示,RLDX-1以“灵巧优先”为核心,融合视觉、语言、扭矩、触觉和记忆等多模态能力,在8项公开基准测试中优于多款现有模型。
AI & Enterprise
Hancom发布开源PDF数据提取工具OpenDataLoader PDF v2.0,称基准测试居首
Hancom于12日发布开源PDF数据提取工具OpenDataLoader PDF v2.0。新版本采用AI解析与直接提取结合的混合引擎,可在本地隔离环境中免费部署和使用,从而减少数据传输至外部服务器带来的泄露风险。产品同时内置OCR、表格提取、公式提取、图表分析4款免费AI插件,并将开源协议由MPL 2.0调整为Apache 2.0。