LG AI Research于9日发布多模态大模型“EXAONE 4.5”,具备文本与图像联合理解及推理能力。
据介绍,EXAONE 4.5是其自研AI基础模型项目中,面向“K-EXAONE”多模态扩展的阶段性成果。
LG AI Research表示,今年8月第二阶段项目结束后,若第三阶段推进方案获确认,公司将正式启动多模态扩展。其目标是将EXAONE的能力从虚拟环境延伸至“物理智能”,实现对现实世界的理解与判断。
在应用场景方面,EXAONE 4.5强调对复杂文档的处理能力,尤其面向合同、技术图纸、财务报表及扫描文档等内容,可实现更准确的理解与推理。
在衡量STEM(科学、技术、工程、数学)能力的5项基准测试平均分中,EXAONE 4.5取得77.3分,高于OpenAI的GPT-5 mini(73.5分)、Anthropic的Claude Sonnet 4.5(74.6分)以及阿里巴巴的Qwen3 235B(77.0分)。
在另一组覆盖13项基准测试的平均分比较中,EXAONE 4.5同样领先GPT-5 mini、Claude Sonnet 4.5和Qwen3-VL。上述测试涵盖通用视觉理解、信息图等图文融合内容理解,以及专业文献中复杂信息的文档理解与推理能力。
编码能力方面,在代表性评测指标LiveCodeBench v6中,EXAONE 4.5取得81.4分,超过Google模型Gemma 4的80.0分;在评估复杂图表分析与推理能力的ChartQA Pro中,得分为62.2分。
LG AI Research相关人士表示,视觉能力评测中的较高平均成绩表明,AI能力已不再停留在识别文档文字或非结构化数据层面,而是进一步具备结合语境理解内容并回答问题的能力。
目前,LG AI Research已在全球开源平台Hugging Face上线EXAONE 4.5,开放用于研究、学术和教学用途。该模型支持语种也已由韩语和英语扩展至西班牙语、德语、日语和越南语。
LG AI Research旗下EXAONE Lab负责人Lee Jin-sik表示,EXAONE 4.5表明LG AI已从纯文本阶段迈入视觉信息理解的多模态阶段。未来,公司将以该模型为起点,把AI的理解范围进一步扩展至语音、视频和物理环境,面向产业应用场景打造能够进行实际判断和行动的AI。