LG AI Research推出多模态大模型EXAONE 4.5，聚焦复杂文档理解与推理

生成中...

Chi-gyu Hwang

发布时间 2026-04-09 16:18:00

搜索关键词

LG AI Research于9日发布多模态大模型“EXAONE 4.5”，具备文本与图像联合理解及推理能力。

据介绍，EXAONE 4.5是其自研AI基础模型项目中，面向“K-EXAONE”多模态扩展的阶段性成果。

LG AI Research表示，今年8月第二阶段项目结束后，若第三阶段推进方案获确认，公司将正式启动多模态扩展。其目标是将EXAONE的能力从虚拟环境延伸至“物理智能”，实现对现实世界的理解与判断。

在应用场景方面，EXAONE 4.5强调对复杂文档的处理能力，尤其面向合同、技术图纸、财务报表及扫描文档等内容，可实现更准确的理解与推理。

在衡量STEM（科学、技术、工程、数学）能力的5项基准测试平均分中，EXAONE 4.5取得77.3分，高于OpenAI的GPT-5 mini（73.5分）、Anthropic的Claude Sonnet 4.5（74.6分）以及阿里巴巴的Qwen3 235B（77.0分）。

在另一组覆盖13项基准测试的平均分比较中，EXAONE 4.5同样领先GPT-5 mini、Claude Sonnet 4.5和Qwen3-VL。上述测试涵盖通用视觉理解、信息图等图文融合内容理解，以及专业文献中复杂信息的文档理解与推理能力。

编码能力方面，在代表性评测指标LiveCodeBench v6中，EXAONE 4.5取得81.4分，超过Google模型Gemma 4的80.0分；在评估复杂图表分析与推理能力的ChartQA Pro中，得分为62.2分。

LG AI Research相关人士表示，视觉能力评测中的较高平均成绩表明，AI能力已不再停留在识别文档文字或非结构化数据层面，而是进一步具备结合语境理解内容并回答问题的能力。

目前，LG AI Research已在全球开源平台Hugging Face上线EXAONE 4.5，开放用于研究、学术和教学用途。该模型支持语种也已由韩语和英语扩展至西班牙语、德语、日语和越南语。

LG AI Research旗下EXAONE Lab负责人Lee Jin-sik表示，EXAONE 4.5表明LG AI已从纯文本阶段迈入视觉信息理解的多模态阶段。未来，公司将以该模型为起点，把AI的理解范围进一步扩展至语音、视频和物理环境，面向产业应用场景打造能够进行实际判断和行动的AI。

Chi-gyu Hwang delight@d-today.co.kr