LG AI Research ngày 9/4 ra mắt EXAONE 4.5, mô hình AI đa phương thức có khả năng xử lý đồng thời văn bản và hình ảnh, đồng thời tăng cường năng lực đọc hiểu và suy luận.
Theo LG AI Research, đây là bước đi chuẩn bị để mở rộng năng lực đa phương thức cho K-EXAONE, dự án mô hình nền tảng AI độc lập đang được phát triển.
Viện nghiên cứu này cho biết sau khi giai đoạn 2 của dự án kết thúc vào tháng 8 năm nay, nếu được xác nhận chuyển sang giai đoạn 3, hãng sẽ bắt đầu mở rộng đa phương thức trên quy mô toàn diện. Mục tiêu cuối cùng là phát triển EXAONE thành “trí tuệ vật lý”, có thể hiểu và đưa ra phán đoán trong thế giới thực, vượt ra ngoài môi trường ảo.
LG AI Research cho biết thế mạnh của EXAONE 4.5 nằm ở khả năng đọc chính xác và suy luận trên các tài liệu phức tạp thường xuất hiện trong môi trường công nghiệp, như hợp đồng, bản vẽ kỹ thuật, báo cáo tài chính hay tài liệu scan.
Trên 5 bộ chỉ số đánh giá năng lực STEM (khoa học, công nghệ, kỹ thuật và toán học), EXAONE 4.5 đạt điểm trung bình 77,3, cao hơn OpenAI GPT5-mini (73,5 điểm), Anthropic Claude Sonnet 4.5 (74,6 điểm) và Alibaba Qwen3 235B (77,0 điểm).
Xét trên 13 bộ chỉ số, trong đó có 3 bộ đo khả năng hiểu thị giác tổng quát và 5 bộ đánh giá năng lực đọc hiểu tài liệu, suy luận trên thông tin phức tạp trong tài liệu chuyên ngành như infographic kết hợp hình ảnh và văn bản, mô hình này cũng cho kết quả cao hơn GPT5-mini, Claude Sonnet 4.5 và Qwen3-VL.
Đáng chú ý, ở LiveCodeBench v6, một chỉ số tiêu biểu về năng lực lập trình, EXAONE 4.5 đạt 81,4 điểm, vượt Gemma 4 của Google với 80,0 điểm. Trong bài đánh giá ChartQA Pro, đo khả năng phân tích và suy luận trên biểu đồ phức tạp, mô hình đạt 62,2 điểm.
Đại diện LG AI Research cho biết mức điểm trung bình cao trên các chỉ số đánh giá năng lực thị giác cho thấy AI không còn dừng ở mức nhận diện ký tự hay xử lý dữ liệu phi cấu trúc trong tài liệu, mà đã có thể nắm bắt ngữ cảnh và trả lời câu hỏi.
LG AI Research cũng đã phát hành công khai EXAONE 4.5 trên nền tảng mã nguồn mở toàn cầu Hugging Face, phục vụ nghiên cứu, học thuật và giáo dục. Bên cạnh tiếng Hàn và tiếng Anh, mô hình hiện mở rộng hỗ trợ chính thức thêm tiếng Tây Ban Nha, tiếng Đức, tiếng Nhật và tiếng Việt.
Lee Jin-sik, người đứng đầu EXAONE Lab thuộc LG AI Research, cho biết EXAONE 4.5 cho thấy AI của LG đã bước vào giai đoạn đa phương thức, không chỉ dừng ở văn bản mà còn có thể hiểu thông tin thị giác. Ông nói LG sẽ tiếp tục mở rộng khả năng hiểu của AI sang giọng nói, video và môi trường vật lý, hướng tới hệ thống có thể đưa ra phán đoán và hành động thực chất trong môi trường công nghiệp.