Bốn doanh nghiệp tăng tốc agentic AI trước vòng đánh giá mô hình nền tảng AI nội địa tháng 8

Mô hình minh họa về dự án mô hình nền tảng AI nội địa. Ảnh: ChatGPT

Trước vòng đánh giá giai đoạn hai dự kiến diễn ra vào đầu tháng 8, bốn doanh nghiệp tham gia dự án phát triển mô hình nền tảng AI nội địa của Hàn Quốc đang tăng tốc nâng cấp năng lực agentic AI. Trọng tâm chung là khả năng gọi công cụ bên ngoài và điều phối tác nhân để thực thi tác vụ.

Xu hướng này phản ánh sự thay đổi trong hướng phát triển LLM trên toàn cầu. Nếu trước đây mô hình chủ yếu được dùng cho hỏi đáp, thì nay phạm vi ứng dụng đã mở rộng sang xử lý công việc thực tế. Vì vậy, khả năng phối hợp với công cụ như tìm kiếm bên ngoài, cơ sở dữ liệu hay thực thi mã nguồn ngày càng trở thành năng lực cốt lõi.

Từ cuối năm 2024, các tên tuổi lớn như OpenAI, Anthropic và Google cũng đã đưa các chỉ số benchmark về tác nhân và gọi công cụ vào nhóm tiêu chí nổi bật khi công bố mô hình mới.

Các doanh nghiệp Hàn Quốc tham gia dự án AI nội địa hiện cũng đang bám sát xu hướng này.

LG AI Research cho biết trong quá trình phát triển phiên bản K-EXAONE cho vòng đánh giá thứ hai, đơn vị này tập trung nâng cấp năng lực điều phối. Nếu vòng một đặt trọng tâm vào năng lực ngôn ngữ cơ bản, thì vòng hai chuyển sang khả năng thực thi tác vụ của tác nhân.

Theo LG AI Research, định hướng này nhằm phục vụ việc triển khai trong các dự án AX của doanh nghiệp trong tập đoàn cũng như khách hàng bên ngoài. Đơn vị này đánh giá rằng khi doanh nghiệp đã áp dụng orchestrator và ghi nhận năng suất tăng lên, khả năng thay thế sẽ rất thấp.

Song song với đó, LG AI Research cũng đẩy mạnh công việc tinh chỉnh để đưa EXAONE vào vận hành thực tế tại các công ty thành viên và đối tác. Ba năm trước, đơn vị từng thử triển khai theo hướng tương tự nhưng không thành công sau một năm, do các khâu như tiếp nhận dữ liệu, kiểm tra chất lượng dữ liệu huấn luyện, đánh giá và huấn luyện đều kéo dài nhiều tháng.

Từ kinh nghiệm này, LG AI Research cho biết hiện đơn vị đã cải thiện đồng thời cả tốc độ phát triển lẫn chất lượng mô hình.

Đại diện LG AI Research nói rằng một phần tác vụ của tác nhân hiện đã có thể thực hiện được, dù trong giai đoạn hoàn thiện mô hình AI nội địa vẫn còn hạn chế về tốc độ. Theo người này, nhiều phòng thí nghiệm đã được huy động thêm và chỉ trong khoảng hai tuần, hiệu năng điều phối đã được cải thiện đáng kể.

Upstage gần đây công bố mô hình cạnh tranh trong dự án AI nội địa mang tên Solar Open2 Preview, đồng thời nhấn mạnh tiến bộ về năng lực tác nhân. Doanh nghiệp cho biết theo benchmark Tau2, hiệu năng tác nhân của Solar Open2 Preview đạt 98%.

Upstage cho rằng mức này cao hơn DeepSeek V4 Pro với 96,2% và tiệm cận Anthropic Fable5 ở 98,5%. Công ty cho biết các số liệu trên được tổ chức đánh giá hiệu năng AI Artificial Analysis đo lường độc lập.

CEO Kim Seong-hun của Upstage cho biết mô hình ở giai đoạn một có thể được dùng cho biên tập tại tòa soạn, hỏi đáp và tìm kiếm, nhưng chưa thể gọi công cụ khi vận hành theo dạng tác nhân. Theo ông, mô hình ra mắt trong tháng 6 đã đạt mức có thể triển khai cho mục đích này.

Ông Kim cũng nhấn mạnh AI không còn đơn thuần là dịch vụ hay công cụ, mà đã trở thành tài sản chiến lược cấp quốc gia. Theo ông, nếu cần, các quốc gia khác hoàn toàn có thể ngắt quyền tiếp cận, vì vậy Hàn Quốc phải nâng năng lực công nghệ nội tại lên mức cao nhất có thể.

SK Telecom cũng đang phát triển phiên bản mới cho vòng đánh giá thứ hai, mang tên A.X K2, với trọng tâm là năng lực tác nhân. Ngay từ phiên bản trước là A.X K1, công ty đã tập trung vào năng lực lập trình và tác nhân.

SK Telecom cho biết A.X K2 được định hướng để đạt năng lực tác nhân có thể ứng dụng trong nhiều lĩnh vực và kịch bản khác nhau. Kết quả nghiên cứu về tác nhân của nhóm giáo sư Hwang Seung-won tại Đại học Quốc gia Seoul cũng đã được phản ánh vào mô hình.

Đại diện SK Telecom cho biết công ty đang phát triển mô hình mới để nộp cho vòng đánh giá giai đoạn hai, và mô hình này sẽ sở hữu năng lực tác nhân có thể khai thác dưới nhiều hình thức.

Motif Technologies cũng đặt mục tiêu phát triển một LLM quy mô 300B cho vòng đánh giá thứ hai, với trọng tâm là nâng cao hiệu năng tác nhân. Motif nhấn mạnh điểm khác biệt của công ty là sử dụng mô hình tự thiết kế, không dựa trên kiến trúc mã nguồn mở từ nước ngoài.

Công ty đặt mục tiêu chứng minh năng lực cạnh tranh ở mảng hiệu năng tác nhân.

CEO Lim Jeong-hwan của Motif Technologies nhận định mục tiêu phát triển của các LLM toàn cầu như Claude đang chuyển mạnh sang năng lực gọi công cụ phục vụ tác nhân, nên các mô hình AI nội địa cũng cần điều chỉnh theo xu hướng đó. Theo ông, Motif hiện cũng đang phát triển theo hướng này.

Trong khi đó, Bộ Khoa học và ICT Hàn Quốc cho biết sẽ đồng thời tiến hành đánh giá giai đoạn hai đối với bốn doanh nghiệp vào đầu tháng 8. Hạn nộp mô hình của LG AI Research, SK Telecom và Upstage là cuối tháng 6, trong khi Motif Technologies có thời hạn đến cuối tháng 7.

Seulgi Son sageson@d-today.co.kr

Từ khóa