Heo Seol, Trưởng nhóm kỹ thuật phát triển MLOps tại LGU+, trình bày về mô hình nền tảng AI. Ảnh: LGU+

LGU+ ngày 10/4 cho biết đã giới thiệu nền tảng giúp vận hành ổn định các mô hình AI trong môi trường dịch vụ thực tế tại sự kiện “2026 Modern Agentic Application Day” do Amazon Web Services (AWS) tổ chức.

Tại sự kiện, doanh nghiệp chia sẻ kinh nghiệm chuyển đổi từ môi trường phát triển AI chủ yếu dựa trên hạ tầng on-premises sang kiến trúc linh hoạt kết nối với đám mây. LGU+ cũng trình bày cách liên thông toàn bộ quy trình từ phát triển mô hình đến triển khai và vận hành dịch vụ.

Theo LGU+, nền tảng này được xây dựng để thu hẹp khoảng cách giữa giai đoạn phát triển mô hình và đưa vào vận hành thực tế. Trọng tâm của mô hình là hợp nhất các khâu huấn luyện, đánh giá, triển khai và vận hành vào một luồng thống nhất, thay cho quy trình rời rạc vốn làm phát sinh nhiều tác vụ lặp lại khi chuyển mô hình sang môi trường dịch vụ.

Công ty cho biết nền tảng không dừng ở khâu phát triển mô hình mà được thiết kế để luôn duy trì trạng thái “Model Ready”, sẵn sàng đưa vào dịch vụ khi cần. Toàn bộ chu trình từ thu thập dữ liệu, huấn luyện, đánh giá, triển khai đến vận hành được kết nối trong một pipeline, qua đó giúp đội ngũ phát triển và vận hành làm việc trên cùng tiêu chuẩn và môi trường nhất quán.

Về hạ tầng, LGU+ áp dụng kiến trúc lai dựa trên Amazon EKS, dịch vụ Kubernetes được quản lý của AWS. Hệ thống GPU on-premises của công ty được tích hợp thành các node lai trong cụm Amazon EKS, trong khi control plane của Kubernetes do AWS vận hành theo mô hình managed, giúp giảm gánh nặng quản trị nền tảng.

Nền tảng này cũng thay đổi cách sử dụng tài nguyên GPU. Thay vì cấp phát cố định theo từng thiết bị như trước đây, LGU+ áp dụng cơ chế phân bổ linh hoạt theo nhu cầu, từ đó nâng hiệu suất sử dụng GPU cho cả hoạt động huấn luyện mô hình và vận hành dịch vụ AI.

Ông Kwon Ki-deok, Giám đốc AX Engineering Lab của LGU+, cho biết công ty đang tăng cường năng lực nền tảng kỹ thuật trên toàn bộ vòng đời phát triển AI, từ thu thập dữ liệu, phát triển, triển khai và vận hành mô hình đến quản lý GPU. Theo ông, LGU+ sẽ tiếp tục hợp tác kỹ thuật với AWS để nâng cao chất lượng dịch vụ AI và độ ổn định trong vận hành.

Từ khóa

#LGU+ #AWS #AI #Amazon EKS #Kubernetes #GPU #MLOps #hạ tầng lai
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.