Ông Lim Jeong-hwan, CEO Motif Technologies, tại sự kiện Nvidia Nemotron Developer Days Seoul 2026 ngày 22/4. Ảnh: DigitalToday

Motif Technologies, doanh nghiệp phát triển mô hình nền tảng AI trong nước, đang theo đuổi chiến lược khác biệt hóa bằng cách tự xây nền tảng và công cụ phần mềm thay vì đi theo trọn bộ stack phần mềm của Nvidia.

Theo công ty, nếu sử dụng các bộ công cụ tiêu chuẩn do Nvidia cung cấp, sẽ rất khó cạnh tranh với các Big Tech vốn có lợi thế vượt trội về năng lực tính toán. Vì vậy, Motif chọn hướng phát triển và vận hành mô hình ngôn ngữ lớn theo mục tiêu tối ưu hiệu quả chi phí bằng công cụ do chính doanh nghiệp phát triển.

Phát biểu tại phiên thảo luận trong khuôn khổ sự kiện Nvidia Nemotron Developer Days Seoul 2026, diễn ra ngày 22/4 tại D.Camp Mapo ở Seoul, ông Lim Jeong-hwan, CEO Motif Technologies, cho biết lý do công ty phát triển công cụ riêng thay vì dùng giải pháp của Nvidia là để tăng độ linh hoạt trong phát triển.

Theo ông Lim, bộ công cụ của Nvidia có thể làm giảm không gian lựa chọn của nhà phát triển và đẩy doanh nghiệp vào thế bị khóa chặt trong hệ sinh thái của hãng.

CUDA của Nvidia vốn xử lý hiệu quả khối lượng tính toán lớn cần cho huấn luyện AI, nên gần như đã trở thành tiêu chuẩn trong hệ sinh thái phát triển AI. Tuy nhiên, nền tảng này chỉ hoạt động trên GPU Nvidia.

Trên nền CUDA, Nvidia cung cấp hàng loạt công cụ theo dạng gói, gồm framework huấn luyện như NVIDIA NeMo và Megatron-LM, công cụ tối ưu suy luận TensorRT-LLM, cùng giải pháp làm sạch dữ liệu NeMo Curator. Từ đó, trong ngành hình thành thông lệ: khi triển khai GPU Nvidia, doanh nghiệp thường dùng kèm luôn hệ công cụ phần mềm của hãng.

Một số doanh nghiệp khác tham gia phát triển mô hình nền tảng AI trong nước cũng đang đi theo hướng này. SK Telecom sử dụng Megatron-LM và NeMo Curator để huấn luyện mô hình siêu lớn A.X K1, trong khi LG AI Research áp dụng framework NeMo và TensorRT-LLM trong toàn bộ quá trình phát triển Exaone.

Dù vậy, Motif nhấn mạnh công ty không phủ nhận vai trò của phần cứng Nvidia hay chính CUDA. Ông Lim ví von rằng điều này “giống như vẫn dùng iPhone nhưng không dùng ứng dụng Ghi chú mặc định”. Nói cách khác, Motif vẫn sử dụng GPU và CUDA của Nvidia, nhưng không dùng bộ công cụ phát triển mô hình nằm phía trên lớp nền tảng đó.

Ông Lim cho rằng nếu sử dụng phần mềm của Nvidia ở góc độ phát triển mô hình, nhóm kỹ sư sẽ dễ bị bó buộc vào kiến trúc và cách tiếp cận mà Nvidia hỗ trợ. Ông cũng nói chi phí chỉnh sửa mã để dùng bộ công cụ NeMo là quá lớn, trong khi bên trong có nhiều nhánh xử lý nội bộ, nên Motif đi đến kết luận rằng tự phát triển sẽ hiệu quả hơn.

Theo Motif, chiến lược phần mềm riêng có thể trở thành yếu tố khác biệt giúp công ty phát triển LLM có sức cạnh tranh cao hơn. Ông Lim nhấn mạnh rằng nếu kiến trúc, dữ liệu và phương pháp luận đều giống nhau, bên có ít năng lực tính toán hơn sẽ không thể giành ưu thế. Muốn vượt lên, doanh nghiệp buộc phải thử nghiệm ở những lớp công nghệ khác.

Ông cho rằng nếu tiếp tục ở trong hệ sinh thái phần mềm của Nvidia, cuối cùng doanh nghiệp vẫn sẽ phải dùng cùng kiến trúc và cùng phương pháp luận. Trong bối cảnh đó, việc đánh bại các Big Tech mạnh hơn về năng lực tính toán là rất khó.

Triết lý này, theo ông Lim, được hình thành từ kinh nghiệm phát triển trong thời gian ông làm việc tại Moreh, công ty hạ tầng AI đồng thời là công ty mẹ của Motif. Moreh từng tự phát triển nền tảng huấn luyện MoAI dựa trên GPU AMD. Khi giữ vai trò AI Director tại Moreh, ông Lim cũng dẫn dắt quá trình phát triển mô hình MoMo-70B trên GPU AMD MI250.

Công ty cho biết thành phần cốt lõi trong công nghệ phần mềm riêng của Motif là cấu trúc attention do doanh nghiệp tự thiết kế, mang tên GDA (Grouped Differential Attention). Attention là phép tính nền tảng giúp mô hình AI nắm bắt quan hệ giữa các từ trong câu, nhưng dễ phát sinh nhiễu khi phản ứng với thông tin không cần thiết.

Để khắc phục điểm này, Motif phân bổ tài nguyên tính toán theo cách bất đối xứng: một nhóm đảm nhiệm việc giữ tín hiệu, trong khi nhóm còn lại có vai trò kiểm soát nhiễu.

Ngoài ra, Motif lựa chọn thuật toán huấn luyện Muon thay cho AdamW, thuật toán tiêu chuẩn đang được phần lớn doanh nghiệp AI sử dụng. Theo công ty, Muon điều chỉnh hướng cập nhật tham số để tránh xung đột trong quá trình huấn luyện, qua đó giúp mô hình học được nhiều hơn với cùng một lượng tính toán. Motif cho biết doanh nghiệp đã song song hóa thuật toán này để có thể vận hành đồng thời trong môi trường hàng nghìn GPU.

Ở giai đoạn suy luận, công ty cho biết sử dụng vLLM mã nguồn mở thay vì TensorRT-LLM của Nvidia, đồng thời thay phép tính attention cốt lõi bằng phương thức do chính Motif tự triển khai.

Từ khóa

#Motif Technologies #Nvidia #CUDA #LLM #NVIDIA NeMo #Megatron-LM #TensorRT-LLM #vLLM #Moreh
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.