RLWRLD, công ty hoạt động trong lĩnh vực AI vật lý, vừa giới thiệu mô hình nền tảng robot do hãng tự phát triển mang tên RLDX-1, đồng thời đẩy mạnh chiến lược mở rộng thị trường trong nước.
Thông tin được công bố tại sự kiện “Dexterity Night in Seoul”, nơi RLWRLD chia sẻ tầm nhìn về AI vật lý, trình diễn năng lực của RLDX-1 và công bố chiến lược kinh doanh dựa trên mạng lưới đối tác.
Đây là điểm dừng cuối trong chuỗi sự kiện toàn cầu của công ty, sau các chặng tại San Francisco, Tokyo và Taipei.
Tại sự kiện, CEO Ryu Joong-hee nhấn mạnh mục tiêu tự động hóa hoàn toàn bằng robot AI các công việc sản xuất đòi hỏi độ khéo léo tương đương con người. Theo ông, ngay cả những nhà máy có mức tự động hóa cao nhất tại Hàn Quốc cũng mới đạt khoảng 75%, trong khi 25% còn lại vẫn phải do con người đảm nhiệm. Tình hình tại Nhật Bản, Trung Quốc và Mỹ cũng không khác biệt đáng kể.
Ông cho biết gần một nửa công việc trên thị trường lao động hiện vẫn phụ thuộc vào bàn tay con người. Các tác vụ như lắp ráp linh kiện cỡ nhỏ hay lắp ráp thân xe là những công đoạn khó tự động hóa nếu robot không đạt được độ khéo léo như con người. RLWRLD đặt mục tiêu dùng AI để xử lý chính “khâu cuối cùng” này.
Theo RLWRLD, RLDX-1 được phát triển để hiện thực hóa năng lực thao tác ở mức con người cho robot. Công ty tập trung vào ba trụ cột chính gồm dữ liệu, mô hình và triển khai thực tế.
Về dữ liệu, RLWRLD đã xây dựng pipeline riêng. CEO Ryu Joong-hee cho biết công ty thu thập dữ liệu hành vi của con người bằng cách cho người thật thực hiện động tác, sau đó robot học và tái hiện lại. Lotte Hotel hỗ trợ cung cấp không gian khách sạn miễn phí để hai bên phối hợp ghi nhận thao tác của đội ngũ nhân sự khách sạn chuyên nghiệp. Số dữ liệu này sau đó được AI phân tích nhằm chuyển hóa độ khéo léo của con người thành năng lực thao tác của robot.
Ngoài dữ liệu thực, RLWRLD cũng sử dụng pipeline dữ liệu tổng hợp để nâng chất lượng huấn luyện.
Theo CEO Ryu Joong-hee, chỉ cần thu thập khoảng 20% dữ liệu ban đầu, AI có thể tăng cường phần còn lại để hoàn thiện thành 100% bộ dữ liệu. Ông cho biết công ty đã phát triển được mô hình gần như không suy giảm chất lượng khi huấn luyện theo cách này, đồng thời xác nhận pipeline dữ liệu tổng hợp của RLWRLD cho hiệu quả cao hơn pipeline tương ứng của Nvidia.
Ở khâu triển khai, RLWRLD tập trung vào các thử nghiệm chứng minh năng lực cùng nhiều đối tác phần cứng. CEO Ryu Joong-hee cho biết Nvidia, Hanwha, Lotte cùng nhiều doanh nghiệp trong và ngoài nước hiện đang đầu tư hoặc phối hợp thử nghiệm với RLWRLD.
Công ty cũng cho rằng RLDX-1 đã vượt qua các giới hạn cốt lõi của những mô hình AI robot hiện có.
Chief Scientist Shin Jin-woo cho biết lĩnh vực robot gần đây đang chuyển sự quan tâm sang các mô hình nền tảng có thể xử lý nhiều tác vụ khác nhau chỉ bằng một mô hình duy nhất.
Một ví dụ tiêu biểu là dòng Nvidia GR00T. Các mô hình này kết hợp khả năng hiểu ngữ cảnh hình ảnh của mô hình thị giác - ngôn ngữ (VLM) và suy luận ngôn ngữ với điều khiển chuyển động của robot. Tuy nhiên, hạn chế nằm ở chỗ chúng chủ yếu ra quyết định dựa trên một khung hình đơn lẻ.
Theo ông Shin Jin-woo, hạn chế đó có thể được nhìn từ ba khía cạnh. Thứ nhất, để bắt một vật thể đang di chuyển, hệ thống phải đọc được sự thay đổi theo thời gian, điều mà một bức ảnh tĩnh không thể đáp ứng. Thứ hai, một số tác vụ đòi hỏi ghi nhớ ngữ cảnh trước đó, chẳng hạn phải biết trong hộp đang có gì. Thứ ba, những thao tác như cắm phích điện vào ổ hay lấy thẻ ra khỏi khe hẹp không thể thực hiện chính xác nếu thiếu phản hồi về xúc giác và lực.
Ông khẳng định RLDX-1 là mô hình nền tảng robot đầu tiên hiện nay tích hợp đồng thời cả ba yếu tố trên trong một mô hình duy nhất. Theo RLWRLD, trong cả mô phỏng lẫn thử nghiệm trên robot thực, RLDX-1 đều vượt các mô hình cạnh tranh, trong đó có Nvidia GR00T.
Công ty cho biết đây cũng là mô hình nền tảng robot đầu tiên vượt mốc 78% trên benchmark mô phỏng. Với các tác vụ thao tác tinh vi đòi hỏi độ khéo léo ở mức con người, tỷ lệ thành công của RLDX-1 cao gấp hơn 10 lần so với GR00T.
RLWRLD nhận định dù thị trường đã đồng thuận rằng độ khéo léo là yếu tố then chốt, vẫn chưa có câu trả lời rõ ràng về ngưỡng năng lực cần thiết để thương mại hóa. Trên cơ sở đó, công ty đã hợp tác với Nvidia để xây dựng chuẩn đánh giá độ khéo léo ở quy mô toàn cầu, đồng thời gần đây giới thiệu bộ chỉ số DexBench với mục tiêu thúc đẩy tiêu chuẩn này trở thành chuẩn chung của thị trường.