Ngày 23/6, Naver cho biết Naver Labs Europe đã giới thiệu DIVINE, bộ mã hóa dùng chung dành cho các tác vụ thị giác AI trên robot tự hành, nhằm giúp robot nhận biết môi trường nhanh hơn mà không cần cấu hình phần cứng tính toán cỡ lớn.
Theo Naver, DIVINE hỗ trợ robot tự hành thực hiện nhiều tác vụ trong môi trường công nghiệp lẫn đời sống. Bộ mã hóa này có nhiệm vụ mã hóa dữ liệu đầu vào mà robot thu thập từ camera, cảm biến LiDAR và các nguồn khác để mô hình AI có thể xử lý.
Trước đây, robot tự hành thường phải dùng các mô hình AI và bộ mã hóa riêng cho từng tác vụ như định vị, ước tính độ sâu, hiểu không gian hay nhận diện con người. Cách tiếp cận này khiến cùng một dữ liệu bị xử lý lặp lại nhiều lần. Naver Labs Europe cho biết đã khắc phục hạn chế đó bằng phương pháp chưng cất tri thức từ nhiều mô hình giáo viên, rút ra năng lực cốt lõi từ các mô hình chuyên biệt và tích hợp vào một mô hình duy nhất.
DIVINE gói gọn các năng lực như hiểu ảnh 2D, tái dựng không gian 3D và nhận diện con người trong cùng một bộ mã hóa.
Kết quả thử nghiệm cho thấy tải tính toán giảm đáng kể trong khi hiệu năng được cải thiện. So với cấu hình sử dụng nhiều bộ mã hóa, bộ nhớ dành cho bước mã hóa giảm khoảng 90%, còn tốc độ xử lý ở bước mã hóa nhanh hơn tối đa 12 lần.
Ở cấp độ toàn hệ thống, mức sử dụng bộ nhớ của robot giảm khoảng 62%, trong khi tốc độ xử lý tổng thể tăng tối đa 4 lần.
Theo Naver, nhờ đó, việc đưa các mô hình AI mạnh hơn lên cả những robot cỡ nhỏ, vốn không được trang bị hệ thống tính toán lớn, sẽ trở nên dễ dàng hơn. Điều này cũng mở ra dư địa triển khai robot rộng hơn trong tương lai.
Lee Dong-hwan, Trưởng nhóm Vision Group của Naver Labs, cho biết việc tinh gọn “bộ não” của robot đang trở thành một chủ đề lớn trong quá trình thương mại hóa physical AI trên toàn cầu. Ông nói DIVINE có thể góp phần hạ thấp rào cản đưa robot AI vào các bối cảnh công nghiệp và đời sống.
Ngoài ra, hai nghiên cứu liên quan đến DIVINE đã được chấp nhận tại Hội nghị Thị giác Máy tính châu Âu (ECCV) và Hội nghị Thị giác Máy tính và Nhận dạng Mẫu (CVPR), cho thấy năng lực công nghệ của công ty đã được giới học thuật ghi nhận.