Sự kiện AI Partners Day 2026 do BespinGlobal tổ chức ngày 31/3/2026. Ảnh: BespinGlobal

Nhiều doanh nghiệp chưa thu được hiệu quả tương xứng từ đầu tư AI vì tiếp cận sai ngay từ đầu: ưu tiên công nghệ trước bài toán kinh doanh, đánh giá thấp độ phức tạp của dữ liệu và thiết kế hệ thống theo góc nhìn nhà cung cấp thay vì người dùng. Đây là nhận định của ông Han Seon-ho, Phó chủ tịch kiêm Giám đốc AI (CAIO) của BespinGlobal.

Phát biểu khai mạc tại sự kiện AI Partners Day 2026 do BespinGlobal tổ chức ngày 31/3, ông Han cho rằng AI không đơn thuần là vấn đề công nghệ mà là vấn đề quản trị. Theo ông, doanh nghiệp không thể để bộ phận IT và bộ phận AI vận hành tách rời, mà cần vừa hợp tác với đối tác am hiểu công nghệ, vừa đồng thời xây dựng năng lực nội bộ.

“Doanh nghiệp tạo ra kết quả với AI không phải vì dùng công nghệ tốt, mà vì xác định đúng vấn đề cần giải quyết”, ông nói.

Theo ông Han, một sai lầm phổ biến là chọn công cụ trước rồi mới đi tìm bài toán phù hợp. Tâm lý sợ tụt lại phía sau trong cuộc đua công nghệ đang khiến không ít doanh nghiệp đi theo cách tiếp cận này.

Ông lấy text-to-SQL làm ví dụ. Đây là công nghệ cho phép người dùng đặt câu hỏi bằng ngôn ngữ tự nhiên, sau đó AI truy xuất dữ liệu thời gian thực từ cơ sở dữ liệu để tạo câu trả lời.

Theo ông, text-to-SQL có thể rút ngắn đáng kể thời gian khai thác dữ liệu. Nhân viên có thể nhận được thông tin cần thiết trong vòng 2-5 phút mà không phải gửi yêu cầu cho bộ phận IT, trong khi trước đây quy trình này thường mất từ một đến hai tuần. Tuy vậy, bài toán lớn nhất vẫn là độ chính xác.

Ông cho biết text-to-SQL vận hành theo cơ chế sai số tích lũy qua từng bước. Nếu độ chính xác của các khâu lần lượt là 95% ở bước nhận diện ý định người dùng, 95% ở truy xuất dữ liệu, 90% ở tạo câu lệnh SQL và 99% ở tạo câu trả lời, thì độ chính xác cuối cùng chỉ còn khoảng 80%.

“Mô hình đứng đầu bảng xếp hạng có thể đạt 95,8% trong một môi trường cụ thể, nhưng trong môi trường doanh nghiệp tại Hàn Quốc chỉ ở mức 65,8%. Nếu không vượt 90% thì rất khó đưa vào vận hành thực tế. Chỉ nên dùng khi thực sự cần thiết”, ông nói.

Từ đó, ông đề xuất doanh nghiệp phải xác định bài toán trước khi chọn công nghệ. Theo ông, trước hết cần đánh giá một tác vụ cụ thể có tạo ra tác động thực chất với hoạt động kinh doanh hay không, sau đó mới chọn công nghệ có hiệu quả chi phí tốt nhất để xử lý. Nếu làm ngược lại, hệ thống rất dễ trở thành khoản đầu tư tốn kém nhưng không tạo ra giá trị.

Một điểm khác thường bị doanh nghiệp xem nhẹ trong dự án AI là độ phức tạp của dữ liệu. Ông Han cho rằng quan niệm chỉ cần parsing, chunking rồi xây vector database là đủ là cách nhìn quá đơn giản.

Theo ông, vector database là công nghệ biểu diễn dữ liệu phi cấu trúc trong không gian đa chiều và tìm ra câu trả lời gần nhất theo xác suất. Dù hữu ích, công nghệ này không đảm bảo đáp án tuyệt đối chính xác và tồn tại những giới hạn mang tính cấu trúc.

Ông nêu bốn hạn chế chính của vector database: khó xử lý quan hệ đa chiều và cấu trúc phân cấp; khó kết hợp đồng thời dữ liệu có cấu trúc với dữ liệu phi cấu trúc; dễ phát sinh “ảo giác” (hallucination) khi các thuật ngữ chuyên ngành bị cắt rời theo từng chunk; và không phù hợp với các suy luận phức hợp.

Để khắc phục những điểm yếu này, ông đề xuất kết hợp graph database với cách tiếp cận dựa trên ontology.

Ông dẫn một ví dụ trong lĩnh vực bảo hiểm, nơi graph database cho phép liên kết rõ cấu trúc quan hệ giữa sản phẩm, điều khoản bổ sung và bệnh tật, từ đó chỉ cung cấp cho LLM những thông tin chính xác cần thiết. Trong một trường hợp khác ở lĩnh vực sản xuất, doanh nghiệp xây dựng dữ liệu chuỗi cung ứng bằng ontology chuyên biệt theo từng miền và ghi nhận hiệu quả thực tế thông qua phản hồi theo từng giai đoạn.

“Dữ liệu không phải càng nhiều càng tốt. Điều quan trọng là cấu trúc phải đúng”, ông nói.

Với cách thiết kế theo góc nhìn nhà cung cấp, ông Han cho rằng vấn đề nằm ở chỗ hệ thống được xây từ quan điểm của bên phát triển thay vì người dùng thực tế. Theo ông, một giải pháp có thể rất ấn tượng về mặt kỹ thuật, chạy tốt trong bản demo và được đánh giá cao trong các buổi báo cáo với lãnh đạo, nhưng sẽ không có ý nghĩa nếu nhân sự tuyến đầu không sử dụng.

Ông lấy ví dụ một doanh nghiệp logistics đã kết nối nhiều giải pháp dựa trên mô hình machine learning để nâng cấp hệ thống quản lý kho. Ban lãnh đạo kỳ vọng đây sẽ là một dự án thành công, nhưng trải nghiệm của khách hàng ở khâu giao hàng cuối cùng lại sụp đổ hoàn toàn.

“Khách hàng muốn nhận hàng đúng giờ và theo dõi tiến trình giao hàng theo thời gian thực, nhưng hệ thống lại không được thiết kế cho nhu cầu đó. Họ chỉ nhìn vào hiệu suất từ phía nhà cung cấp và bỏ qua điểm đau của khách hàng”, ông nói.

Ông cũng nhấn mạnh rằng nhiều vấn đề doanh nghiệp nhìn thấy thực chất chỉ là biểu hiện bề mặt. Theo ông, thay vì xử lý phần ngọn, doanh nghiệp cần đào sâu nguyên nhân gốc rễ. Ngay cả khi các trưởng nhóm cùng chọn ra 10 use case rồi rút xuống còn 3 để triển khai trước, dự án vẫn khó tạo kết quả nếu không xuất phát từ vấn đề thực tế mà lực lượng tuyến đầu đang gặp phải.

“Doanh nghiệp cần dành thời gian để tìm đúng bài toán. Thay vì bám vào hiện tượng, phải truy tìm nguyên nhân gốc và bắt đầu từ những trường hợp có tác động rõ ràng đến kinh doanh. Cũng không nên triển khai theo kiểu big-bang, mà nên bắt đầu nhỏ, kiểm chứng bằng dữ liệu thực rồi mở rộng theo từng giai đoạn. Thời gian dành cho chẩn đoán và giám sát còn quan trọng hơn cả thời gian tạo AI agent”, ông nói.

Từ khóa

#BespinGlobal #AI #CAIO #text-to-SQL #vector database #graph database #ontology #LLM #hallucination
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.