Waker Korea cho rằng rào cản lớn nhất của AI tài chính không nằm ở năng lực của mô hình, mà ở cách thiết kế dữ liệu. Theo công ty, việc thiếu ontology để kết nối tri thức nghiệp vụ với các hệ thống dùng mô hình ngôn ngữ lớn (LLM) đang khiến AI tài chính khó tiến lên một nấc mới.
Nhận định trên được Han Tae-kyung, phụ trách kinh doanh mảng dữ liệu chứng khoán ứng dụng AI tại Waker Korea, đưa ra khi nói về những giới hạn hiện nay của AI tài chính.
Han Tae-kyung là một nhà giao dịch định lượng kiêm lập trình viên với 18 năm kinh nghiệm. Ông tốt nghiệp ngành khoa học máy tính và thống kê tại Đại học Korea, sau đó lấy bằng thạc sĩ kỹ thuật tài chính tại KAIST. Trước khi gia nhập Waker Korea, ông từng làm việc tại Samsung Asset Management, DooMulMeoRi và Mott AI.
Hiện ông tham gia phát triển dịch vụ phân tích thị trường chứng khoán dựa trên AI và ontology tài chính tại Waker Korea.
Theo Han Tae-kyung, sự xuất hiện của AI tạo sinh đã giúp nâng mạnh năng suất phân tích dữ liệu tài chính. Những công việc vốn phải làm thủ công trước đây như phân tích công bố kết quả kinh doanh, trích xuất chủ đề từ tin tức hay mô hình hóa dữ liệu nay đã có thể được AI xử lý, qua đó giúp hiệu suất tăng lên hàng chục lần.
Tuy nhiên, ông cho rằng với AI tài chính, dữ liệu quan trọng hơn việc tiếp tục nâng hiệu năng mô hình.
“Trong thực tế, một mô hình ở mức trung bình nhưng được cấp dữ liệu mới sẽ hữu ích hơn nhiều so với một mô hình có hiệu năng cao nhưng không có dữ liệu mới,” Han Tae-kyung nói. “Điều quan trọng hơn bản thân AI là phải thiết kế xem sẽ đưa gì vào cho AI.”
Ông cũng chỉ ra rằng cách LLM xử lý các bài toán tài chính theo kiểu truy vấn - tìm kiếm vẫn có giới hạn rõ ràng. Chẳng hạn, khi hỏi “cổ phiếu Hàn Quốc nào có ROE cao nhất”, một LLM phổ thông thường chỉ liệt kê “những cổ phiếu Hàn Quốc nổi tiếng có ROE cao”.
Ngược lại, nếu LLM được kết nối với công cụ dữ liệu tài chính phù hợp, hệ thống có thể đưa ra danh sách “cổ phiếu Hàn Quốc có ROE cao” dựa trên dữ liệu thực tế.
Theo Han Tae-kyung, yếu tố cốt lõi của AI tài chính nằm ở các nguồn dữ liệu không sẵn có trên web công khai, cùng với những công cụ phân tích chuyên sâu. Việc câu hỏi nào cần được gắn với loại dữ liệu nào, về bản chất vẫn phải do chuyên gia nghiệp vụ thiết kế.
Ông giải thích ontology tài chính về cốt lõi là quá trình xác định mối quan hệ và ngữ cảnh giữa các loại dữ liệu như kết quả kinh doanh, giá cổ phiếu, chỉ báo kinh tế vĩ mô hay mô hình thống kê, để AI có thể khai thác chúng một cách có ý nghĩa.
Tuy vậy, phần lớn dữ liệu liên quan lại thuộc dạng tri thức ngầm, trong khi nhận thức của thị trường về nhu cầu xây dựng ontology cho ngành này vẫn còn thấp.
“Các chuyên gia định lượng hay chuyên gia đầu tư vốn đã được thị trường đánh giá rất cao, nên họ không có nhiều động lực để hệ thống hóa bí quyết của mình thành dữ liệu học cho AI,” ông nói. “Vì thế, AI tài chính hiện vẫn chưa phản ánh đầy đủ phần tri thức ngầm trong thực tế.”
Han Tae-kyung lấy ví dụ, theo lý thuyết, tỷ lệ nợ cao thường được xem là tín hiệu rủi ro đầu tư, nhưng đánh giá trên thị trường có thể rất khác. “Apple có tỷ lệ nợ khoảng 500%, nhưng không ai cho rằng công ty này sẽ phá sản,” ông nói.
Theo ông, để đánh giá đúng, cần xem xét đồng thời dòng tiền, năng lực huy động vốn và cấu trúc ngành. Tuy nhiên, việc sắp xếp và định nghĩa dữ liệu để tạo ra ngữ cảnh như vậy lại phụ thuộc vào góc nhìn của từng chuyên gia và phần lớn vẫn nằm trong kinh nghiệm cá nhân.
Han Tae-kyung cho rằng nếu không kết nối được lớp tri thức ngầm ngoài thị trường với LLM, AI tài chính sẽ khó tạo ra bước tiến mới. “Việc điều phối để LLM gọi đúng công cụ và đúng dữ liệu chỉ có người thực sự hiểu nghiệp vụ mới làm được,” ông nói, đồng thời nhấn mạnh rằng khi AI tiếp tục phát triển, vai trò của các chuyên gia lĩnh vực nắm giữ loại bí quyết này sẽ càng trở nên quan trọng hơn.