Ngày 17/4, Agilesoda công bố Agentic OCR, nền tảng trí tuệ nhân tạo (AI) tự động hóa xử lý tài liệu, có thể triển khai mà không cần huấn luyện mô hình riêng cho từng loại tài liệu.
Theo công ty, điểm đáng chú ý của nền tảng là rút ngắn thời gian bổ sung loại tài liệu mới từ vài tuần hoặc vài tháng xuống còn trong ngày.
Trước đây, công nghệ AI OCR (nhận dạng ký tự quang học) thường đòi hỏi thu thập dữ liệu huấn luyện theo từng loại tài liệu và xây dựng mô hình riêng. Ngay cả khi biểu mẫu chỉ thay đổi nhỏ, doanh nghiệp cũng phải huấn luyện lại từ đầu, khiến quá trình vận hành kém linh hoạt.
Agilesoda cho biết với Agentic OCR, người dùng chỉ cần xác định các trường thông tin cần trích xuất như “tên”, “ngày hợp đồng” hay “số tiền”, sau đó mô hình ngôn ngữ lớn (LLM) và mô hình thị giác-ngôn ngữ (VLM) sẽ tự động tìm và lấy dữ liệu từ tài liệu. Khi tải lên tài liệu mẫu, hệ thống cũng tự tạo bản nháp cho tiêu chí phân loại và các trường thông tin cần trích xuất. Nền tảng không yêu cầu viết mã hay chuẩn bị dữ liệu huấn luyện riêng, nên người dùng chỉ cần rà soát và chỉnh sửa là có thể bắt đầu xử lý ngay trong ngày.
Theo kết quả kiểm chứng nội bộ của Agilesoda, khi thử nghiệm trên 20 loại tài liệu có cấu trúc và phi cấu trúc, hệ thống đạt độ chính xác phân loại 98%, còn độ chính xác trích xuất thông tin từ 95% trở lên.
CEO Choi Dae-woo cho biết: “Suy cho cùng, công việc trong doanh nghiệp bắt đầu từ tài liệu”. Ông nói Agentic OCR không đơn thuần là phần mở rộng của OCR truyền thống, mà là bước khởi đầu để xây dựng một nền tảng tác tử tài liệu. Nền tảng này hướng tới việc bao quát chuỗi nghiệp vụ xoay quanh tài liệu, từ chatbot dựa trên tìm kiếm tăng cường tạo sinh (RAG), đối chiếu và phân tích tài liệu đến tự động hóa nghiệp vụ.
Agilesoda cho biết sẽ mở rộng nhóm khách hàng thử nghiệm Agentic OCR từ nay đến hết quý II năm nay. Công ty đặt mục tiêu phát triển sản phẩm thành một “nền tảng tác tử tài liệu”, phục vụ phát triển, triển khai và vận hành các tác tử dựa trên tài liệu cho tự động hóa nghiệp vụ doanh nghiệp, thay vì chỉ dừng ở xử lý tài liệu.