Dinoticia ngày 24/3 công bố dịch vụ SaaS Seahorse Cloud, nhằm tự động hóa khâu tiền xử lý tài liệu phi cấu trúc - một trong những nút thắt lớn khiến nhiều doanh nghiệp gặp khó khi triển khai AI. Nền tảng này cho phép xử lý toàn bộ quy trình từ tải tài liệu lên, phân tích nội dung, chuẩn hóa cấu trúc đến vector hóa trong cùng một môi trường.
Theo Dinoticia, để đưa AI tạo sinh và agent AI vào quy trình làm việc, doanh nghiệp trước hết phải chuyển đổi các dữ liệu phi cấu trúc như PDF, hình ảnh và tài liệu sang định dạng mà AI có thể xử lý. Tuy nhiên, do dữ liệu không đồng nhất về định dạng, quá trình này thường đòi hỏi pipeline riêng hoặc phải xử lý thủ công.
Seahorse Cloud được cung cấp theo mô hình managed service, tích hợp RAGOps dựa trên cơ sở dữ liệu vector và AgentOps để vận hành agent AI. Với nền tảng này, doanh nghiệp có thể xử lý dữ liệu vector, thiết lập cấu hình RAG, đồng thời thiết kế và vận hành agent trên cùng một môi trường mà không cần tự xây dựng hạ tầng riêng.
Ở khâu phân tích tài liệu, dịch vụ sử dụng công nghệ phân tích bố cục dựa trên VLM để tách cấu trúc trang, bảng biểu và khu vực hình ảnh. Sau đó, hệ thống thực hiện OCR và làm sạch văn bản bằng LLM, từ đó cấu trúc hóa tài liệu theo các đơn vị ngữ nghĩa.
Các bảng biểu được nhận diện và khôi phục riêng để hạn chế mất mát thông tin, đồng thời cải thiện độ chính xác của tác vụ hỏi đáp. Với các tài liệu dựa trên hình ảnh như lưu đồ, hệ thống cũng hỗ trợ chuyển đổi sang văn bản để agent AI có thể sử dụng cho tìm kiếm theo ngữ cảnh.
Dịch vụ hiện được cung cấp trên hạ tầng Amazon Web Services (AWS) và có thể sử dụng ngay qua website chính thức cùng bảng điều khiển quản trị. Dinoticia cho biết doanh nghiệp vẫn có thể triển khai dịch vụ này song song với hạ tầng đám mây hiện có. Người dùng ban đầu sẽ được cấp credit dùng thử.
Đại diện Dinoticia cho biết Seahorse Cloud giúp doanh nghiệp xử lý khối lượng lớn tài liệu phi cấu trúc trong môi trường SaaS tích hợp và rút ra insight từ dữ liệu.