Ảnh: Shutterstock

Pinecone, một trong những công ty tiên phong trên thị trường cơ sở dữ liệu vector phục vụ RAG (Retrieval-Augmented Generation), đang chuyển sang một thông điệp mới trong cuộc đua AI agent. Công ty vừa ra mắt Nexus, được giới thiệu là một “knowledge engine” dành cho agent, đồng thời cho rằng cách làm RAG truyền thống đang bộc lộ nhiều giới hạn.

Theo The New Stack, trong 4 năm qua, Pinecone đã cung cấp cho 800.000 lập trình viên các phương pháp như chunking, embedding và truy xuất để triển khai RAG. Tuy nhiên, đầu tháng 5, công ty công bố Nexus như một cách tiếp cận khác cho bài toán ngữ cảnh của AI agent.

Pinecone cho rằng mô hình truy xuất ngữ cảnh ở thời điểm suy luận của RAG đã trở nên lỗi thời đối với AI agent. Theo công ty, agent thường mắc kẹt trong vòng lặp “tìm kiếm - đọc - tìm kiếm”, chỉ hoàn thành được 50-60% công việc, trong khi tới 85% nỗ lực bị tiêu tốn vào việc kéo ngữ cảnh về hệ thống.

Lập luận của Pinecone là việc đưa các “chunk” dữ liệu thô vào các mô hình AI tiên tiến rồi kỳ vọng mô hình tự diễn giải, như cách RAG hiện nay đang vận hành, là thiếu ổn định, chậm và tốn kém.

Công ty mô tả khác biệt cốt lõi như sau: nếu RAG truyền thống truy xuất thông tin và diễn giải ngay khi agent nhận câu hỏi, thì Nexus xử lý và cấu trúc tri thức từ trước, trước khi truy vấn phát sinh.

Đi cùng Nexus là KnowQL, ngôn ngữ truy vấn được Pinecone phát triển cho cách tiếp cận này. Công ty khẳng định giải pháp mới có thể nâng tỷ lệ hoàn thành tác vụ lên trên 90%, đồng thời cắt giảm 90% chi phí token.

Trong bài viết trên The New Stack, Janakiram MSV nhận định rằng các con số trên vẫn cần được kiểm chứng thêm. Dù vậy, ông cho rằng lập luận về kiến trúc là hợp lý, ngay cả khi chưa xét tới số liệu cụ thể. Theo ông, cách tiếp cận “compile một lần, đọc nhiều lần” phù hợp với đặc tính tải công việc của AI agent.

Không chỉ Pinecone theo đuổi hướng đi này. Anthropic đã phát hành dạng “skill” cho phép đóng gói và tái sử dụng các ngữ cảnh thường dùng. Cursor Rules của công cụ AI coding Cursor cũng đảm nhiệm vai trò tương tự ở lớp trình soạn thảo. Trong khi đó, Claude Code sub-agent đóng gói sẵn ngữ cảnh và công cụ theo từng tác vụ. Harrison Chase của LangChain nhiều tháng qua cũng gọi xu hướng này là “context engineering”, và cho rằng Pinecone đang đưa mô hình đó xuống lớp truy xuất.

Dù vậy, vẫn còn những ý kiến hoài nghi. Janakiram MSV lưu ý rằng để KnowQL thực sự phát huy sức mạnh, ngôn ngữ này cần được chấp nhận như một tiêu chuẩn chung của ngành, tương tự SQL. Theo ông, một chuẩn công nghiệp không thể được hình thành chỉ từ tuyên bố của riêng một công ty.

Từ khóa

#Pinecone #RAG #AI agent #Nexus #KnowQL #cơ sở dữ liệu vector
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.