KAIST表示,该校研究团队研发出一项数据库技术,可统一分析文档、数据以及实体关系,用于降低企业AI代理的“幻觉”问题。与传统检索增强生成(RAG)相比,该技术可将AI回答准确率最高提升78%,复合检索性能最高提升20倍以上。
据介绍,KAIST计算机科学系Kim Minsoo教授团队与其教师创业企业GraphAI合作,开发出将向量数据库、图数据库和关系数据库整合进同一数据库管理系统(DBMS)的“AkasikDB”,以及基于该系统构建的“OmniRAG”。
当前,企业AI代理普遍采用RAG技术,通过检索企业内部文档和专业知识生成答案。但研究团队指出,企业数据往往分散在文档、表格和实体关系等不同形态中,难以在同一体系内统一分析处理,这也容易导致AI在依据不足的情况下生成与事实不符的内容,即“幻觉”问题。
OmniRAG可在同一查询和执行计划中,同时处理用于文档语义定位的向量检索、用于实体关系分析的图遍历,以及针对日期、类型等结构化字段的关系过滤。也就是说,该系统能够同时利用文档语义、实体关系和表格等结构化数据,为AI更准确地定位生成答案所需的依据。
为支撑上述能力,AkasikDB采用一体化引擎,将向量数据库、图数据库和关系数据库统一整合。用户只需通过一条SQL/GQL语句,即可发起融合多种检索能力的复合RAG查询,随后由AkasikDB将其优化为单一执行计划完成处理。借助这一一体化架构,系统可减少跨库数据传输和不必要的中间结果生成,从而降低大语言模型(LLM)的Token消耗与响应时延。
实验结果显示,在传统系统中最长需要21.3秒的复合检索查询,采用该技术后可在1秒内完成,性能最高提升20倍以上;与既有RAG相比,OmniRAG的AI回答准确率最高提升78%。
Kim Minsoo表示,要让AI代理准确理解并有效利用企业海量数据,关键在于具备能够在同一系统中统一处理向量、图和关系型数据的基础设施。这项成果有望在国防、制造、金融、法律、科学技术等对可信度要求较高的领域,发挥关键数据基础设施的作用。
另据介绍,本项研究由KAIST计算机科学系博士生Kunho Lee担任第一作者。相关成果已于本月2日在数据库领域国际学术会议“ACM SIGMOD 2026”上以演示论文形式发表。