写真=KAIST、AI生成

KAISTは19日、文書や構造化データ、エンティティ間の関係を横断的に分析できる統合データベース技術を開発したと発表した。企業向けAIエージェントのハルシネーション抑制を狙うもので、従来の検索拡張生成(RAG)と比べて回答精度を最大78%高め、複合検索を最大20倍以上高速化したという。

開発したのは、キム・ミンス計算学部教授の研究チーム。教員創業企業GraphAIと共同で、ベクターDB、グラフDB、関係型DBを単一のDBMSに統合した「アカシックDB」と、これを基盤とする「オムニRAG」を構築した。

企業向けAIエージェントでは近年、社内文書や専門知識を検索して回答を生成するRAGの活用が進んでいる。一方で、企業内のデータは文書、表形式データ、エンティティ同士の関係など、異なる形で分散している。このため、必要な情報を一元的に扱いにくく、AIが十分な根拠のない誤回答を生成するハルシネーションの一因になっていたという。

オムニRAGは、文書の意味を捉えるベクター検索、エンティティ間のつながりをたどるグラフ探索、日付や種類などで絞り込む関係型フィルタリングを、単一のクエリとして記述し、1つの実行計画で処理する仕組みだ。文書の意味情報、エンティティ間の関係、表形式の構造化データを同時に活用することで、回答の根拠となる情報をより正確に抽出できるとしている。

これを支えるアカシックDBは、ベクターDB、グラフDB、関係型DBを単一エンジンに統合したDBMSだ。利用者は、各検索機能を組み合わせた複合RAGクエリを単一のSQL・GQLクエリとして記述できる。アカシックDBはそれを単一の実行計画に最適化して処理することで、DB間のデータ移動や不要な中間結果の生成を抑制。LLMのトークン使用量と応答遅延の低減にもつなげた。

実験では、従来システムで最大21.3秒かかっていた複合検索クエリを1秒未満で処理し、最大20倍以上の性能向上を確認した。オムニRAGの回答精度も、既存のRAGと比べて最大78%向上した。

キム・ミンス教授は「AIエージェントが企業の膨大なデータを正確に理解し活用するには、ベクター、グラフ、関係型データを単一システムで統合処理できるインフラが必要だ」とコメント。「国防、製造、金融、法務、科学技術など、高い信頼性が求められる分野で中核データ基盤として活用されることを期待している」と述べた。

今回の研究では、イ・ゴンホKAIST計算学部博士課程学生が第一著者を務めた。研究成果は今月2日、データベース分野の国際学会「ACM SIGMOD 2026」でデモ論文として発表された。

キーワード

#KAIST #AI #RAG #アカシックDB #オムニRAG #ベクターDB #グラフDB #関係型DB #LLM
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.