AI企業が課金体系を定額制から従量課金へ移す中、AIエージェントの運用に伴うトークン消費が新たなコスト負担として浮上している。こうした状況を受け、データベース各社はトークン消費の抑制を狙った専用基盤の投入を進めている。The Registerが24日、報じた。
ベクトルDBを手がけるPineconeはこのほど、知識エンジン「Nexus」を投入した。社内データの構造や文脈をあらかじめ整理し、AIエージェントが同じ探索を繰り返さないようにする仕組みだ。
Pineconeの製品担当VP、ジェフ・ジュー氏は「コーディングエージェントは、質問を受けるたびにテーブル構造を把握し、探索を繰り返す」と説明。「正答にたどり着いても、その過程で大量のトークンを消費する。Nexusはこうした繰り返し処理を前段で吸収し、再利用できる文脈を保存する」と述べた。
The Registerによると、IDCのリサーチディレクター、デビン・プラット氏はNexusについて、コストを後追いで考えるのではなく、設計段階から織り込む発想だと評価した。クエリ層でトークン予算を管理し、利用量を追跡できる点を高く見ているという。
同氏はまた、エージェント型AIの導入における主要課題が、AIモデルそのものから周辺のデータインフラへ移りつつあるとの見方を示した。
IDCの調査では、生成AIおよびエージェント型AIの拡大を阻むデータ基盤面の課題として、セキュリティ・コンプライアンス上の制約とコストが挙がった。さらに、組織のほぼ3分の2が11種類以上の異なるデータベース技術を運用しており、データベースの分断も深刻だという。
TimescaleDBの開発元であるTigerDataは、AIエージェント向けのデータベースプラットフォーム「Ghost」を発表した。エージェントごとに独立したPostgreSQLデータベースを即座に用意でき、実験後は削除できるため、他のエージェントや利用者への影響を抑えられるとしている。
課金はデータベース数ではなく、実際に使ったコンピューティング時間に基づいて行う。TigerDataの共同創業者兼CEO、アジェイ・クルカルニ氏は「データベースが1つでも50でも費用は変わらず、支払うのはコンピューティング時間分だけだ」と説明した。
The Registerはこのほか、Snowflake、Oracle、Microsoftといった大手プラットフォーム企業も、同様の機能を自社基盤に取り込みつつあると伝えた。