Databricksは6月16日(現地時間)、トランザクションDBと分析基盤を単一データ基盤で統合する新アーキテクチャ「LTAP(Lake Transactional/Analytical Processing)」と、リアルタイム分析エンジン「Lakehouse//RT」を発表した。AIエージェントの活用拡大を見据え、従来は分離されてきた業務処理と分析処理の一体運用を訴求する。
発表は、サンフランシスコで開催した年次カンファレンス「Data + AI Summit」で行った。Lakehouse//RTについては、別個のシステムを用意せずにミリ秒単位の応答性能を実現するリアルタイム分析基盤として打ち出した。
同社によると、LTAPはデータレイク上の単一データを基盤に、トランザクション処理と分析処理を同時に担うアーキテクチャだ。業務アプリケーション、分析システム、AIエージェントが同じデータにアクセスできるため、運用環境と分析環境をつなぐCDC(Change Data Capture)パイプラインや、運用データを分析基盤に移すETL(Extract, Transform, Load)処理、複製DBが不要になるとしている。
Databricksは、AIエージェントがデータをほぼリアルタイムで読み取り、分析し、アクションを実行することを踏まえ、従来型アーキテクチャではAIエージェント時代に対応しにくいとの見方を示した。
米SiliconANGLEによると、Databricksでプロダクトマネジメント担当バイスプレジデントを務めるシャンカール・ニヨギ氏は、「エージェントは人間よりも速くデータを分析し、実行に移す必要がある。その結果、データスタックがボトルネックになっている」と述べた。
企業では長年、トランザクション処理と分析処理を別々のシステムで運用してきた。業務アプリケーションはトランザクションDBにデータを書き込み、分析システムはETLやCDCパイプラインを通じて複製データを利用する構成が一般的だった。
Databricksは、こうした構成が遅延や複雑化、ガバナンス上の問題を招いており、AIアプリケーションの増加に伴って課題がさらに大きくなると指摘した。
ニヨギ氏は、大手銀行の顧客が現在、数十万のPostgreSQLデータベースを運用し、それぞれのCDCパイプラインを通じてデータをレイクに取り込んでいることも明らかにした。
LTAPは、同社が昨年発表したデータベースプラットフォーム「Lakebase」を基盤とする。トランザクションデータをDelta LakeやApache Icebergといったオープンなカラム形式に直接書き込みながら、PostgreSQLとの互換性も維持する。
あわせて発表したLakehouse//RTは、新たな実行エンジン「Radeon」を採用したリアルタイム分析エンジンだ。Databricksによると、小規模ジョブでは最短10ミリ秒、大規模ジョブでも100ミリ秒未満の応答速度を実現するという。
LTAPはLakebaseの顧客向けアップグレードとして提供する。Lakehouse//RTはベータテストを開始しており、既存のレイクハウス顧客は現行サブスクリプションのまま利用できるとしている。