【サンフランシスコ】Snowflakeは6月2日(現地時間)、データの移動や複製を行わずに、社内外のデータを単一のガバナンスの下で活用できる相互運用機能群を発表した。外部データレイクやオープンシステム上のデータも対象とし、AI活用を前提にデータ基盤の一体運用を進める。
発表は、米サンフランシスコで開催中の年次カンファレンス「Snowflake Summit 26」で行われた。
中核となるのは、Apache Iceberg v3への対応強化と、Apache Icebergテーブル向け機能の拡充だ。対応するデータタイプを広げるほか、システム間の変更追跡や半構造化データの高性能処理を支援する。
プロダクト担当シニアバイスプレジデントのクリスティアン・クライナーマン氏は、「データを移動・複製する従来のやり方では、AIのスピードに追いつけない」と指摘した。その上で、「イノベーションが加速するほど、データの分断が大きな制約になる。Snowflakeは、データの所在を問わず単一のガバナンスを適用し、リアルタイムで活用できる環境を提供する」と説明した。
相互運用戦略の柱の1つとして位置付けるのが、「Horizon Catalog」だ。Apache Polarisを基盤とするオープンなデータレイクカタログで、外部エンジンからSnowflakeが管理するIcebergデータに双方向で読み書きできるようにする。Snowflakeの内外のデータ全体を対象とする単一のガバナンスの基盤としても機能する。
「Catalog Linked Databases」は、外部のIcebergテーブルをSnowflakeから自動的に検出し、アクセス可能にする機能だ。また「Iceberg REST Scan Plan API」により、列マスキングや行レベルアクセス制御などのデータ保護ポリシーを、Iceberg互換エンジン全体に適用できるとしている。
外部システムとの連携も広げる。SAP、Salesforce、Workdayといった主要プラットフォームに加え、AVEVA、IBMとの新たな協業を通じて、「Zero-Copy Integration」によるデータ複製なしの連携を提供する。
AI関連機能も強化する。コーディングエージェント「Cortex」は、Snowflake内のデータに加え、外部データレイクや外部リレーショナルデータベースも含めた横断的な問い合わせを支援する。「Horizon Context」は、適切なデータを自動で特定し、信頼できるビジネスコンテキストを適用できるようにする。Snowflakeは、こうした統合ガバナンス型データ基盤によって、より高度な意思決定が可能になるとみている。
Cortexの機能の1つである「Skill for SAP」は、開発者がSnowflakeからSAPデータに接続し、探索や管理を進めるプロセスを簡素化する。
データ共有機能も拡充する。「Open Data Sharing」は、データをコピーすることなく、あらゆるエンジンから顧客、パートナー、社内チームとデータやAI資産を安全に共有できるようにする。「Automatic Data Agents」により、共有データをCortex、CoWork、Snowsightですぐに使える対話型AIエージェントに変換できるとしている。
このほか、Horizonを基盤とする「Connected Audit」と、外部管理型Icebergテーブル向けの新たな可観測性機能を通じて、Snowflakeおよび外部環境全体におけるデータアクセス状況やパイプラインの状態を一元的に把握できるようにする。
Samsung Ads Engineeringのバイスプレジデント、エルベ・マルチェリニ氏は、「Snowflakeは、データを複製することなくシステム全体で作業できるようにしながら、環境全体で一貫したガバナンスを維持できる」とコメントした。「業務スピードの向上に加え、ターゲティングや測定手法の改善、信頼に基づくAIイノベーションの拡大につながる」としている。
NTTドコモのウメザワ・ヨシオ氏も、「データの所在を問わず同じガバナンスを適用し、一貫して信頼できる基盤を維持できるようになった」と述べた。