Metaが、AI向け学習データを手掛けるMercorとの進行中の案件を全面停止し、セキュリティ事故の調査に着手した。米Wiredが3日(現地時間)に報じた。学習データが流出した可能性が浮上したことを受けた措置とみられる。
Mercorは、大規模な契約人材ネットワークを通じて、OpenAIやAnthropicなど主要なAI開発企業にカスタムデータセットを供給してきた。こうした中、同社は最近、セキュリティ侵害を受けたという。
今回の事案は、LiteLLMのアップデートを通じたサプライチェーン侵害と関連している可能性がある。LiteLLMは、OpenAI、Anthropic、Googleなど主要AIサービスを呼び出すための標準的なアダプターライブラリだ。報道によると、TeamPCPとして知られる攻撃者が、改ざんされたアップデートを配布したとされる。
OpenAIは、ユーザーデータの流出はなかったとしている。一方で、自社の学習データが外部に漏えいした可能性については調査を進めている。他のAI開発企業もMercorとの関係見直しを進めているという。
AIの学習データセットやデータラベリングのパイプラインは、業界にとって重要な営業機密だ。流出した場合、モデルの学習手法やデータセットの構成、ラベリング手法などが外部に漏れる可能性があると指摘されている。
著者について