写真=CUBIG

CUBIGは1月28日、合成データの品質と安全性を評価する検証プログラム「SynData v1.0」がGS(Good Software)1等級を取得したと発表した。合成データの有用性と再識別リスクを定量的に評価し、実運用に向けた客観的な検証を支援する。

同社によると、公共、金融、医療など機微情報を扱う分野でデータ活用が広がるなか、合成データは個人情報の漏えいリスクを抑える手段として注目を集めている。

一方で、合成データが実際に活用に耐えうる品質を備えているか、再識別リスクが十分に管理されているかを客観的に示せないため、外部提供や社内でのAI学習、外部企業との協業といった段階で活用が進まないケースも多いという。SynDataは、こうした「検証の空白」を埋めることを狙う。

SynDataは、利用者が生成した合成データを自動分析し、元データとの分布の近さや統計的一貫性、個人情報保護の水準などの主要指標に基づいて、品質と安全性を評価できるようにする。

単純な総合スコアの提示にとどまらず、閾値に基づく判定の目安やクラス別の詳細分析も提供する。これにより、特定区間や特定クラスで生じうる品質低下やプライバシーリスクを早期に見つけやすくしたとしている。

CUBIGは今回のGS1等級取得を機に、公共、金融、医療、製造など機微データを扱う産業で、「合成データの生成→検証→活用」という標準的な運用フローの普及を進める方針だ。合成データを基盤としたAI活用向けデータ整備の現場適用拡大も目指す。

CUBIGのペ・ホ代表は、「合成データは作ることよりも、『使える状態にする』ことのほうが難しい」としたうえで、「SynDataは、合成データを実務やAI学習に投入できるかを客観的に示すツールだ。今回のGS認証取得により、当社の検証体系の信頼性が公的に認められた。国内の合成データ市場で、『生成』にとどまらず『活用』につなげる流れを本格的に広げていきたい」と述べた。

キーワード

#CUBIG #SynData v1.0 #GS(Good Software)1等級 #合成データ #プライバシー #合成データ検証 #AI
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.