写真=科学技術情報通信部

科学技術情報通信部と韓国知能情報社会振興院(NIA)は4月10日、全省庁を対象に「AI学習用データ現況調査」を実施すると発表した。各省庁と公共機関が保有するAI学習用データの現状を体系的に把握し、活用可能性の高い高品質データの確保につなげる初の全数調査となる。

生成AIの普及を背景に、産業界と公共分野の双方でデータ需要は急速に拡大している。一方、公共データは機関ごとに分散して管理されており、全体像や実際の活用可能性を把握しにくい状況が続いていた。AI企業が学習用データとして活用するうえで制約があるとの指摘も出ていた。

科学技術情報通信部は、AI関連法に基づき全省庁を調査対象とする。保有するデータ資産を体系的に診断したうえで、活用可能性の高いデータ100種を選定し、「AI学習用データ統合提供体制」を通じて連携・提供する方針だ。

今回の調査では、単なる保有状況の確認にとどまらず、追加加工によって今後活用が見込めるデータも対象に含める。調査項目は、データの種類や構造、構築目的、提供可能な範囲など、AI学習への活用に直結する要素を中心に構成する。

選定した100種のデータは、品質補完や非識別化などの追加加工を経て提供する。オンラインでの公開が難しいデータについては、「データ安心区域」を通じて提供する。

データ安心区域は、未公開データを安全に分析できるよう物理的・技術的な保護措置を備えた環境で、現在は11機関で14区域が運営されている。

科学技術情報通信部は、既存の「AIハブ」についても、AI学習用データの統合提供基盤として高度化を進めている。データの発掘、確保、活用へとつなげる好循環を整え、AI学習用データ取引の活性化に向けた体制構築を目指す。

科学技術情報通信部のキム・ギョンマン人工知能政策室長は「AIの性能と品質の鍵は、活用可能なデータにある」としたうえで、「公共が保有するデータ資産を体系的に発掘し、AI学習用データの統合提供基盤を継続的に発展させていく」と述べた。

キーワード

#AI #AI学習用データ #科学技術情報通信部 #韓国知能情報社会振興院 #AIハブ #データ安心区域
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.