韓国でデータ取引の本格化が進んでいる。改正データ3法の施行によって、仮名化・匿名化したデータの外部提供と活用に道が開かれたことが背景にある。AIの競争力がデータの量だけでなく質にも左右されるなか、データ品質の評価やメタデータ整備の重要性が増している。
データはしばしば「未来の鉱山」と呼ばれる。しかし、個人情報分野を除けば、データに関する標準化や品質の公的評価はなお十分とは言い難い。AIが学習に使うビッグデータは幅広い情報を取り込むだけに、精度の低いデータで学習すれば、AIの出力や判断の質も低下しかねない。
データにはライフサイクルがあり、継続的な更新が欠かせない。例えば、飲食店が休憩時間の変更をWebサイトに反映していなければ、AI経由で情報を得て予約した利用者が店舗で混乱する恐れがある。こうした問題はAIそのものではなく、元となるデータの不備に起因する場合が少なくない。
AIが機械学習に使うデータにも、安全性と信頼性が求められる。韓国では2020年8月、いわゆる「データ3法(個人情報保護法、情報通信網法、信用情報法)」の改正案が施行され、個人を識別できないよう仮名化・匿名化したデータについて、外部提供と利用が可能になった。これはデータ取引の制度的な基盤であると同時に、保護の仕組みでもある。
AIに量・質の両面で十分なビッグデータを供給するには、データに関わるすべての主体が品質に目を向ける必要がある。海外の疾病データで学習したAIが韓国では期待した精度を示せなかった事例は、データ品質の重要性を端的に示している。
2022年に始まったマイデータ事業は、データの主権が個人にあり、その責任と管理も個人が担うという考え方に立つ。個人が自らのデータに関心を持つことで、蓄積された情報は、非識別化を施した後も高い価値を持ち得る。
大学入試コンサルティング企業は、進学関連データを蓄積し、受験生から対価を得て助言を提供している。過去の入試データや政府の入試政策を踏まえて合格可能性の指標を組み立てることで、データは情報や知見へと転換され、付加価値を生む。
こうした文脈では、データは資産として認識され得る。企業は法の許す範囲で、データの利用権を市場で販売できるようになる。
AI時代には、あらゆる情報に活用余地がある。ただ、データを売買の対象として捉えると、その意味合いは変わる。AIの性能向上に直結するデータであれば、量が限られていても、AI提供企業は高い対価を支払う可能性があるからだ。
実際、Microsoft、Google、MetaなどのAI企業は、データラベリングに巨額を投じている。一方で、一般的なデータの価値を市場で分かりやすく伝える仕組みづくりも欠かせない。
生データだけでは、第三者がその価値を容易に判断することは難しい。データを使ってプロジェクトを進めるには、分析や解釈の前段階として、相応の前処理が必要になる。
このため、取引されるデータには十分な前処理が施され、内容を説明するメタデータも整備されている必要がある。加えて、そのデータからどのような付加価値を創出できるのか、ベストプラクティスとして提示することも重要だ。データが情報、知識、インサイトへとつながるほど、その価値は高まる。
2025年にデータ産業協会が発刊した「大韓民国データ産業の現況と未来展望、グローバル動向」によると、韓国のデータ取引規模は30兆ウォンを超え、年率12.7%で成長している。これまでのデータ生産量の急増に続き、今後はデータ取引も急拡大する可能性が高い。
政府はこうした動きに備え、技術士レベルのデータ取引士の育成を進めており、すでに1000人超を輩出した。今後は、さまざまな機関や企業がデータ取引士を採用・配置する時代が近づくとみられる。データとAIは企業と国家の中核的な競争力となりつつあり、形成が進むデータ取引エコシステムの行方が注目される。