韩国科学技术信息通信部。图片来源:韩国科学技术信息通信部

韩国政府将启动对公共部门分散持有的AI训练数据的全面调查。

韩国科学技术信息通信部与韩国智能信息社会振兴院(NIA)10日表示,将开展“AI训练数据现状调查”。这是韩国首次针对中央各部门及公共机构持有的AI训练数据进行系统梳理,旨在全面掌握数据现状,为后续高质量数据的供给和利用打下基础。

随着生成式AI加快普及,产业界和公共领域对数据的需求迅速上升。由于公共数据长期由各机构分散管理,政府此前难以统一掌握其总体规模和可用程度,外界也持续指出,这在一定程度上限制了AI企业获取和使用训练数据。

韩国科学技术信息通信部表示,将依据《AI基本法》对各部门展开调查,对数据资源进行系统梳理,并筛选出100类可用于AI训练的数据,纳入“AI训练数据统一提供体系”集中供给。此次调查不仅统计现有持有情况,也将把未来经加工后可用于训练的数据一并纳入范围。调查重点包括与AI训练直接相关的内容,如数据类型和结构、建设目的以及可提供范围等。

入选的100类数据在供给前还将进行进一步加工,包括质量提升和去标识化处理。对于不适合在线公开的数据,则将通过“数据安心区域”提供。“数据安心区域”是通过物理和技术手段实施安全管控的专用空间,用于在安全条件下分析未开放数据,目前共有11家机构运营14个区域。

与此同时,韩国科学技术信息通信部还将同步升级现有“AI Hub”,将其打造为AI训练数据统一提供体系的一部分。相关举措旨在推动数据发现、供给和利用形成闭环,并为活跃AI训练数据交易建立配套机制。

韩国科学技术信息通信部人工智能政策室室长Kim Kyung-man表示,AI的性能和质量,很大程度上取决于可用数据。政府将系统发掘公共数据资源,并持续完善AI训练数据统一供给基础设施。

关键词

#韩国科学技术信息通信部 #NIA #AI训练数据 #公共数据 #生成式AI #AI基本法 #AI Hub #数据安心区域 #AI训练数据统一供给体系 #数据治理
版权所有 © DigitalToday。未经授权禁止转载或传播。