韓国政府が進める「独自AI基盤モデル」事業で、Naver Cloudが1次審査で失格となった。判断の分かれ目となったのは、モデルの独自性を測る「From Scratch」の要件を満たすかどうかだ。業界では、今後の2次審査でも独自性の評価が大きな争点になるとの見方が広がっている。
◆「From Scratch」が審査の焦点に
独自AI基盤モデル事業は、海外の大規模AIモデルへの依存が招く技術面、文化面、経済安全保障面での従属からの脱却を目指す国家プロジェクトだ。政府は「AI3強」入りを掲げ、国民生活に密接に関わる分野で自律的に活用できる国産AIモデルの確保を目標に据えている。
募集要項の段階から、審査で重視されてきたのは「独自性」だった。科学技術情報通信部は独自AI基盤モデルについて、「海外モデルをファインチューニングして開発した派生モデルではなく、モデル設計から事前学習までを自ら担った国産モデル」と定義している。性能が高くても、海外モデルを単に変形しただけでは「独自AI」とはみなさないという考え方だ。
この文脈で注目されてきたのが「From Scratch」だ。データ収集、モデル設計、学習アルゴリズムの構築、データ処理に至るまで、AIモデルを一から自前で企画・開発する方式を指す。政府が独自性を前面に打ち出してきたことから、今回の審査でも重要な評価項目になるとみられていた。
論争の発端となったのは、Naver Cloudが「HyperCLOVA X Seed 32B Think」で、中国AlibabaのオープンソースAI「Qwen 2.4」のビジョンエンコーダーを活用していた点だ。ビジョンエンコーダーは、画像や映像、音声などのデータを数値化し、AIが理解できる形に変換するモジュールを指す。
AIモデルにおける「重み」は、学習を通じて形成される数値パラメータで、事実上モデルの知能を構成する要素とされる。このため、単に構造や部品を参考にするのとは異なり、重みまで取り込めば他モデルの知能を実質的に利用することになる、との指摘が出ていた。
科学技術情報通信部も、海外モデルの重みを採用した場合は「From Scratch」の基準を満たさないと判断した。Naver Cloudはベンチマーク評価自体は通過したが、独自性評価で退けられた。同部は1次審査結果の公表に合わせ、「オープンソース活用は一般的な流れだが、重みを初期化したうえで学習を進めながらAIモデルを開発することが、国内外の産業界・学界で通用する独自AIモデルの基本条件だ」と説明した。
コリョ大学技術経営専門大学院のイ・ソンヨプ教授は、「政府が強調するソブリンAIの趣旨を踏まえれば、独自AI基盤モデルは技術従属の懸念を残してはならない」と指摘したうえで、「今回の科学技術情報通信部の判断は予想の範囲内だった」と述べた。国家の中核インフラに適用するAIの確保を目指す事業である以上、外部モデルの利用を巡って論争のあるチームは選びにくかった、との見方を示した。
◆「独自」の線引きを見直すべきだとの声も
一方で、アーキテクチャの一部活用まで一律に「From Scratch」の要件に反するとみなすのは無理がある、との意見もある。科学技術情報通信部自身が説明する通り、オープンソースの活用は世界的な潮流だ。しかも、事業ではグローバルモデル比95%の性能を目標に掲げていることから、ライセンス上の問題がない範囲で海外モデルの一部活用を認めるべきだとの主張が出ている。
キョンヒ大学ビッグデータ応用学科のイ・ギョンジョン教授は、「From Scratchを最も重要な基準とみなす考え方は再検討が必要だ。重要なのは権利関係だ」と述べた。ソブリンAIの観点で本当に重要なのは、モデルを自ら修正し、運用できる統制権にあり、その条件が満たされるのであれば、From Scratchそのものに過度にこだわる必要はないという立場だ。
また、独自性の判断を事業参加チームだけで詰め切るには限界があるとの指摘もある。AIモデルは、学習データ、構造設計、推論方式、データ処理など多様な要素の組み合わせで成り立つためだ。イ・ソンヨプ教授は、政府が独自性の判断基準をできるだけ具体的に示す必要があると話した。
業界では今回のNaver Cloudの失格を、政府が独自AIモデル政策を厳格に運用するシグナルと受け止めている。今後の審査でも、性能だけでなく独自性をどう立証するかが繰り返し問われる可能性が高いという。ある業界関係者は、「これからの競争では、性能に加えて独自性をどこまで明確に示せるかも見どころになる」と語った。
なお、今回の1次審査ではNaver Cloudに加え、NC AIも失格となった。NC AIはベンチマーク評価で基準を満たせなかった。
科学技術情報通信部は、当初の「1次審査では1チームのみを落とす」との計画に合わせ、追加で1チームを選び、4チーム体制で2次審査を実施する。Naver CloudとNC AIは再挑戦しない方針を明らかにしており、1次の選抜公募で落選していたKakaoも不参加の意向を示している。
業界では、1次の選抜公募で落選したKT、Motif Technologies、KONAN Technologyなどが再挑戦する可能性の高い候補として挙がっている。