韓国政府が進める独自基盤モデル開発事業で、一次評価を通過したのはLGAI研究院、SK Telecom、Upstageの3社だった。科学技術情報通信部は1月15日、当初想定していた4社選定に届かなかったことを受け、追加で1社を早期に公募・選定する方針を明らかにした。
一次評価の対象となった精鋭チーム5組のうち、NC AIとNaver Cloudは選定されなかった。科学技術情報通信部によると、NC AIはベンチマーク基準を満たさず、Naver Cloudは独自性の要件を満たさないと判断された。
Naver Cloudについては、独自基盤モデルの一つとして提示した「HyperCLOVA X Seed 32B Sync」が、Alibabaの「Qwen 2.5」のビジョンエンコーダーの重みの一部を微調整して利用していた点が問題視された。同部は、これが事業で求める独自性の基準に合致しないと判断した。
同部は当初、一次評価で4社を二次評価に進める計画だった。しかし、2社が一次評価で選外となったため、追加で1枠を設けることにした。国内企業にAI開発の経験を広く積ませるという事業の趣旨を踏まえた対応だとしている。
追加公募には、今回の一次評価で選定されなかった企業に加え、これまでの公募に参加した企業や、参加していなかった企業も応募できる。リュ・ジェミョン科学技術情報通信部第2次官は、「二次評価に進んだ3社と同等の競争条件となるよう、速やかに追加で1社を選ぶ」と述べた。
以下は、独自基盤モデル事業の一次評価に関するブリーフィング後に行われた、リュ次官との主な一問一答。
――追加公募の選定基準と時期は。
一次評価の結果、想定外に1枠が空くことになった。行政手続きをできるだけ早く終え、速やかに追加選定を進める。一次評価で選定されなかった企業に加え、予備審査に参加した10コンソーシアムや、そのほかの事業者にも門戸を開く。コンソーシアムを組成できる企業に広く機会を与えたい。公示も早期に行う。
――一次評価を前に独自性を巡る議論があった。Naver Cloudはオープンソースのエンコーダー活用が問題だったのか。
公募要領には、独自AI基盤モデルが備えるべき基本条件を盛り込んでいる。オープンソースモデルを活用する場合でも、既存の重みを引き継ぐのではなく、自社で確保したデータをもとに積み上げていくべきだというのが基本的な立場だ。Naver Cloudにライセンス上の問題があったわけではないが、重みをそのまま用いた点を評価委員は問題と判断した。オープンソース活用が世界的な潮流であることは事実だが、この事業が本質的に目指しているのは、最初から自ら設計し、経験を蓄積することにある。
――二次評価の日程と、追加1枠の選定はどう進めるのか。
一次評価を通過できなかった企業は異議申し立てが可能で、対象企業にはすでに案内している。申立期間は10日間で、その後に一次評価を正式に確定する。一方で、二次評価に進んだ3社を追加選定のために長く待たせるべきではない。追加選定の手続きもできるだけ早く終える。新たに加わる1社も、二次評価に進んだ3社と同じプロジェクト期間が与えられ、政府が支援するGPU資源を利用できる。
――この事業は最終的に2社を選ぶ計画だ。一次評価で2社が選外となったからといって、追加で1社を選ぶ必要があるのか。公平性を巡る議論もあり得る。
少数による圧縮した競争にする目的は、最終的に2社を選ぶこと自体ではない。最も競争の激しい環境をつくり、できるだけ多くの国内企業が短期間で成果を出せるように設計した。多くの企業にGPUを使ってもらい、技術開発に参加できるようにすることを優先している。二次評価に進めなかったとしても、参加の過程で企業が得るものは大きい。今回の追加選定は、特定企業への配慮でも場当たり的な措置でもなく、事業の趣旨を最大限に反映したものだ。
――基準を巡って議論があった。追加選定や二次評価に向けて、独自性判断のガイドラインをより明確に示すべきではないか。
グローバルの先端企業を含め、オープンソースを使わない企業はないと言ってよい。生成AIの出発点であるトランスフォーマーもオープンソース技術として広く活用されており、グローバルのビッグテックでも利用は当然のことになっている。オープンソース活用そのものを否定する考えはない。ただ、この事業は国内企業にできるだけ多くの経験を積んでもらうことが狙いであり、他社の成果をそのまま持ち込む形は問題があると判断した。
――Naver Cloud以外に、UpstageやSK Telecomでも独自性を巡る議論があったのではないか。
学習データの重みに関しては、評価委員の間で、Naver Cloudを除くほかの4社に問題があるとの指摘はなかった。Upstageについては参照元の記載を巡る指摘があり、SK Telecomについても一部指摘はあったが、独自基盤モデルの基準から外れるほどではないと判断した。
――Naver Cloudから、エンコーダー活用について事前照会はあったのか。
確認した限りでは、事前の照会はなかった。議論が表面化した後にNaver Cloudから説明資料は提出されたが、すでに評価が進行していたため、評価には反映しなかった。反映すれば手続き上の問題が生じると判断した。
――一次評価はベンチマークと専門家・ユーザー評価で実施した。二次評価はどう進めるのか。
評価基準は対象企業との協議を経て作成した。大きな枠組みは、ベンチマーク、専門家評価、実利用者評価の3つだ。専門家評価では、客観的な性能評価に加え、技術的な独創性や技術力、今後の発展可能性を重視する。利用者評価では、実際の利用現場にいる人が、どれだけ有用だと感じるかをみる。AIはパラメータ数が多ければよいわけではなく、規模が小さくても産業現場で効率的に使えることが重要で、こうした実用性も重視する。二次評価でも基準の大きな変更はないが、フロムスクラッチの扱いなどを巡って学界・業界の意見をさらに集め、基準を具体化する。基準については指摘もあったが、参加企業との共通認識のもとで策定した点を強調したい。ベンチマーク評価も、参加企業が受け入れ、同意した手法を採用している。