政府主導の「独自AI基盤モデル」事業は第2次評価に入った。開発各社はマルチモーダル対応を競争力の柱に据える構えだ。写真=Shutterstock

政府が進める「独自AI基盤モデル」事業が第2次評価に入った。第1次評価ではモデルをゼロから独自開発できるかが主な判断材料だったが、今後は実性能や実用性がより重視される見通しで、業界ではマルチモーダル対応が差別化の軸になるとの見方が広がっている。

業界によると、第1次評価を通過したSK telecom、LG AI研究院、Upstageの3チームは、いずれもマルチモーダル対応を視野に開発を進めている。独自開発の有無を超え、実際の性能と活用可能性で優位性を示そうとしているためだ。

SK telecomは第1次評価で、パラメータ数が5000億超の519B級大規模言語モデル(LLM)「AX. K1」を前面に打ち出した。高難度の数学やコーディング分野で強みを示したとしている。

同社は今後、「AX. K1」が音声や映像データも扱えるよう、マルチモーダル機能を強化する計画だ。モデルの実用範囲を広げ、第2次評価でも競争力を確保する狙いがある。

SK telecom関係者は「第2段階の評価では、まず画像データからマルチモーダル機能を順次適用する予定だ」と説明した。あわせて「性能向上に向けて学習データ規模を拡大し、学習言語も5言語に増やす計画だ」としている。

LG AI研究院も、最終的にマルチモーダルモデルの構築を目標に研究開発を続けているという。Upstageも、第1次評価時の国民向け発表会で、今後マルチモーダル機能を確保する方針を明らかにしていた。

マルチモーダル対応は、この事業が目指す国民向けサービスの実現性とも直結する。音声を活用した苦情・問い合わせ対応、映像データの分析、文書と画像の統合処理など、幅広い活用シナリオが想定されるためだ。

業界関係者は「いま重要なのは、自社でモデルを作れるかどうかだけではない。どれだけ差別化された性能と実用性を示せるかが問われる段階に入っている」と話す。その上で「各社ともマルチモーダル対応を通じて、国民向けサービスへの適用可能性を強く打ち出してくるだろう」との見方を示した。

一方、第2次評価に進んだ3チームがマルチモーダル対応を競う構図となれば、追加公募に参加する企業がこの流れにどう対抗するかも焦点となる。科学技術情報通信省は第1次評価で、当初計画とは異なり2チームを脱落とし、新たに1チームを追加選定する方針を示していた。

KT、Kakao、Naverなどの大手は再公募への参加を見送った。現時点では、スタートアップのMotif TechnologiesとTrillion Labsの2社が追加選定への参加意向を表明している。

Motif Technologiesは、高性能LLMとマルチモーダルモデルの両方を基盤モデルとして開発した経験を強みとする。Trillion Labsは、モデルの独自性と統制力を前面に出して競争に臨む構えだ。

業界では、第2次評価を機に「独自AI基盤モデル」事業の競争構図が変わる可能性もあるとの見方が出ている。第1次評価が独自性の検証に軸足を置いていたのに対し、第2次評価では各チームの技術的な方向性がより鮮明になるためだ。

マルチモーダル能力が実際の評価でどの程度重視されるかも、大きな関心事となっている。別の業界関係者は「第2次評価は、各チームがどの方向でモデルを高度化し、今後どう活用していくのかを見極める段階になる」と話した。

キーワード

#AI #基盤モデル #大規模言語モデル #マルチモーダル #SK telecom #LG AI研究院 #Upstage #科学技術情報通信省
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.