KTは1月4日、独自開発したAIモデル「MIDEUM K」が、AIモデルの性能を総合評価するプラットフォーム「AAII(Artificial Analysis Intelligence Index)」で、韓国の中小型モデルとして首位を獲得したと発表した。
KTによると、MIDEUM Kは今回の評価で、推論、専門知識、数学・プログラミング、エージェント性能など10項目超の主要指標で総合的に高い評価を得た。
AAIIの公開結果では、主要なエージェント性能ベンチマークの一つである「τ²-bench(タウ・スクエア・ベンチ)」で87%を記録した。KTは、同モデルがエージェントAI分野でトップクラスの水準に入ったとしている。
τ²-benchは、AIが実務環境で人と協働し、複数のツールを使いながら一連のタスクを完遂できるかを測る、エージェント特化型のベンチマークだ。KTは、MIDEUM Kのスコアが最上位水準で、Googleの最新モデル「Gemini 3」に並ぶ水準だったと説明している。
このほか、専門知識や高度な推論能力を測るMMLU Pro、GPQA、HLEなどの主要ベンチマークでも、MIDEUM Kはバランスよく高いスコアを示したという。韓国語理解に関する指標でも、韓国国内で最高水準の性能を達成したとしている。
KT関係者は「こうした成果を40B以下のパラメータ規模のモデルで実現した点は、特に注目に値する」とコメントした。
KTは、MIDEUM Kについて、大規模GPUインフラへの負荷を抑えながら効率性を高めたとしている。その上で、複雑な指示を正確に理解する「指示追従能力(Instruction Following)」や、韓国特有の社会・文化的文脈を理解する性能でも、トップ水準を確保したと説明した。
MIDEUM Kは、モデルアーキテクチャの設計から学習データの構築まで、全工程を自社で手がける「From scratch」方式で開発した。KTは、韓国企業の業務環境に最適化したAIモデルだとしている。
同社は開発初期からB2B市場を主眼に据えてきた。金融、公共、製造などの業種別に、企業の実務を自動化し、自律的に判断・処理するカスタムAIエージェントを提供し、企業顧客のAXを主導する戦略だ。
KTのオ・スンピル技術革新部門長(副社長)は「今回のAAII掲載は、KTの独自AI技術がグローバル水準に達したことを客観的に示す成果だ」とした上で、「エージェントAIを通じて韓国企業の業務革新とデジタル転換をけん引する、最高のAIパートナーを目指す」と述べた。