画像=AI生成画像、KAIST

KAISTは29日、LLM向けインフラを仮想環境で評価できるシミュレーター「LLMServingSim 2.0」を開発し、オープンソースとして公開したと発表した。高価なAIサーバーを実際に構築する前に、性能や電力効率、安定性を事前に検証できるのが特徴だ。

あわせて、パク・ジョンセ電算学部教授の研究チームによる同シミュレーターの研究成果が、コンピュータシステム性能分析分野の学会「ISPASS 2026」で最優秀論文賞を受賞したことも明らかにした。

LLMServingSim 2.0は、多様なハードウェアとソフトウェアの組み合わせを仮想環境で分析できるシミュレーション基盤。研究者や開発者は、大規模なサーバーインフラを実機で構築しなくても、複数の設計案を比較しながら性能を評価できる。

対応するハードウェアは、従来のGPU中心の環境にとどまらない。NPU(ニューラルネットワーク処理装置)、PIM(プロセッシング・イン・メモリ)、CXLベースのメモリ拡張装置など、次世代AI半導体を含む幅広い構成を検証できる。

まだ商用化されていない将来のAI半導体についても、仮想データセンター環境で事前評価が可能だ。特定の半導体を適用した場合のサービス応答速度、消費電力、大規模サーバー環境での安定性などをあらかじめ分析できるとしている。

LLMServingSim 2.0は、実際のAIサービス運用で発生するリクエスト処理、バッチ構成、メモリ使用量、データ移動、消費電力をシステム全体で再現する。複合的な要因によって生じるボトルネックや効率面の課題の分析にも活用できるという。

また、複数のサーバー資源を分離・接続する分散型インフラ環境の分析にも対応しており、次世代AIデータセンターの研究にも活用が見込まれる。

研究チームは、LLMサービス事業者やAI半導体スタートアップが、次世代AIインフラを設計・最適化する際の利用を想定している。

パク・ジョンセ教授は「AIサービスの競争力は、モデルそのものだけでなく、それを安定的かつ効率的に運用するインフラ技術によって左右される」としたうえで、「このシミュレーターが、研究者と産業界による次世代AIインフラ開発を迅速かつ効率的に進めるための基盤になることを期待している」とコメントした。

今回の研究は、電算学部のCho Jae-heon修士課程学生とChoi Hyun-min修士課程学生が共同第1著者として主導した。科学技術情報通信部、情報通信企画評価院、韓国電子通信研究院、SK hynixの支援を受けて進められた。

キーワード

#KAIST #AI #LLM #シミュレーター #GPU #NPU #PIM #CXL #オープンソース #ISPASS
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.