生成AI時代の必須用語を整理　AGI、LLM、ハルシネーションとは

生成AIの普及に伴い、AGI（汎用人工知能）やLLM（大規模言語モデル）、ハルシネーション、トークンといった専門用語が、研究開発や製品説明、インフラ、安全性を論じるうえで欠かせない言葉になっている。米TechCrunchは12日（現地時間）、主要なAI用語の意味と使われ方を整理した。

代表的な用語の1つがLLMだ。ChatGPTやClaude、Gemini、Llama、CopilotなどのAIチャットボットを支える大規模言語モデルを指す。

ユーザーが質問を入力すると、モデルは学習済みの膨大なテキストパターンを基に、次に続く可能性が高い単語を順に選びながら回答を生成する。なお、サービス名とモデル名は必ずしも一致しない。例えばGPTはOpenAIのモデルで、ChatGPTはそれを利用したサービスだ。

業界で頻繁に使われるAGIも、定義は固まっていない。OpenAIのサム・アルトマンCEOは最近、AGIについて「一緒に働くために雇える、中程度の能力を持つ人間のような存在」と説明した。

一方、Google DeepMindは、人間に近い水準で幅広い認知課題をこなせるAIという側面を重視している。最前線の企業・研究者の間でも解釈が分かれているのが実情だ。

足元の製品競争で存在感を増しているのがAIエージェントである。単なる対話型チャットボットにとどまらず、経費精算や予約、コード作成、保守対応といった複数の工程を伴う業務を代行するシステムを指す。

もっとも、AIエージェントも統一的な定義があるわけではなく、実装に必要なインフラ整備もなお途上にある。現時点では、複数のAIシステムを組み合わせ、段階的な作業を自律的に処理する仕組みを指すケースが多い。

モデルの性能を理解するうえでは、「学習」と「推論」を分けて考える必要がある。学習はデータを与えてパターンを獲得させる工程で、推論は学習済みモデルが実際の入力に対して予測や応答を返す処理を意味する。

学習には大量のデータと計算資源が必要で、コストも大きい。一方の推論は、サービス提供時の応答速度や運用コストを左右する。推論処理はスマートフォン向けチップから高性能GPU、専用AIアクセラレータまで幅広いハードウェアで実行できるが、モデルが大規模になるほど高性能なインフラへの依存度は高まる。

このため、計算資源とメモリ半導体はAI産業のボトルネックとみなされている。業界では、AIモデルの学習や運用を支える計算資源の総称として「コンピュート」が使われ、GPUやCPU、TPUなどのハードウェアが含まれる。

AIの安全性を巡る課題として、最も直接的に挙げられるのがハルシネーションだ。モデルが事実ではない情報を、もっともらしく生成してしまう現象を指す。

とりわけ健康情報のように実害につながり得る分野では影響が大きい。このため主要な生成AIサービスは利用者に出力内容の検証を促しており、近年は特定産業向けに最適化したAIモデルの開発にも関心が集まっている。

利用コストを左右する指標としてはトークンがある。ユーザーの入力文やモデルの出力文を細かく区切ったデータ単位で、入力トークン、出力トークン、推論トークンに分けられる。

企業向けAIサービスでは、トークン使用量が課金基準になるケースが多い。利用が増えるほど処理するトークン数も増え、コストも膨らむ構造だ。

AI産業を理解するうえでは、製品名だけでなく用語の意味を押さえることが重要になる。AGIはなお定義が分かれ、AIエージェントは実装水準によって意味合いが変わる。ハルシネーションも依然として解決途上の主要リスクに位置付けられている。

生成AIの普及が進むほど、こうした用語の理解は単なる技術トレンドの把握にとどまらない。産業の方向性や事業者の戦略を読み解くうえでの前提になりつつある。

Yoonseo Lee yslee@d-today.co.kr

生成中...

AI要約

生成AIの普及に伴い、AGIやLLM、AIエージェント、ハルシネーション、トークンといった用語が急速に広がっている。米TechCrunchは12日（現地時間）、定義が分かれる概念や課金、安全性の論点を整理した。