画像=Reve AI

企業のAI導入が広がるなか、推論コストの増加を受けて、先端の大規模モデルに依存してきた活用戦略を見直す動きが強まっている。低価格の小型モデルを組み合わせたり、基盤モデルそのものを切り替えたりする事例も出始めた。TechCrunchが9日、報じた。

これまでAIモデル開発企業は、調達資金を背景に、推論コストを実勢より低く抑えてサービスを提供してきた。このため企業は、本来のコスト水準より安く高性能モデルを利用できていたという。

ただ、企業でAI導入が進むにつれて関連支出も膨らみ、状況は変わりつつある。AI活用に伴うコスト負担を課題とみる企業が増えている。

米暗号資産取引所Coinbaseのブライアン・アームストロングCEOは、今後12〜18カ月で業務の80%が、従来より99%低コストのモデルに移行するとの見通しを示した。AI需要そのものは極めて大きい一方、最新の大規模モデルが本当に必要な業務は残る20%程度にとどまる、という見方だ。

TechCrunchは、この見通しが現実になれば、AI業界の収益構造そのものが大きく変わる可能性があると伝えた。

これまでAIサービス企業は、より高性能なモデルの採用を競争力の源泉としてきた。だが、低価格の小型モデルで同等の品質を確保できるようになれば、OpenAIやAnthropicなど先端モデルを提供する企業の収益性を圧迫しかねない。両社はいずれもIPOを控えており、影響は小さくないとの見方もある。大半の業務を小型モデルで処理できることが明確になれば、数千億ドル規模の資金を投じてフロンティアモデルを学習させる意義も問われることになる。

実際に、小型モデルの活用拡大で効果を上げた例も出ている。AIリーガルテック企業Harveyは、推論プラットフォームFireworks AIと組み、AnthropicのClaude Opusと、中国のAI企業Zhipu AIが開発したオープンソースモデル「GLM 5.1」を併用した。その結果、品質を維持したまま推論コストを3分の1に抑えたと、TechCrunchは伝えている。

Harveyの共同創業者ゲイブ・パレイラ氏は、「品質の定義は、あらゆる作業で最強のモデルを使うことから、最も効率よく正解を導けるモデルを使うことへ変わりつつある」と述べた。

最近の動きをクローズドモデルとオープンソースの対立で捉える見方もあるが、TechCrunchは本質はそこではなく、大規模モデルか小型モデルかという選択にあると指摘した。コスト削減は、GPT-5.5からDeepSeek V4 Flashに切り替える場合でも、GPT-5.4-Miniに移行する場合でも起こり得るとしている。

ノーコードAIエージェントプラットフォームのLindyも、基盤モデルをAnthropicからDeepSeek v4へ切り替えた。

TheNewsStackによると、Lindyの創業者兼CEO、フロー・クリベロ氏はXで、「Lindyのトラフィック100%をDeepSeek v4に移行した。数百万ドルを削減できただけでなく、主要なユースケースではむしろ性能が向上した。事業にとって画期的な変化だ」と投稿した。

クリベロ氏は4月、AI推論コストがLindyにとって最大の支出項目となり、人件費を上回ったと明らかにしていた。同社は6〜9カ月にわたりオープンソースモデルを評価したうえで、DeepSeek v4の採用を決めたという。

もっとも、移行は容易ではなかった。クリベロCEOは、想定以上に複雑だったとして「予想の100倍の作業が必要だった」と説明。実運用環境での性能検証と、プロンプトの全面的な書き直しが主な課題だったと語った。

Lindyは、今後再び状況が変わる可能性もあるとみている。クリベロCEOは「Anthropicが次のモデルで価格を大幅に引き下げれば、再び戻る可能性はある」と述べた。

AIコストやセキュリティへの懸念が強まるなか、AIを動かす実行基盤としてPCの存在感も高まっている。半導体各社はPC向けAIチップへの投資を拡大しており、PCメーカーの動きも活発化している。PC上で動作するAIエージェントも相次いで登場している。

キーワード

#AI #大規模モデル #小型モデル #推論コスト #OpenAI #Anthropic #Coinbase #Harvey #Lindy
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.