Google DeepMindが、音声AIスタートアップHume AIのCEOと主要エンジニアを採用した。感情認識音声技術をGeminiに組み込む計画で、音声AI分野を巡る大手各社の競争が一段と激しくなっている。Wiredの報道を基に、TechCrunchが1月22日(現地時間)に伝えた。
Googleは、Hume AIが持つ感情認識音声技術をGeminiに統合する方針だという。
Hume AIは、利用者の声を分析し、感情や心理状態を読み取る技術を手がける。2025年には、感情知能を備えた対話型AI「Empathetic Voice Interface」を発表した。スタートアップ投資情報サービスのPitchBookによると、同社の累計資金調達額は8000万ドル(約120億円)。Wiredは、2026年の売上高が1億ドル(約150億円)に達する見通しだと報じた。
音声AIは、生成AI業界の新たな競争軸として存在感を強めている。Googleは「Gemini Live」の機能強化を進めており、OpenAIもオーディオモデルの高度化に加え、オーディオデバイスの投入を予定している。Metaは2025年にAI音声スタートアップのPlay AIを買収し、Ray-Banスマートグラスの音声機能強化に活用している。
AI音声生成スタートアップのElevenLabsは、年間経常収益(ARR)が3億3000万ドル(約495億円)を超えたと最近発表した。
著者について