写真=ミラ・ムラティ氏提供(Xより)

OpenAIでCTO(最高技術責任者)を務めたミラ・ムラティ氏が設立したAIスタートアップのThinking Machinesは11日(現地時間)、リアルタイム対話向けに設計したAIモデル「Interaction Model」の研究プレビューを公開したと発表した。

同社によると、既存のAIモデルの多くは、ユーザーの入力が終わってから応答を生成するターンベース方式で動作する。この方式では、応答生成中に新たな情報を取り込めず、対話の流れを維持しにくいことが課題だとしている。

これに対し、Interaction Modelは当初からリアルタイム応答を重視して設計した。マルチストリームとマイクロターン方式を採用し、音声・映像・テキストを同時に処理しながら、リアルタイムに応答や動作を行えるという。

また、ユーザーが話しているのか、考えているのか、応答を待っているのかを文脈から判断し、外部の対話管理コンポーネントを追加せずに自然な会話を継続できると説明した。ユーザーが話し終えていない段階でも文脈に応じて応答を差し挟めるほか、ユーザーとモデルが同時に話せるため、リアルタイム通訳のような用途にも対応できるとしている。

会話を続けながら、Web検索やブラウジング、UI生成を並行して行い、その結果を会話の中に自然に取り込める点も特徴として挙げた。

Thinking Machinesは、既存モデルの多くが対話機能を外部コンポーネントとの連携で実現しているのに対し、Interaction Modelはその機能をモデル自体に組み込んだと強調した。これにより、モデルの高度化に伴って連携能力も高められるとしている。

キーワード

#Thinking Machines #Interaction Model #AI #マルチモーダル #リアルタイム対話
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.