DeepLは2月3日、リアルタイムの音声認識と翻訳に対応した「DeepL Voice API」の提供開始を発表した。
新APIは、開発者が自社アプリケーションにリアルタイム音声認識・翻訳機能を組み込めるようにするもの。音声をストリーミングで入力すると、入力言語の認識結果を返し、最大5言語へリアルタイムで翻訳できる。
主な用途として想定するのは、コールセンターやビジネス・プロセス・アウトソーシング(BPO)など、音声コミュニケーションが業務の中核を担う分野だ。企業は言語ごとの人員配置負担を抑えながら、多言語での顧客対応を効率化できるとしている。
DeepLの最高製品責任者(CPO)、ゴンサロ・ガイオラス氏は、「言語の壁を越えてリアルタイムにコミュニケーションできるツールを提供することで、カスタマーサポートチームの対応範囲を広げられる」とコメントした。
またDeepLは、2月中旬から6週間にわたり、「Voice-to-Voice」通訳機能のアーリーアクセスプログラムも実施する。対象は、DeepL API Proの契約顧客。
著者について