写真=Shutterstock

TechCrunchは6日(現地時間)、GoogleがiOS向けのAI文字起こしアプリ「Google AI Edge Eloquent」を無料で公開したと報じた。オフライン動作に対応しており、Whisper Flow、Superwhisper、Willowなどの文字起こしアプリと競合する。

Google AI Edge Eloquentは、Gemmaベースの自動音声認識モデルを採用した。iPhone上で直接文字起こしでき、書き起こし結果はリアルタイムで画面に表示される。録音を一時停止すると、「えー」「あのー」といったフィラーを取り除き、文章を整形する。

書き起こし画面の下部には、「要点」「フォーマル」「短く」「長く」などのオプションを用意した。要約のほか、文体や文章量の調整にも対応する。

クラウドモードをオフにした場合は、処理を端末内で完結する。オンにすると、テキスト整形の段階でGeminiモデルを利用する。Gmailからキーワードや名前、専門用語を取り込めるほか、用語を手動で追加することもできる。

アプリは文字起こしセッションの履歴を保存し、検索機能も備える。直近のセッションの語数、1分当たりの語数、総発話語数も確認できる。

キーワード

#Google #iOS #AI #音声認識 #文字起こし #Gemma #Gemini
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.