TechCrunchは6日(現地時間)、GoogleがiOS向けのAI文字起こしアプリ「Google AI Edge Eloquent」を無料で公開したと報じた。オフライン動作に対応しており、Whisper Flow、Superwhisper、Willowなどの文字起こしアプリと競合する。
Google AI Edge Eloquentは、Gemmaベースの自動音声認識モデルを採用した。iPhone上で直接文字起こしでき、書き起こし結果はリアルタイムで画面に表示される。録音を一時停止すると、「えー」「あのー」といったフィラーを取り除き、文章を整形する。
書き起こし画面の下部には、「要点」「フォーマル」「短く」「長く」などのオプションを用意した。要約のほか、文体や文章量の調整にも対応する。
クラウドモードをオフにした場合は、処理を端末内で完結する。オンにすると、テキスト整形の段階でGeminiモデルを利用する。Gmailからキーワードや名前、専門用語を取り込めるほか、用語を手動で追加することもできる。
アプリは文字起こしセッションの履歴を保存し、検索機能も備える。直近のセッションの語数、1分当たりの語数、総発話語数も確認できる。
著者について