画像=Apple App Store

Googleが、オフライン環境で使えるiPhone向けAI音声入力アプリ「Google AI Edge Eloquent」を公開した。音声をリアルタイムで文字起こしするだけでなく、口癖やつなぎ言葉を省き、読みやすい文章へ整えるのが特徴だ。TechRadarが8日(現地時間)、使用感を報じた。

同アプリは、Googleのモデル「Gemma」をベースに動作する無料アプリ。最大の特徴は、インターネット接続がない環境でも音声入力と文字起こしを利用できる点にある。一般的なボイスメモアプリや自動文字起こし機能がネット接続に依存するのに対し、Eloquentは端末上で処理を完結できる。

設計思想は、発話内容を逐語的に記録することより、読みやすい文章に整えることにある。話した内容をもとにテキスト化しながら、「えー」「あの」といったフィラーや口癖をほぼリアルタイムで取り除く。会話の内容は残しつつ、そのままでは読みにくい話し言葉を整理する仕組みだ。

カスタマイズ機能も備える。Gmailから氏名や頻出用語を取り込めるほか、独自の単語リストを追加することもできる。

文字起こし結果を書き換える機能も搭載した。「要点」「フォーマル」「短く」「長く」といった形式を選ぶことで、用途に応じて文のトーンや長さを調整できる。

TechRadarによると、実際の利用では、音声メモがそのまま整った文章に変わる流れが確認できた。歩きながら思いついた内容をアプリに話しかけると、まず下書きの文字起こしが表示され、その約10秒後にはより滑らかな文章に整えられたという。通常の文字起こしと、その後に手を入れた原稿との差に近いが、その編集が発話中からほぼ同時進行で行われる点が特徴だとしている。

書き換え機能は、用途に応じた文体の切り替えに重きを置く。短いメモは「要点」を選ぶと数個の箇条書きに圧縮され、「フォーマル」を適用すると個人メモが業務文書のような表現に変わる。日程確認用の短いメッセージを入力した際には、内容を補って、より整ったメール文面に書き換えられたという。

一方で、同アプリは発話内容をそのまま保存する記録ツールとは性格が異なる。不完全な文章でも意味が通れば自然な表現へ補正し、場合によっては文のつながりを補うこともある。このため、発言を漏れなく残す用途よりも、音声メモをそのまま下書き化したい場面に向くとみられる。

手書きよりも話しながらアイデアを出し、その場で文章整理まで済ませたいニーズには合致する半面、議事録のように発話内容を正確に残す用途には向かない可能性がある。

同アプリは現在、Apple App Storeで配信されているが、提供地域は米国に限られる。Googleは大きな告知を行わず今週公開し、iPhoneユーザー向けにオフラインAI音声入力アプリの提供を始めた。

Googleは関連投稿で、「#GoogleAIEdge を使えば、Gemmaの機能をノートPCやモバイル、IoTなどさまざまなデバイスへ展開できる」と紹介している。

キーワード

#Google #AI #Google AI Edge Eloquent #音声入力 #文字起こし #オフライン #Gemma #iPhone #App Store
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.