写真=Reve AI

AIの進化を背景に、キーボード入力に代わって音声で指示や文章入力を行う働き方が広がっている。こうした流れを受け、AI音声ディクテーション市場ではスタートアップ各社に加え、Googleも参入した。GoogleはAndroid向けキーボードアプリ「Gboard」に新機能「Rambler」を追加し、競争は一段と激しくなっている。

米ウォール・ストリート・ジャーナル(WSJ)によると、クレジットカード関連スタートアップのRampでは、ゲーミングヘッドセットを着けて机に向かうエンジニアの姿が珍しくない。ゲーム用ヘッドセットは、AIアシスタントに大きめの声で指示を出すために使われているという。

HRプラットフォームを手がけるGustoの共同創業者エドワード・キムは、将来のオフィスは「営業フロアのようになる」との見方を示し、音声をテキストに変換するディクテーション技術の活用を社員に勧めているとWSJは伝えた。

キムはもともと自分を「キーボード入力が速いタイプ」だと考えていたが、現在は「最近はほとんどずっとコンピューターに話しかけながら仕事をしている。本当に必要な時以外はキーボードを打たない」と語った。

もっとも、独り言のように話しながら作業するスタイルは、まだ一般的とは言いがたい。近くに人がいれば気まずさを感じる場面もある。キムは「家ではトニー・スタークがジャービスと会話している気分になるが、オフィスでは少し気まずい」と話している。

オフィスでは周囲への配慮も欠かせない。利用者は声量を抑えたり、周囲の音を遮るためにヘッドホンを着用したりして、不快感を減らす工夫をしているという。

WSJは、あるベンチャー投資家の話として、最近AIスタートアップを訪れると、音声でAIとやり取りする人が多く、洗練されたコールセンターに入ったような感覚になるとも報じた。

ディクテーション自体は新しい技術ではないが、少し前までは日常業務に使うには精度が十分とは言えなかった。ただ、状況は変わりつつある。Wisprなどのアプリでは、リアルタイムでテキストを編集できるほか、文法や文体の補正性能も向上しているという。

利用が広がるなか、ヘビーユーザーの間では専用機材をそろえる動きも出ている。Wisprを足指で起動するため、プログラム可能なゲーム用フットペダルを購入する例もある。スポーツ中継の実況者や牧師が使うような、首の長いグースネックマイクを机上に置いて使うケースもあるという。価格は60ドル。LinkedIn共同創業者のリード・ホフマンは、自身を「voicepilled」と表現している。

こうした流れを受け、AI音声ディクテーションアプリ市場でも競争が激化している。Wisprのほか、Aqua Voice、Willow、Tactastic、Typeless、Superwhisperなどが競合している。

Googleの動きも注目される。米TechCrunchによると、Googleは12日(現地時間)、Android向けキーボードアプリ「Gboard」にAI音声ディクテーション機能「Rambler」を追加した。

Ramblerは、「えー」「あの」といった言いよどみを自動で削除し、「水曜日の午後3時に……いや、2時に会いましょう」といった文中での言い直しにも文脈に沿って対応できるという。Geminiベースの多言語モデルを活用し、英語からヒンディー語へ切り替えるような場面でも文脈を保ったまま処理するコードスイッチングも支援する。

Ramblerの追加により、GoogleはWisprやTypelessなどのAIディクテーションアプリと競合することになる。これまで多くのディクテーションアプリはデスクトップやiOSを中心に普及しており、TechCrunchはAndroidエコシステムでは相対的に競争が少なかったと伝えている。

Googleの強みは、Gboardの圧倒的なユーザー基盤にある。Gboardは多くのAndroid端末で標準キーボードとして使われており、数億人規模のユーザーにプリインストールで提供されている。Ramblerを含む新機能は今夏、SamsungのGalaxyとGoogle Pixelに先行投入した後、他のAndroid端末にも順次拡大する予定だ。

キーワード

#AI #音声入力 #AIディクテーション #Gboard #Google
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.