Ảnh: Reve AI

Ngày càng nhiều nhân sự trong ngành công nghệ chuyển từ gõ phím sang làm việc bằng giọng nói với trợ lý AI, kéo theo cuộc cạnh tranh tăng nhiệt trên thị trường ứng dụng dictation AI. Bên cạnh các startup như Wispr, Aqua Voice hay Typeless, Google cũng đã nhập cuộc với tính năng Rambler trên Gboard.

Theo Wall Street Journal (WSJ), xu hướng này đang lan rộng trong giới startup công nghệ khi AI ngày càng phổ biến. Dù có thể gây bất tiện cho người xung quanh, làm việc bằng giọng nói vẫn xuất hiện ngày một nhiều trong môi trường văn phòng.

Tại startup thẻ tín dụng Ramp, hình ảnh các kỹ sư đeo tai nghe gaming khi ngồi làm việc không còn hiếm. Tuy nhiên, mục đích không phải để chơi game, mà để nói to và rõ với trợ lý AI.

WSJ dẫn lời Edward Kim, đồng sáng lập startup nền tảng nhân sự Gusto, cho biết ông tin rằng “văn phòng tương lai sẽ giống sàn bán hàng”, đồng thời khuyến khích nhân viên thử công nghệ dictation, tức chuyển giọng nói thành văn bản.

Edward Kim nói rằng dù bản thân vốn gõ phím rất nhanh, ông hiện gần như luôn nói chuyện với máy tính khi làm việc. “Trừ khi bất khả kháng, tôi không dùng bàn phím”, ông cho biết.

Kiểu làm việc vừa nói vừa thao tác với máy tính vẫn còn khá lạ với nhiều người. Nếu ngồi cạnh đồng nghiệp, cảm giác ngại ngùng là điều khó tránh; còn khi làm việc tại nhà, việc này dễ chấp nhận hơn. Edward Kim ví trải nghiệm ở nhà giống như Tony Stark trò chuyện với Jarvis, còn ở văn phòng thì chỉ “hơi kỳ”.

Trong môi trường công sở, yếu tố lịch sự cũng trở nên quan trọng hơn. Theo WSJ, người dùng thường cố hạ thấp giọng hoặc đeo tai nghe để giảm bớt tiếng ồn xung quanh, hạn chế ảnh hưởng đến đồng nghiệp.

Một nhà đầu tư mạo hiểm được WSJ trích dẫn cũng cho biết mỗi lần ghé thăm các startup AI gần đây, ông có cảm giác như bước vào một tổng đài cao cấp vì quá nhiều người đang giao tiếp với AI bằng lời nói.

Công nghệ dictation không phải là mới, nhưng cho đến gần đây vẫn chưa đủ tốt ngay cả với các tác vụ cơ bản. Theo WSJ, tình hình hiện đã thay đổi khi những ứng dụng như Wispr có thể chỉnh sửa văn bản theo thời gian thực, đồng thời cải thiện ngữ pháp và văn phong.

Khi công nghệ này lan rộng, một số người dùng còn đầu tư thêm thiết bị để tận dụng hiệu quả hơn. Có người mua bàn đạp chân có thể lập trình, vốn thường dùng trong game, để khởi chạy Wispr bằng ngón chân. Một số khác trang bị micro cổ ngỗng dài, có thể uốn cong, giá 60 USD, loại thường được các bình luận viên thể thao hoặc mục sư sử dụng. WSJ cho biết đồng sáng lập LinkedIn Reid Hoffman thậm chí tự gọi mình là “voicepilled”, hàm ý rất “nghiện” giao tiếp bằng giọng nói.

Cùng với đà tăng của hình thức làm việc bằng giọng nói, thị trường ứng dụng dictation AI cũng trở nên sôi động hơn. Ngoài Wispr, các tên tuổi như Aqua Voice, Willow, Talktastic, Typeless và Superwhisper đều đã tham gia cuộc đua.

Động thái của Google đặc biệt thu hút chú ý. Theo TechCrunch, ngày 12/5 theo giờ địa phương, Google đã bổ sung Rambler, một tính năng ghi chép bằng giọng nói tích hợp AI, vào ứng dụng bàn phím Gboard trên Android.

Google cho biết Rambler có thể tự loại bỏ các từ đệm như “ừm” hay “ờ”, đồng thời hiểu và phản ánh các chỉnh sửa giữa câu theo ngữ cảnh, chẳng hạn “3 giờ chiều thứ Tư... à không, gặp lúc 2 giờ”. Tính năng này sử dụng mô hình đa ngôn ngữ dựa trên Gemini, hỗ trợ code switching, tức cho phép đổi ngôn ngữ giữa chừng, chẳng hạn từ tiếng Anh sang tiếng Hindi, mà vẫn giữ được mạch ngữ cảnh.

Với Rambler, Google bắt đầu cạnh tranh trực tiếp với các ứng dụng dictation AI như Wispr và Typeless. Theo TechCrunch, phần lớn ứng dụng dictation trước đây tập trung phát triển trên desktop và iOS, trong khi hệ sinh thái Android có mức độ cạnh tranh thấp hơn tương đối.

Lợi thế lớn nhất của Rambler nằm ở quy mô người dùng. Gboard là bàn phím mặc định của phần lớn người dùng Android trên toàn cầu và được cài sẵn trên hàng trăm triệu thiết bị. Các tính năng mới, trong đó có Rambler, dự kiến sẽ ra mắt trước trên Samsung Galaxy và Google Pixel vào mùa hè năm nay, trước khi mở rộng sang các thiết bị Android khác.

Từ khóa

#trí tuệ nhân tạo #dictation AI #nhập liệu bằng giọng nói #Gboard #Google #Android
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.