Apple được cho là đang chuẩn bị một phiên bản Siri hoàn toàn mới, tích hợp sâu vào hệ điều hành iPhone và đi kèm một ứng dụng Siri độc lập. Những hình ảnh dựng rò rỉ trước thềm Hội nghị các nhà phát triển toàn cầu (WWDC) cho thấy hãng muốn biến Siri thành trung tâm trải nghiệm AI mới trên iPhone.
Theo TechCrunch và một số hãng tin công nghệ, Apple đang thiết kế lại Siri để tăng sức cạnh tranh với các chatbot AI như ChatGPT. Thay vì chỉ là trợ lý giọng nói, Siri có thể được mở rộng thành lớp giao diện tìm kiếm và thực thi tác vụ mặc định trên iPhone.
Người dùng vẫn có thể kích hoạt Siri bằng nút bấm, nhưng phần phản hồi và hiệu ứng dự kiến sẽ xuất hiện trên Dynamic Island ở phía trên màn hình. Thiết kế này phù hợp với các truy vấn giọng nói ngắn và những thao tác tìm kiếm đơn giản.
Một chế độ tìm kiếm mới cũng có thể xuất hiện. Người dùng vẫn vuốt xuống để mở Spotlight, nhưng phần kết quả có thể sẽ do Siri hỗ trợ bởi AI xử lý.
Theo các thông tin rò rỉ, Siri mới vận hành trên nền tảng AI được làm lại, trong đó có thể sử dụng một phần công nghệ Gemini của Google. Thanh tìm kiếm về cơ bản vẫn được giữ nguyên, còn AI sẽ phụ trách tạo kết quả và thực thi lệnh.
Trong giao diện này, Siri không chỉ dùng để tìm kiếm mà còn có thể mở ứng dụng, gửi tin nhắn, xem thời tiết, thêm sự kiện vào lịch, tìm ghi chú và chạy các phím tắt. Kết quả được hiển thị dưới dạng văn bản có cấu trúc theo thẻ và liên kết với Dynamic Island.
Diễn biến này cho thấy Apple muốn tái định vị Siri như một lớp AI hiện diện xuyên suốt hệ điều hành, thay vì một tính năng hoạt động tách biệt.
Ngoài ra, Apple cũng được cho là đang chuẩn bị một ứng dụng Siri riêng. Ứng dụng này có thể cho phép người dùng xem lại lịch sử hội thoại, nhập văn bản và tải lên tài liệu hoặc hình ảnh.
Động thái trên cho thấy Apple đang mở rộng Siri thành một dịch vụ chatbot AI độc lập để cạnh tranh với ChatGPT, Claude của Anthropic và Gemini.
Cách Siri xử lý yêu cầu cũng có thể thay đổi theo mô hình lai, kết hợp giữa xử lý trên thiết bị và xử lý trên đám mây. Apple từ lâu luôn nhấn mạnh lợi thế bảo vệ dữ liệu cá nhân của AI on-device, nhưng lần cải tổ này dường như cho thấy hãng đã nới lỏng một phần nguyên tắc đó.
Lý do chủ yếu đến từ giới hạn phần cứng smartphone. Dù các dòng chip mới đã cải thiện năng lực AI, việc chạy hoàn toàn các mô hình ngôn ngữ lớn trên thiết bị vẫn gặp nhiều ràng buộc.
Smartphone thiếu RAM để vận hành các mô hình quy mô lớn, khiến mô hình chạy trực tiếp trên máy thường chỉ dừng ở mức vài tỷ tham số. Trong khi đó, các mô hình Gemini mới nhất được cho là có quy mô tham số lên tới hàng nghìn tỷ.
Ngoài ra, mô hình chạy trên thiết bị thường phải trải qua quá trình lượng tử hóa để tăng tốc độ xử lý. Tuy nhiên, bước này có thể ảnh hưởng đến độ chính xác trong quá trình tạo token.
Google hiện cũng có Gemini Nano cho thiết bị di động, nhưng phiên bản này chủ yếu được tối ưu cho các tác vụ giới hạn như tóm tắt ngữ cảnh hoặc xử lý âm thanh. Trong khi đó, Siri hướng tới vai trò trợ lý hội thoại có thể tiếp nhận yêu cầu và thực hiện tác vụ thực tế.
Vì vậy, Apple có thể áp dụng phương pháp chưng cất mô hình để thu gọn năng lực của Gemini trên đám mây xuống các mô hình nhỏ hơn. Theo cách này, mô hình nhỏ sẽ học lại một phần khả năng của mô hình lớn nhằm tái tạo hiệu quả xử lý.
Mục tiêu là giải quyết các yêu cầu đơn giản ngay trên thiết bị, còn những tác vụ phức tạp hơn sẽ được chuyển lên đám mây.
Tuy nhiên, hạ tầng đám mây của Apple cũng được cho là có giới hạn. Dù hãng đã xây dựng hệ thống Private Cloud Compute dựa trên chip dòng M dùng cho Mac, việc vận hành ổn định các mô hình Gemini cỡ lớn vẫn bị xem là gánh nặng.
Vì thế, một số yêu cầu phức tạp có thể sẽ không được xử lý trên hạ tầng riêng của Apple mà được chuyển sang Google Cloud.
Trong bối cảnh đó, Nvidia được dự báo sẽ đóng vai trò quan trọng. Apple được cho là đã ký hợp đồng sử dụng nền tảng Confidential Computing của Nvidia thay cho Google TPU.
Công nghệ này cho phép dữ liệu tiếp tục được giữ ở trạng thái mã hóa trong GPU ngay cả khi xử lý trên đám mây. Nhờ vậy, Apple có thể tăng mức độ dựa vào hạ tầng đám mây mà vẫn duy trì một phần định hướng bảo vệ dữ liệu cá nhân.
Nguồn tin cũng cho biết thương hiệu Private Cloud Compute hiện nay có thể tiếp tục được giữ lại cho hệ thống mới.
Về mặt cạnh tranh, lợi thế lớn nhất của Apple vẫn là quy mô người dùng. ChatGPT hiện có khoảng 900 triệu người dùng hoạt động hàng tuần, trong khi tổng số thiết bị trong hệ sinh thái Apple, bao gồm iPhone, được cho là vào khoảng 2,5 tỷ.
Thông qua Siri, Apple có thể đưa AI đến một tập người dùng rất lớn, trong đó có nhiều người chưa từng chủ động sử dụng các dịch vụ AI riêng biệt.
Xét tổng thể, đợt làm lại Siri lần này không đơn thuần là bổ sung tính năng, mà giống một chiến lược phân phối AI của Apple. Hãng có thể hợp nhất Dynamic Island, Spotlight và ứng dụng chatbot riêng thành một luồng trải nghiệm thống nhất để hạ thấp rào cản tiếp cận.
Nếu Apple công bố đúng theo hướng này tại WWDC, Siri có thể không còn chỉ là trợ lý giọng nói, mà trở thành cổng AI mới trên iPhone.