AI agent - công cụ có thể tự thực hiện nhiều đầu việc với mức can thiệp tối thiểu từ con người - đang trở thành tâm điểm trên mạng xã hội và trong các cộng đồng công nghệ. Tuy nhiên, đằng sau làn sóng hào hứng là hàng loạt cảnh báo về độ tin cậy, khả năng kiểm soát và rủi ro chi phí khi giao quá nhiều quyền cho công cụ này.
Nhiều chuyên gia AI dự báo AI agent có thể sớm thay thế một phần công việc văn phòng. Trong khối doanh nghiệp, công nghệ này thậm chí còn được nhắc đến như một căn cứ để cắt giảm nhân sự. Fintech Block là một ví dụ khi tuyên bố cắt giảm 40% nhân sự với lý do AI trỗi dậy.
Làn sóng AI agent trên thị trường công nghệ toàn cầu nóng lên từ tháng 1, sau khi công cụ AI agent mã nguồn mở OpenClaw xuất hiện cùng mạng xã hội AI agent Maltbook, vốn được xây dựng trên OpenClaw. Việc nhà phát triển OpenClaw gia nhập OpenAI, trong khi Meta mua lại Maltbook, được xem là dấu hiệu cho thấy cuộc đua AI đang dịch chuyển mạnh sang AI agent.
Ngoài OpenAI và Meta, nhiều công ty công nghệ tại Thung lũng Silicon như Google, Anthropic, Perplexity và Shortwave cũng đang phát triển AI agent cho thị trường doanh nghiệp.
Dù vậy, song hành với cơn sốt là những hoài nghi ngày càng lớn về các rủi ro mà AI agent có thể gây ra.
Cũng như chatbot, AI agent vẫn có thể mắc lỗi. Khi được giao xử lý quá nhiều việc, một sai sót nhỏ cũng có thể kéo theo hậu quả lớn. Nếu công cụ tự động gửi email hoặc chỉnh sửa tệp nhưng vận hành không đúng ý người dùng, việc khắc phục sau đó có thể rất phức tạp.
Summer Yue, nhà nghiên cứu tại Meta AI Lab, gần đây chia sẻ một trải nghiệm đáng chú ý. Khi cô yêu cầu AI agent dọn hộp thư, công cụ này bắt đầu xóa các email quảng cáo.
Ngay cả những AI agent như OpenClaw cũng vẫn khá khó dùng với người dùng phổ thông. Theo một bài viết gần đây của The New York Times, Bill Cutler, người điều hành một công ty marketing, đã mất nhiều tuần mới có thể sử dụng OpenClaw. Ông cho biết cả quá trình thiết lập lẫn vận hành đều “khá khó”, đồng thời nhận định “những công nghệ này bị thổi phồng nhiều hơn là thực sự hữu ích”.
Claude Cowork của Anthropic được đánh giá đáng tin cậy hơn OpenClaw trong các tác vụ nghiên cứu thuộc những lĩnh vực như tài chính, y tế và pháp lý. Tuy nhiên, công cụ này cũng không nằm ngoài các hành vi khó dự đoán.
Theo công ty kiểm thử hiệu năng AI Vals AI, trong một bài kiểm tra, Claude Cowork từng làm hỏng vĩnh viễn một tệp khi được yêu cầu chỉnh sửa.
Một số trường hợp được The New York Times ghi nhận cho thấy AI agent có thể hữu ích ở một số đầu việc, nhưng vẫn chưa đến mức có thể giao phó toàn bộ công việc.
Christian Pean, bác sĩ chấn thương chỉnh hình đồng thời điều hành một startup công nghệ y tế, cho biết ông dùng Claude Code để lập báo cáo nghiên cứu, tạo bảng tính, tóm tắt email và soạn bản nháp phản hồi.
Theo ông, Claude Code giúp tự động hóa nhiều phần công việc hằng ngày, gần như một “chánh văn phòng”. Dù vậy, ông vẫn kiểm tra kỹ mọi tác vụ mà bot thực hiện. “Tôi sẽ không để nó gửi email nếu chưa được tôi phê duyệt”, ông nói.
Theo Christian Pean, AI agent thường thể hiện rất tự tin và tạo ra kết quả có vẻ ấn tượng. Nhưng nếu người dùng không đủ chuyên môn để kiểm chứng, họ rất dễ bỏ sót thông tin sai lệch hoặc các nội dung do AI “ảo giác” tạo ra.
The New York Times cũng nêu trường hợp Sebastian Heinemann, một nhà sáng lập startup, sử dụng AI agent để sắp xếp lịch phát biểu tại Diễn đàn Kinh tế Thế giới tổ chức vào tháng 1. Trong lúc ông ngủ, AI agent đã tự tìm kiếm trên Internet những người liên quan tới diễn đàn này và tiến hành trao đổi để giành cơ hội phát biểu. Sau một cuộc trò chuyện dài với một doanh nhân người Thụy Sĩ, công cụ này đã thu xếp được việc.
Tuy nhiên, khi thức dậy, Heinemann rơi vào tình huống khó xử vì kết quả không đúng với chỉ đạo ban đầu. AI agent đã tự ý chấp thuận chi khoảng 31.000 USD cho một gói tài trợ doanh nghiệp. Ông cho biết đã nói với ban tổ chức Diễn đàn Kinh tế Thế giới rằng mình không thể thanh toán khoản tiền này, nhưng phía tổ chức trả lời rằng nếu vậy ông sẽ không thể tham dự. Cuối cùng, theo The New York Times, ông vẫn phải trả khoảng 4.600 USD chỉ để được vào sự kiện.