AI agent buộc doanh nghiệp theo dõi đồng thời lượng token và quy trình xử lý khi tối ưu chi phí AI. Ảnh: Shutterstock

Sự phổ biến của AI agent đang làm thay đổi cách doanh nghiệp tính toán và kiểm soát chi phí AI. Theo giới chuyên gia, khi AI ngày càng được triển khai ở quy mô lớn, bài toán chi phí không còn chỉ nằm ở việc chọn mô hình nào, mà phải được nhìn dưới góc độ “tokenomics” - tức quản trị lượng token tiêu thụ gắn với quy trình công việc và hạ tầng xử lý.

Tokenomics là thuật ngữ ghép giữa “token” - đơn vị dữ liệu mà AI xử lý - và “economics”. Khái niệm này được nhắc đến nhiều hơn khi AI agent trở nên phổ biến, kéo theo lượng token tiêu thụ trở thành một biến số quan trọng trong quản trị vận hành của doanh nghiệp.

Khi sử dụng dịch vụ AI, doanh nghiệp phát sinh token ở cả đầu vào lẫn đầu ra. Chẳng hạn, nếu một AI agent được giao viết báo cáo, toàn bộ quá trình tìm tài liệu, tổng hợp thông tin, tóm tắt nội dung và chỉnh sửa kết quả đều làm tăng số token được sử dụng. Agent càng lặp lại nhiều bước kiểm tra và hiệu chỉnh, tổng lượng token tiêu thụ càng lớn.

Chi phí AI của doanh nghiệp vì thế cũng được tính theo lượng token này. Trong bối cảnh AI agent ngày càng phổ biến và chi phí token tăng nhanh, nhiều ý kiến cho rằng doanh nghiệp cần sớm chuẩn bị cho cách tiếp cận tokenomics. Đại diện một doanh nghiệp AI cho biết khác với chatbot đơn giản chỉ xử lý từng yêu cầu đơn lẻ, AI agent thường phải gọi mô hình nhiều lần để hoàn thành một tác vụ, khiến việc kiểm soát token trở thành trọng tâm trong quản trị chi phí.

Tác động này đặc biệt rõ ở những mảng có tần suất sử dụng cao như tổng đài chăm sóc khách hàng hay hệ thống tra cứu tri thức nội bộ. Với các dịch vụ có hàng nghìn người dùng mỗi ngày, chỉ cần tiết kiệm một lượng token nhỏ trong mỗi lượt xử lý cũng có thể tạo ra chênh lệch lớn về tổng chi phí.

Xu hướng này cũng phần nào lý giải vì sao các công ty AI lớn gần đây đồng loạt tung ra cả mô hình hiệu năng cao lẫn mô hình nhẹ. OpenAI, Anthropic và Google đều đề xuất dùng mô hình mạnh cho các tác vụ đòi hỏi suy luận phức tạp, trong khi các công việc như phân loại, tóm tắt hay phản hồi theo mẫu có thể sử dụng mô hình nhẹ để tối ưu chi phí.

Một nguồn tin trong ngành cho rằng ở giai đoạn đầu triển khai AI, doanh nghiệp thường ưu tiên các mô hình có hiệu năng cao. Tuy nhiên, khi việc ứng dụng đi vào thực tế, năng lực kiểm soát chi phí theo từng nghiệp vụ sẽ trở nên quan trọng hơn. Với những doanh nghiệp vận hành AI agent ở quy mô lớn, tokenomics có thể trở thành một chủ đề trung tâm.

Bài toán này cũng gắn chặt với chiến lược hạ tầng AI. Muốn giảm chi phí token, doanh nghiệp không chỉ nhìn vào mô hình mà còn phải xem dữ liệu đang nằm ở đâu và được xử lý trên hạ tầng nào. Các tập đoàn công nghệ lớn cũng theo dõi sát xu hướng này và coi đây là một cơ hội kinh doanh mới.

Dell Technologies, doanh nghiệp hoạt động trong lĩnh vực hạ tầng điện toán, gần đây đã nhấn mạnh tokenomics tại sự kiện thường niên của hãng. Dell cho rằng khi mức độ sử dụng AI tăng lên, doanh nghiệp không thể chỉ bổ sung GPU hay máy chủ, mà cần thiết kế lại toàn bộ chu trình tạo lập, lưu trữ và xử lý dữ liệu. AMD cũng đưa ra chiến lược bao phủ từ xử lý dựa trên CPU đến GPU tối ưu chi phí và các bộ tăng tốc hiệu năng cao, cho thấy tokenomics đang nổi lên như một chủ đề đáng chú ý của ngành.

Dù vậy, tokenomics không phải vấn đề có thể giải quyết đơn thuần bằng đầu tư hạ tầng. Doanh nghiệp cần đồng thời quyết định sẽ ứng dụng AI vào công việc nào, chọn mô hình nào và thiết kế để AI agent gọi mô hình bao nhiêu lần cho mỗi tác vụ. Các yếu tố này liên kết chặt chẽ với nhau, làm gia tăng nhu cầu xây dựng cơ chế quản trị nội bộ để theo dõi mức sử dụng AI theo từng phòng ban hoặc lượng token tiêu thụ theo từng nghiệp vụ.

Theo một đại diện trong ngành, AI agent vừa là công cụ nâng cao năng suất, vừa có thể trở thành yếu tố làm thay đổi đáng kể chi phí vận hành. Trong bối cảnh đó, cách tiếp cận tokenomics - dùng đúng mô hình AI cho đúng công việc - có thể quyết định hiệu quả khai thác AI của doanh nghiệp.

Từ khóa

#trí tuệ nhân tạo #AI agent #tokenomics #token #chi phí AI #OpenAI #Anthropic #Google #Dell Technologies #AMD
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.