Ảnh: Shutterstock

Theo Techzine, Runpod - công ty cung cấp hạ tầng điện toán đám mây cho các nhà phát triển AI - vừa ra mắt Flash, bộ SDK Python mã nguồn mở nhằm đơn giản hóa quá trình triển khai suy luận AI vào môi trường vận hành.

Runpod cho biết Flash cho phép biến các hàm Python chạy cục bộ thành các endpoint serverless có khả năng tự động co giãn chỉ trong vài phút. Với công cụ này, nhà phát triển không cần tự xây dựng container, quản lý image container hay cấu hình hạ tầng. Bộ SDK được phát hành theo giấy phép MIT và hiện có mặt trên PyPI cùng GitHub.

CEO Runpod Zhen Lu cho biết mô hình serverless có nhiều ưu thế, nhưng khâu thiết lập ban đầu thường là rào cản lớn. Theo ông, mục tiêu của Flash là giúp nhà phát triển chỉ cần viết mã Python và chọn tài nguyên tính toán, sau đó có thể đưa tác vụ vào hoạt động trong thời gian ngắn.

Ông cũng cho biết Flash đặc biệt phù hợp với các tác vụ AI dạng agent, trong đó agent phải gọi nhiều mô hình, luân chuyển giữa các loại tài nguyên tính toán khác nhau và mở rộng quy mô theo nhu cầu.

Về cách triển khai, Flash hỗ trợ xử lý theo cơ chế hàng đợi cho các tác vụ batch và bất đồng bộ. Đồng thời, công cụ này cũng cung cấp các endpoint có cân bằng tải để đáp ứng nhu cầu suy luận theo thời gian thực.

Nhà phát triển có thể khai báo trực tiếp nhu cầu tài nguyên tính toán và các thư viện phụ thuộc ngay trong Python. Flash sau đó sẽ tự động xử lý các khâu cấp phát, mở rộng và vận hành hạ tầng. Các endpoint có thể tự động co giãn theo nhu cầu và đưa về mức 0 khi không có lưu lượng sử dụng.

Runpod cho biết hiện nền tảng này có hơn 700.000 nhà phát triển sử dụng. Riêng trong tháng 3/2026, công ty đã tạo ra 37.000 endpoint serverless.

Từ khóa

#Runpod #Flash #SDK Python #suy luận AI #serverless #endpoint #mã nguồn mở #PyPI #GitHub
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.