AI开发者云平台Runpod发布开源Python SDK“Flash”,主打AI推理部署场景,旨在帮助开发者降低将AI代码部署到生产环境时的基础设施配置负担。Techzine于5月4日(当地时间)报道了这一消息。
据Runpod介绍,Flash可将本地Python函数在数分钟内快速封装为可自动扩缩的端点,开发者无需再自行处理容器构建、镜像管理和基础设施配置等工作。该工具采用MIT许可证,目前已在PyPI和GitHub开放获取。
Runpod CEO Zhen Lu表示,尽管Serverless能力强大,但不少开发者一直认为配置流程仍是主要门槛。Flash的目标,是让开发者只需编写Python代码并选择所需计算资源,就能在几分钟内完成部署并开始处理请求。
Zhen Lu还表示,随着智能体需要调用多种模型、在不同计算类型之间切换,并根据需求进行扩展,Flash也更适合这类工作负载。
在部署模式上,Flash支持两种方式:一是适用于批处理和异步任务的队列模式,二是面向实时推理流量的负载均衡端点。
开发者可直接在Python中定义计算需求和依赖项,其余资源配置、按需扩缩容及基础设施管理工作则由Flash自动完成。端点可根据请求量自动扩展,空闲时可缩至零。Runpod表示,目前平台开发者规模已超过70万,仅2026年3月就新建了3.7万个Serverless端点。
记者信息