据Techzine援引Cast AI调研结果报道,对数万个Kubernetes集群的分析显示,GPU平均利用率仅为5%,CPU为8%,内存为20%。上述报道于当地时间21日刊发。
Kubernetes是一套开源平台,用于跨多台服务器自动部署和管理应用容器。不过,随着Kubernetes的普及,企业云支出与实际资源利用之间的落差正不断扩大。
Techzine指出,这一结果与Kubernetes“高效运行大规模基础设施”的定位形成鲜明反差。即便是在AI和机器学习负载中,GPU平均利用率也只有5%。相比之下,闲置GPU每小时可能产生数美元成本,而闲置CPU的成本仅为几美分,前者带来的资源浪费和经济损失更为明显。
Cast AI认为,问题的根源在于一次性的资源规格优化。即使在部署阶段完成了配置调整,工作负载仍会持续变化,流量模式也会不断波动,6个月前仍然适用的设置,如今可能已经不再匹配。类似问题同样存在于Spot实例选择、容器自动伸缩设置以及节点生命周期管理等环节。
Cast AI表示,要遏制基础设施成本持续偏高的问题,企业需要采用自治且持续的优化方式。该公司提供的平台可在Kubernetes环境中自动优化云成本。
记者信息