Terrill Dicki
2025年11月01日 13:41
Ray引入标签选择器,增强开发者的调度能力,允许在节点上更精确地放置工作负载。该功能是与Google Kubernetes Engine合作开发的。
分布式计算框架Ray推出了重大更新,发布了标签选择器功能,旨在增强开发者的调度灵活性。根据Anyscale最近的公告,这一新功能允许在适当的节点上更精确地放置工作负载。
增强工作负载放置
标签选择器的引入是与Google Kubernetes Engine团队合作的一部分。这一新功能在Ray 2.49版本中可用,并已集成到Ray仪表板、KubeRay和Anyscale的AI计算平台中。它允许开发者为Ray集群中的节点分配特定标签,如cpu-family=intel或market-type=spot,这可以简化在指定节点上调度任务、执行者或放置组的过程。
解决以往的局限性
此前,开发者在尝试在特定节点上调度任务时面临挑战,常常求助于将资源数量与放置约束混为一谈的变通方法。新的标签选择器通过允许更灵活地表达调度需求来解决这些限制,包括精确匹配、任意条件和负匹配,例如避开GPU节点或指定区域如us-west1-a或us-west1-b。
与Kubernetes的集成
Ray的标签选择器从Kubernetes标签和选择器中汲取灵感,增强了两个系统之间的互操作性。这一发展是持续努力将Ray更紧密地与Kubernetes集成的一部分,通过熟悉的API和语义实现更高级的用例。
实际应用
通过标签选择器,开发者可以实现各种调度目标,如将任务固定到特定节点、选择仅CPU的放置、针对特定加速器,以及将工作负载保持在特定区域或区域内。该功能还支持静态和自动扩展集群,Anyscale的自动扩展器考虑资源形态和标签选择器来适当地扩展工作组。
未来发展
展望未来,Ray计划通过额外功能增强标签选择器,如备用标签选择器、常见调度模式的库支持以及与Kubernetes的改进互操作性。这些发展旨在进一步简化工作负载调度并提升整体用户体验。
有关更详细的说明和API详情,开发者可以参考Anyscale和Ray指南。
图片来源:Shutterstock
来源:https://blockchain.news/news/ray-enhances-scheduling-with-new-label-selectors


