dstack 是一个专为 AI/ML 工作流设计的开源容器编排平台。它旨在为机器学习团队提供一个统一的控制平面,简化生成式 AI 模型的开发、训练、微调和部署全流程,降低管理底层基础设施(如 Kubernetes)的复杂性,并优化 GPU 资源成本。
dstack 支持多云(如 AWS、GCP、Azure)、本地服务器集群以及现有的 Kubernetes 环境。在硬件层面,它原生兼容 NVIDIA、AMD、TPU、Intel Gaudi 等多种主流 AI 加速器。
基本前提是安装 Git、Docker 和 Docker Compose。部署 dstack 服务器和 CLI 工具后,需要通过配置文件定义资源(如 Fleet)后方可启用。对于本地服务器集群,仅需 Docker 和 SSH 密钥即可管理。
Fleet(资源池)是 dstack 的核心概念,用于定义和管理一组计算资源(如节点数、GPU 类型与数量)。它支持按需创建资源,并在任务完成后自动释放空闲资源以控制成本,是实现高效 GPU 编排的关键组件。
dstack 通过统一的资源编排和智能调度,实现 GPU 资源的按需供应与高效利用,避免资源闲置。其官方宣称可帮助团队降低 3 至 7 倍的基础设施成本。
dstack 主要面向 AI/ML 团队,无论是初创公司还是大型企业。它提供了从开源自托管到托管服务(dstack Sky)的多种部署选项,既能满足个人开发者或小团队的实验需求,也支持企业级的大规模、生产环境部署。

Slack 是一款集成了 AI 功能的工作管理与协作平台,通过统一的工作空间整合沟通、项目管理、工具集成与自动化,旨在提升团队协作效率与生产力。

Haystack 是一款面向产品与工程领导者的交付运营平台,旨在帮助20人以上开发团队整合交付工具链、自动化最佳实践并生成深度洞察报告,以提升软件交付的速度、质量与可预测性。

Union AI 是一个统一的 AI 编排平台,专注于简化和加速 AI/ML 工作流的开发、部署与管理,帮助企业和开发者实现从实验到生产环境的规模化应用。

Defang AI 是一款专注于简化容器化应用云端部署的 AI-DevOps 平台,支持使用 Docker Compose 文件一键部署至主流云服务,显著提升开发与运维效率。
Hatchet AI 是一个开源的分布式任务队列与工作流编排平台,专为需要高可靠性与可观测性的大规模后台任务处理而设计。它通过提供持久化队列、复杂工作流编排和实时监控等功能,帮助开发者简化异步任务管理和数据处理流程。

GrowStack AI 是一个集成化、AI驱动的业务工作流平台,通过无代码自动化与智能工具,帮助企业简化并优化营销、销售、内容创作等数字化运营流程,旨在提升团队效率并加速业务增长。

Dagger 是一个开源的可编程 CI/CD 引擎与容器化工作流编排平台,通过模块化设计和多语言支持,帮助开发者构建高效、可移植且一致的自动化流水线。
Stacks AI 是一个个人AI驱动的智能工作空间,整合管理您的书签、笔记与文件,提供统一搜索与AI增强处理,帮助您高效掌控数字足迹。

Dagster 是一个现代化的开源数据编排平台,专注于以数据资产为核心,帮助数据工程师、科学家和平台团队构建、调度和监控可靠的数据与AI流水线。它提供声明式编程模型、强大的血缘可视化与开发体验,支持与现有技术栈无缝集成,适用于ETL、机器学习运维和复杂数据处理等多种场景。

Devtron AI是一款面向生产环境的AI原生Kubernetes管理平台,通过统一集成与AI辅助能力,帮助企业简化Kubernetes运维、加速应用交付并管理关键业务场景。