Question 1

DigitalOcean AI Inference 是什么？

Accepted Answer

DigitalOcean AI Inference 是DigitalOcean提供的云端AI模型推理服务，包含GPU计算实例和无服务器推理选项，旨在帮助用户部署和扩展AI应用。

Question 2

DigitalOcean AI Inference 主要包含哪些服务？

Accepted Answer

主要包括GPU Droplets（配备GPU的虚拟机）、适用于DOKS的GPU、裸金属GPU，以及通过Gradient™ AI Platform提供的无服务器推理服务。

Question 3

DigitalOcean AI Inference 的GPU Droplets支持哪些GPU？

Accepted Answer

支持来自NVIDIA（如H100）和AMD（如Instinct™ MI350X）的GPU选项，提供从单GPU到多GPU的多种配置。

Question 4

如何使用DigitalOcean的无服务器推理功能？

Accepted Answer

通过Gradient™ AI Platform，用户无需管理实例，可直接通过API端点调用模型，系统会自动调度推理资源并按使用量计费。

Question 5

DigitalOcean AI Inference 适合哪些用户？

Accepted Answer

适用于开发者、初创企业及数字原生企业，用于AI实验、模型训练、实时应用部署及生产环境推理工作负载管理。

Question 6

部署DigitalOcean AI Inference服务有哪些方式？

Accepted Answer

主要方式包括：通过Gradient™平台使用无服务器推理、自主创建并管理GPU Droplets实例，以及使用一键部署模板进行容器化部署。

Question 7

DigitalOcean AI Inference 在成本方面有何特点？

Accepted Answer

提供透明的定价结构，包括按需GPU实例和按token计费的无服务器选项，旨在提供可预测的成本。

Question 8

DigitalOcean AI Inference 支持哪些AI模型？

Accepted Answer

支持包括Claude Opus在内的主流基础模型，并通过推理端点提供领先开源模型的托管服务。

DigitalOcean AI Inference

DigitalOcean AI Inference 主要功能