Question 1

DigitalOcean AI Inference 是什麼？

Accepted Answer

DigitalOcean AI Inference 是 DigitalOcean 提供的雲端 AI 模型推理服務，包含 GPU 計算實例與無伺伺服器推理選項，旨在協助使用者部署與擴展 AI 應用。

Question 2

DigitalOcean AI Inference 主要包含哪些服務？

Accepted Answer

主要包括 GPU Droplets（配備 GPU 的虛擬機）、適用於 DOKS 的 GPU、裸機 GPU，以及透過 Gradient™ AI Platform 提供的無伺伺服器推理服務。

Question 3

DigitalOcean AI Inference 的 GPU Droplets 支持哪些 GPU？

Accepted Answer

支援來自 NVIDIA（如 H100）與 AMD（如 Instinct™ MI350X）的 GPU 選項，提供從單 GPU 到多 GPU 的多種配置。

Question 4

如何使用 DigitalOcean 的無伺服器推理功能？

Accepted Answer

透過 Gradient™ AI Platform，使用者無需管理實例，可直接透過 API 端點呼叫模型，系統會自動分配推理資源並依使用量計費。

Question 5

DigitalOcean AI Inference 适合哪些用户？

Accepted Answer

適用於開發者、初創企業及數位原生企業，用於 AI 實驗、模型訓練、實時應用部署及生產環境推理工作負載管理。

Question 6

部署 DigitalOcean AI Inference 服務有哪些方式？

Accepted Answer

主要方式包括：透過 Gradient™ 平台使用無伺伺服器推理、自行建立並管理 GPU Droplets 實例，以及使用一鍵部署模板進行容器化部署。

Question 7

DigitalOcean AI Inference 在成本方面有何特點？

Accepted Answer

提供透明的定價結構，包括按需 GPU 實例與按 token 計費的無伺伺服器選項，目的在於提供可預測成本。

Question 8

DigitalOcean AI Inference 支持哪些 AI 模型？

Accepted Answer

支援包括 Claude Opus 在內的主流基礎模型，並透過推理端點提供領先開源模型的托管服務。

DigitalOcean AI Inference

DigitalOcean AI Inference 主要功能