
DigitalOcean AI Inference là dịch vụ suy diễn mô hình AI trên đám mây do DigitalOcean cung cấp, bao gồm các instance tính toán GPU và tùy chọn suy diễn không máy chủ, nhằm giúp người dùng triển khai và mở rộng các ứng dụng AI.
Chính bao gồm GPU Droplets (máy ảo được trang bị GPU), GPU cho DOKS, GPU bare-metal, và dịch vụ suy diễn không máy chủ thông qua Gradient™ AI Platform.
Hỗ trợ các tùy chọn GPU từ NVIDIA (ví dụ H100) và AMD (ví dụ Instinct MI350X), cung cấp các cấu hình từ một GPU đến nhiều GPU.
Thông qua Gradient™ AI Platform, người dùng không cần quản lý các instance; có thể gọi mô hình qua endpoints API, hệ thống sẽ tự động điều phối tài nguyên suy diễn và tính phí theo lượng sử dụng.
Phù hợp với nhà phát triển, các công ty khởi nghiệp và doanh nghiệp số hóa, để thử nghiệm AI, huấn luyện mô hình, triển khai ứng dụng thời gian thực và quản lý tải suy diễn trong môi trường sản xuất.
Các phương thức triển khai chính gồm: dùng Gradient™ Platform cho suy diễn không máy chủ, tự tạo và quản lý GPU Droplets, và triển khai bằng mẫu một-click cho container.
Cấu trúc giá minh bạch, gồm tùy chọn GPU theo nhu cầu và thanh toán theo token cho suy diễn không máy chủ, nhằm mang lại chi phí dự đoán được.
Hỗ trợ các mô hình nền tảng phổ biến bao gồm Claude Opus, và cung cấp dịch vụ lưu trữ cho các mô hình mã nguồn mở hàng đầu thông qua các endpoints suy diễn.
SiliconFlow AI cung cấp dịch vụ đám mây AI sinh tự động một cửa, tích hợp trên 50 mô hình nguồn mở phổ biến, thông qua động cơ suy diễn tự phát triển giúp tăng tốc đáng kể và giảm chi phí, hỗ trợ các nhà phát triển và doanh nghiệp nhanh chóng xây dựng ứng dụng AI.
SaladAI là một nền tảng đám mây GPU phân tán, tập hợp sức mạnh tính toán đang rảnh trên toàn cầu để cung cấp dịch vụ tính toán có chi phí hiệu quả cho các tác vụ suy luận AI, xử lý hàng loạt và các ứng dụng khác, giúp doanh nghiệp giảm đáng kể chi phí đám mây.