
DigitalOcean AI Inference est le service de déploiement et d'inférence de modèles IA en nuage proposé par DigitalOcean, incluant des instances GPU et des options d'inférence sans serveur.
Il comprend notamment les Droplets GPU (machines virtuelles équipées de GPU), le GPU pour DOKS, le GPU bare-metal, et l'inférence sans serveur via Gradient™ AI Platform.
Ils prennent en charge des GPU NVIDIA (par exemple H100) et AMD (par exemple Instinct™ MI350X), avec des configurations allant d'un seul GPU à plusieurs GPU.
Grâce à Gradient™ AI Platform, les utilisateurs n'ont pas à gérer d'instances : ils appellent les modèles via des endpoints API et les ressources d'inférence sont automatiquement allouées et facturées à l'usage.
Conçu pour les développeurs, les startups et les entreprises numériques, pour l'expérimentation IA, l'entraînement de modèles, le déploiement d'applications en temps réel et la gestion des charges d'inférence en production.
Les principales options incluent l'inférence sans serveur via Gradient™ Platform, la création et gestion de vos propres instances GPU Droplets, et le déploiement en conteneurisation via des templates en un clic.
Une tarification transparente avec des instances GPU à la demande et une facturation par token pour l'inférence sans serveur, visant un coût prévisible.
Prend en charge les modèles de base courants, y compris Claude Opus, et propose des services d'hébergement d'inférence pour les modèles open-source de pointe via des endpoints.
SiliconFlow IA propose une plateforme cloud tout-en-un pour l'IA générative, intégrant plus de 50 grands modèles open source et dotée d'un moteur d'inférence maison qui accélère les performances et réduit les coûts, aidant les développeurs et les entreprises à construire rapidement des applications d'IA.
SaladAI est une plateforme cloud GPU distribuée qui fédère des ressources GPU inactives à travers le monde pour offrir des services de calcul rentables destinés à l’inférence IA et au traitement par lots, aidant les entreprises à réduire considérablement leurs coûts cloud.