
DigitalOcean AI Inference
Recursos de DigitalOcean AI Inference
Casos de Uso de DigitalOcean AI Inference
Perguntas Frequentes sobre DigitalOcean AI Inference
QO que é o DigitalOcean AI Inference?
DigitalOcean AI Inference é o serviço de inferência de modelos de IA da DigitalOcean, que inclui instâncias com GPU e opções sem servidor, criado para facilitar a implantação e a escala de aplicações de IA.
QQuais serviços estão incluídos no DigitalOcean AI Inference?
Inclui principalmente GPU Droplets (VMs com GPU), suporte a GPUs no DOKS, GPUs bare-metal e inferência sem servidor oferecida pela Gradient™ AI Platform.
QQuais GPUs são suportadas pelos GPU Droplets do DigitalOcean AI Inference?
Suporta opções de GPUs da NVIDIA (por exemplo, H100) e da AMD (por exemplo, Instinct™ MI350X), com configurações que vão de single-GPU a multi-GPU.
QComo usar a funcionalidade de inferência sem servidor da DigitalOcean?
Pelo Gradient™ AI Platform, você pode chamar modelos diretamente por endpoints de API sem gerenciar instâncias; o sistema escala e aloca recursos de inferência automaticamente, cobrando conforme o uso.
QPara quem o DigitalOcean AI Inference é indicado?
É indicado para desenvolvedores, startups e empresas digitais que realizam experimentos de IA, treinamentos de modelos, deploy de aplicações em tempo real e gestão de cargas de inferência em produção.
QQuais são as formas de implantar o DigitalOcean AI Inference?
As principais formas incluem: usar inferência sem servidor pela plataforma Gradient™, criar e gerenciar manualmente instâncias GPU Droplets, ou usar templates de deploy com um clique para ambientes conteinerizados.
QComo o DigitalOcean AI Inference se comporta em termos de custos?
Oferece estrutura de preços transparente, com opções de instâncias GPU sob demanda e alternativas sem servidor cobradas conforme o uso, projetadas para tornar os custos mais previsíveis.
QQuais modelos de IA o DigitalOcean AI Inference suporta?
Suporta a inferência hospedada de modelos base populares, incluindo modelos como Claude Opus, e disponibiliza endpoints para modelos open-source de destaque.