A Stability AI é uma empresa focada no desenvolvimento de modelos de IA de código aberto, conhecida por seu modelo de geração de imagens Stable Diffusion, dedicada a oferecer ferramentas e tecnologias de geração de conteúdos multimodais (imagens, vídeos, áudio e 3D).
O seu principal produto é o Stable Diffusion, um modelo de geração de imagens a partir de texto de código aberto. A empresa também oferece o Stable Assistant como kit criativo em torno desse modelo e amplia para geração e edição de conteúdo de vídeo, áudio e 3D.
A Stability AI oferece uma licença comunitária gratuita para uso não comercial e para pequenas empresas com receita anual abaixo de determinado limite. Para uso comercial e organizações grandes, é necessário obter uma licença empresarial correspondente ou utilizar os serviços via API mediante pagamento.
O direito de uso depende da licença escolhida. A licença comunitária gratuita normalmente impõe restrições ao uso comercial, enquanto a licença empresarial oferece direitos de uso comercial claros. Os usuários devem escolher a licença adequada conforme sua situação.
Pode-se integrar na nuvem via API fornecida, e também é possível baixar o modelo para auto-hospedagem no seu próprio ambiente; a forma específica depende da stack tecnológica e das necessidades.
Suporta principalmente a geração de imagens a partir de texto, além de oferecer edição de imagem, conversão de imagem em vídeo, geração de áudio e criação de modelos 3D a partir de uma única imagem, entre outras capacidades de geração e edição.
Para implantação local, normalmente é necessário uma GPU de alto desempenho (como GPUs NVIDIA) e memória de vídeo suficiente. As exigências variam conforme o modelo; alguns modelos otimizados também podem rodar em hardware de consumo. Chamadas de API na nuvem dependem principalmente da condição de rede.
O modelo central da Stability AI, Stable Diffusion, é de código aberto, oferece implantação local e personalização profunda, com alto controle; já o Midjourney é um serviço online proprietário, acessado principalmente via Discord, conhecido pela facilidade de uso e apelo artístico, porém requer assinatura paga.
Segundo parte da documentação técnica, o suporte a descrições em chinês pode ser limitado; recomenda-se usar prompts em inglês para obter resultados mais precisos.
Stable Diffusion Online é uma plataforma online gratuita de geração e edição de imagens com IA. Permite criar imagens de alta qualidade rapidamente a partir de descrições em texto, sem necessidade de hardware local, com suporte à interface em chinês e a diversos estilos artísticos.
ComfyUI é uma ferramenta de IA visual baseada em nós, gratuita e de código aberto, que facilita a construção e a gestão de fluxos de geração de imagens com IA, incluindo Stable Diffusion e outros.