Stability AI es una empresa dedicada al desarrollo de modelos de IA de código abierto, conocida por su modelo de generación de imágenes Stable Diffusion, y se compromete a ofrecer herramientas y tecnologías para la generación de contenido multimodal (imágenes, videos, audio y 3D).
Su producto central es Stable Diffusion, un modelo de código abierto de texto a imagen. La compañía también ofrece Stable Assistant, un conjunto de herramientas creativas rodeando ese modelo, y se expande a la generación y edición de contenido en video, audio y 3D.
Stability AI ofrece una licencia comunitaria gratuita para usos no comerciales y pequeñas empresas con ingresos anuales por debajo de cierto umbral. Para usos comerciales y grandes organizaciones, se requiere una licencia empresarial o pagar por el uso a través de servicios API.
Los derechos de uso dependen del tipo de licencia elegido. La licencia comunitaria gratuita suele restringir el uso comercial, mientras que la licencia empresarial ofrece derechos claros de uso comercial. Los usuarios deben elegir la licencia adecuada según su situación.
Puede integrarse en la nube mediante su API, y también admite descargar el modelo para implementarlo en su propio entorno, con el método específico que dependa de la pila tecnológica y las necesidades.
Principalmente admite generar imágenes a partir de texto, y también ofrece edición de imágenes, conversión de imágenes a video, generación de audio y la generación/edición de 3D a partir de una sola imagen.
Para implementación local, generalmente se necesita una GPU de rendimiento razonable (p. ej., tarjetas NVIDIA) y suficiente memoria de video. Los requisitos varían según el modelo; algunos modelos optimizados pueden ejecutarse en hardware de consumo. Las llamadas a la API en la nube dependen principalmente de la conectividad de red.
El modelo central de Stability AI, Stable Diffusion, es de código abierto, admite despliegue local y personalización profunda, con alto control; mientras que Midjourney es un servicio en línea de código cerrado, utilizado principalmente a través de Discord, conocido por su facilidad de uso y estética, pero requiere suscripción de pago.
Según algunos documentos técnicos, el modelo puede tener soporte limitado para descripciones en chino; se recomienda usar prompts en inglés para obtener resultados más precisos.
Stable Diffusion Online es una plataforma gratuita en línea de generación y edición de imágenes con IA. Los usuarios pueden crear imágenes de alta calidad a partir de descripciones de texto de forma rápida, sin necesidad de hardware local, con interfaz en chino y soportando múltiples estilos artísticos.
ComfyUI es una herramienta de IA para generación de imágenes basada en nodos, gratuita y de código abierto, que facilita a los usuarios construir y gestionar de forma eficiente procesos de generación complejos como Stable Diffusion mediante flujos de trabajo visuales.