Stability AI est une entreprise spécialisée dans le développement de modèles d'intelligence artificielle open source, connue pour son modèle de génération d'images Stable Diffusion. Elle propose des outils et technologies pour la génération de contenus multimodaux (images, vidéos, audio, 3D).
Le produit central est Stable Diffusion, un modèle open source de génération d'images à partir de texte. L'entreprise propose également la suite créative Stable Assistant et étend ses outils à la génération et à l'édition de vidéos, d'audio et de contenus 3D.
Stability AI propose une licence communautaire gratuite pour un usage non commercial et pour les petites entreprises sous un certain seuil de chiffre d'affaires. Pour un usage commercial ou pour les grandes organisations, il est nécessaire d'obtenir une licence entreprise ou d'utiliser les services API payants.
Les droits d'utilisation dépendent de la licence choisie. La licence communautaire gratuite peut comporter des restrictions pour un usage commercial, tandis que la licence entreprise définit clairement les droits commerciaux. Il convient de choisir la licence adaptée à votre cas d'usage.
Il est possible d'intégrer les modèles via les API cloud proposées, ou de télécharger et d'auto‑héberger les modèles dans son propre environnement. Le choix dépend de votre stack technique et de vos besoins en déploiement.
Principalement des images à partir de texte, mais aussi des fonctions d'édition d'images, la conversion image→vidéo, la génération audio et la création de modèles 3D à partir d'une seule image.
Pour un déploiement local, il faut généralement un GPU performant (par exemple une carte NVIDIA) et suffisamment de mémoire vidéo. Les besoins varient selon le modèle ; certains modèles optimisés peuvent fonctionner sur du matériel grand public. L'utilisation via API cloud dépend essentiellement de la qualité de la connexion réseau.
Stable Diffusion, le modèle principal de Stability AI, est open source, autorise l'auto‑hébergement et une personnalisation approfondie, offrant plus de contrôle. Midjourney est un service propriétaire, principalement accessible via Discord, axé sur la simplicité d'utilisation et l'aspect artistique, et fonctionne sur abonnement payant.
D'après certaines documentations techniques, le support des descriptions en chinois peut être limité ; il est recommandé d'utiliser des prompts en anglais pour obtenir des résultats plus précis.
Stable Diffusion Online est une plateforme en ligne gratuite de génération et d'édition d'images par IA. Les utilisateurs peuvent créer rapidement des images de haute qualité à partir de descriptions textuelles, sans besoin de matériel local. Interface disponible en chinois et prise en charge de nombreux styles artistiques.
ComfyUI est un outil IA visuel gratuit et Open Source, basé sur une architecture en nœuds, qui aide à concevoir et gérer efficacement des flux de génération d'images avec Stable Diffusion et d'autres modèles complexes.