Stability AIはオープンソースのAIモデルの開発に注力する企業で、代表的な画像生成モデルであるStable Diffusionで知られています。画像・動画・音声・3Dなどのマルチモーダルなコンテンツ生成ツールや技術を提供しています。
中核製品はStable Diffusionというオープンソースのテキスト→画像生成モデルです。これに加えて、Stable Assistantなどのクリエイティブスイートや、映像・音声・3Dコンテンツの生成・編集を行う各種ツールを提供しています。
Stability AIは、非商用利用や一定の収入基準以下の小規模事業を対象に無料のコミュニティライセンスを提供しています。商用利用や大規模組織の場合は、エンタープライズライセンスの取得やAPI利用の有料プランが必要です。
利用可能かどうかは選択したライセンスによります。無料のコミュニティライセンスには商用利用に制限がある場合が多く、エンタープライズライセンスでは商用利用に関する明確な権利が付与されます。用途に応じて適切なライセンスを選んでください。
クラウドAPIを通じた統合のほか、モデルをダウンロードして自社環境でセルフホスティングすることも可能です。具体的な方法は利用する技術スタックや要件によって異なります。
主にテキストからの画像生成をサポートし、画像編集、画像→動画変換、音声生成、単一画像からの3Dモデル生成など、多彩な生成・編集機能を備えています。
ローカルでの導入には一般的に性能のあるGPU(例:NVIDIA製)と十分なVRAMが必要です。必要なスペックはモデルによって異なり、最適化されたモデルの中には消費者向けハードウェアでも動作するものもあります。クラウドAPIを利用する場合は主にネットワーク環境が重要です。
Stability AIの中核モデルであるStable Diffusionはオープンソースで、ローカル導入や高度なカスタマイズが可能で可制御性が高いのが特徴です。Midjourneyはクローズドなオンラインサービスで、主にDiscord経由で提供され、使いやすさや独特の芸術性が評価されていますが、基本的に有料のサブスクリプションが必要です。
技術文書などによると、中国語の自然言語プロンプトへの対応は限定的な場合があり、より正確な結果を得るには英語のプロンプトを併用することが推奨されます。