Stability AI는 오픈소스 인공지능 모델 개발에 주력하는 회사로, 대표적인 이미지 생성 모델인 Stable Diffusion으로 잘 알려져 있습니다. 이미지, 비디오, 오디오, 3D 등 멀티모달 콘텐츠 생성 도구와 관련 기술을 제공합니다.
핵심 제품은 Stable Diffusion으로, 텍스트에서 이미지를 생성하는 오픈소스 모델입니다. 회사는 이 모델을 기반으로 한 Stable Assistant 창작 도구를 제공하며 비디오·오디오·3D 콘텐츠 생성 및 편집 기능으로도 영역을 확장하고 있습니다.
비상업적 용도와 연매출 기준 이하의 소규모 사업자는 무료 커뮤니티 라이선스를 이용할 수 있습니다. 상업적 사용이나 대규모 조직의 경우 엔터프라이즈 라이선스를 도입하거나 API 사용료를 지불해야 합니다.
사용 권한은 선택한 라이선스에 따라 달라집니다. 무료 커뮤니티 라이선스는 상업적 사용에 제약이 있을 수 있으며, 엔터프라이즈 라이선스는 명확한 상업적 사용 권한을 제공합니다. 상황에 맞는 라이선스를 선택해야 합니다.
클라우드 통합을 위해 제공되는 API를 사용하거나, 모델을 다운로드해 자체 환경에 호스팅하여 배포할 수 있습니다. 구체적인 통합 방식은 사용자의 기술 스택과 요구사항에 따라 달라집니다.
주로 텍스트로부터 이미지를 생성하며, 이미지 편집, 이미지→비디오 변환, 오디오 생성, 단일 이미지로부터 3D 모델 생성 등 다양한 생성 및 편집 기능을 제공합니다.
로컬 배포의 경우 일반적으로 일정 수준의 GPU(예: NVIDIA 그래픽카드)와 충분한 GPU 메모리가 필요합니다. 구체적 요구 사항은 모델에 따라 다르며, 일부 최적화 모델은 소비자용 하드웨어에서도 동작할 수 있습니다. 클라우드 API 사용은 주로 네트워크 상태에 영향을 받습니다.
Stability AI의 핵심 모델인 Stable Diffusion은 오픈소스이므로 로컬 배포와 심층 커스터마이즈가 가능해 제어성이 높습니다. 반면 Midjourney는 폐쇄형 온라인 서비스로 주로 Discord를 통해 제공되며 사용 편의성과 예술적 스타일로 인기가 있지만 구독 비용이 필요합니다.
일부 기술 문서에 따르면 모델의 중국어 자연어 프롬프트 지원은 제한적일 수 있어, 보다 정확한 결과를 얻기 위해 가능하면 영어 프롬프트를 사용하는 것을 권장합니다.