로딩 중...

Alibaba Cloud가 자체 개발한 초대형 언어 모델로, 텍스트 생성, 다국어 번역, 코드 작성, 문서 요약 등 다양한 기능을 제공하며 기업과 개발자에게 저비용, 높은 동시성, 프라이빗 배포가 가능한 지능형 대화 및 콘텐츠 생성 서비스를 제공합니다.
공식적으로 Max, Flash, Omni, Omni-Realtime, QVQ 등의 버전이 제공되며, 각각 추론 깊이, 속도, 멀티모달 또는 시각 추론에 중점을 두고 필요에 따라 선택할 수 있습니다.
알리바바 클라우드 백련 서비스에 가입하면 HTTPS 인터페이스를 얻을 수 있으며, 문서에는 Python, Go, Java SDK가 제공되어 10분 이내에 연결할 수 있습니다.
입력 토큰과 출력 토큰의 계층형 요금제로 산정되며, 예를 들어 Flash 모델의 입력 128k 토큰당 0.00015위안, 출력 1000토큰당 0.0015위안, 신규 사용자는 100만 토큰의 무료 크레딧을 제공합니다.
프라이빗 클라우드, 로컬 일체형 배포를 지원하며 데이터는 외부로 나가지 않아 금융·공공 등 고규정 환경에 적합합니다.
Flash 모델은 최대 100만 토큰, Max 모델은 최대 25만 토큰을 지원하며, 기업의 비즈니스 요구에 따라 선택할 수 있습니다.
내장된 알리바바 클라우드 그린넷 심사를 적용하고, 전송은 TLS 1.3으로 암호화되며, 등급 보안 3등급 및 국산 암호 알고리즘을 지원합니다.
콘솔에서 사유 자료를 업로드해 경량화된 미세 조정을 지원하며, 벡터 데이터베이스와의 연동으로 RAG를 구현해 도메인별 정확도를 높일 수 있습니다.