Confident AIは大規模言語モデルの評価と可観測性に特化したプラットフォームで、コアにオープンソースのDeepEvalを据え、チームがLLMアプリの性能をテスト・監視・最適化できるよう支援します。
プラットフォームはLLMの自動評価とベンチマーク、本番環境の可観測性と監視、エンドツーエンドの回帰テスト、リアルタイム評価とアラートなどの機能を提供します。
主にLLMアプリを構築・デプロイするエンジニア、データサイエンティスト、プロダクト責任者、品質保証チームを想定しています。
フリーミアムモデルで提供しています。コアの評価フレームワークDeepEvalはオープンソースで無料、クラウドプラットフォームの追加機能は有料です。詳しい料金は公式の価格ページをご参照ください。
データの分離やアクセス権管理などの機能を提供しています。具体的なデータ処理やセキュリティ対策については、プライバシーポリシーと利用規約をご確認ください。
LangChain、LlamaIndexなど主要なLLM開発フレームワークとシームレスに統合可能で、APIやCI/CD経由で接続できます。

Langfuse AI は、オープンソースの LLM エンジニアリングと運用プラットフォームで、チームが大規模言語モデルを基盤としたアプリケーションを構築・監視・デバッグ・最適化するのを支援します。アプリのトレース、プロンプト管理、品質評価、コスト分析などの機能を提供し、AI アプリの開発効率と観測性を向上させます。
Together AI は、開発者や企業向けの AI ネイティブクラウドプラットフォームです。生成型AIアプリケーションの構築と運用に必要なフルスタックのインフラを提供します。モデルの取得・カスタマイズ・学習・高性能デプロイまでを一括してサポートするツールチェーンを備え、AI アプリの開発を加速し、コスト効率を最適化します。

Evidently AI は、機械学習と大型言語モデルの評価・テスト・監視に特化したオープンソースプラットフォームで、データサイエンティストやエンジニアがAIシステムの本番環境での品質と信頼性を確保するのを支援します。

Openlayer AI は、AI ガバナンスと可観測性を統合したプラットフォームで、企業が機械学習モデルや大規模言語モデルのシステムを安全かつコンプライアンスを守って構築・テスト・デプロイ・監視するのを支援し、デプロイの信頼性と運用効率を向上させます。
Transluce AI(Transluce)は、AIシステムの解釈性と安全性を高めることに焦点を当てたオープンソース研究ツール集です。研究者と開発者がAIモデルやエージェントの内部挙動を理解・デバッグ・監視し、責任あるAIの発展を推進するのを支援します。

Future AGI は、企業向けの LLM 可観測性と評価最適化プラットフォームで、開発者と企業が AI アプリケーション(特にエージェント型アプリ)の正確性・信頼性・性能を向上させることを支援します。構築・評価・最適化・観測機能を一体化したプラットフォームで、自動化ツールを通じて高精度な AI アプリケーションの開発・デプロイサイクルを加速することを目指します。

Entelligence AI は、エンジニアリングチーム向けの AI 主導コードレビュープラットフォームです。自動レビュー、ドキュメント生成、チームの洞察を通じて、コード品質と開発効率を総合的に向上させます。

Freeplay AIは、企業のAIエンジニアリングチーム向けの開発・運用プラットフォームです。大規模言語モデルをベースにしたアプリケーションの構築・テスト・監視・最適化を、チームで効率的に進めることに焦点を当てています。当プラットフォームは、協働開発・プロダクションの可観測性・継続的な最適化機能を提供し、開発プロセスを標準化してAIアプリの信頼性と反復効率を向上させます。
LLM深層AIは、AI主導の研究とエージェントワークフローに焦点を当てたプラットフォームで、複数のモデルとローカライズされたデータ処理を統合することで、ユーザーにカスタマイズ可能なインテリジェント対話体験を提供します。

MAIHEMは、AI品質保証に特化した企業向けプラットフォームです。AIエージェントによる自動化テストとモニタリングを通じて、技術チームが大型言語モデル(LLM)アプリケーションの安全性・性能・コンプライアンスを向上させることを支援します。