Confident AI 是一個專注於大型語言模型評估與可觀測性的平臺,其核心為開源框架 DeepEval,旨在幫助團隊測試、監控與優化 LLM 應用的效能。
平臺主要提供 LLM 自動化評估與基準測試、生產環境可觀測性與監控、端到端回歸測試以及實時評估與警報等功能。
主要面向需要構建和部署 LLM 應用的工程師、資料科學家、產品負責人以及品質保證團隊。
平臺採用免費增值模式,其核心評估框架 DeepEval 開源免費,雲端平台提供增強功能,具體費用資訊請參考官方定價頁面。
平臺提供資料隔離與權限管理等能力,使用者可參考其隱私政策與服務條款了解具體的資料處理與安全措施。
平臺可與主流 LLM 開發框架如 LangChain、LlamaIndex 無縫整合,並可透過 API 與 CI/CD 流程連結。

Langfuse AI 是一個開源的 LLM 工程與運維平台,旨在協助開發團隊構建、監控、除錯與優化基於大型語言模型的應用。它透過提供應用追蹤、提示詞管理、品質評估與成本分析等功能,提升 AI 應用的開發效率與可觀測性。
Together AI 是一個 AI 原生雲端平台,為開發者與企業提供全端基礎設施,用於構建與執行生成式 AI 應用。平台提供從模型取得、客製化、訓練到高效能部署的完整工具鏈,旨在加速 AI 應用開發並提升成本效益。

Evidently AI 是一個專注於機器學習與大型語言模型評估、測試與監控的開源平台,協助資料科學家與工程師確保 AI 系統在生產環境中的品質與可靠性。

Openlayer AI 是一個統一的人工智慧治理與可觀測性平台,旨在協助企業在安全合規的前提下構建、測試、部署與監控機器學習與大型語言模型系統,提升部署信心與運維效率。
透光AI(Transluce)是一款專注於提升 AI 系統可解釷性與安全性的開源研究工具,協助研究人員與開發者理解、除錯及監控 AI 模型的內部行為,推動負責任的 AI 發展。

Future AGI 是一個面向企業的 LLM 可觀測性與評估優化平臺,專注於協助開發者與企業提升 AI 應用(特別是智能體)的準確性、可靠性與效能。該平臺集構建、評估、優化與觀測功能於一體,旨在透過自動化工具加速高精度 AI 應用的開發與部署週期。

Entelligence AI 是一款面向工程團隊的 AI 驅動代碼審查平台,透過自動化審查、文檔生成與團隊洞察,全面提升程式碼品質與開發效率。

Freeplay AI 是一個面向企業 AI 工程團隊的開發與運維平台,專注於協助團隊高效構建、測試、監控與優化基於大型語言模型的應用程式。平台透過提供協作開發、生產可觀測性及持續優化工具,旨在標準化開發流程,提升 AI 應用的可靠性與迭代效率。
LLM深度AI是一個專注於AI驅動研究與智能體工作流程的平台,透過整合多模型與本地化資料處理,為使用者提供可定制的智能對話體驗。

MAIHEM 是一家專注於 AI 品質保證的企業級平臺,透過 AI 代理自動化測試與監控,協助技術團隊提升大型語言模型應用的安全性、效能與合規性。