
Arize AI 是一個專注於大型語言模型(LLM)與智能體的全生命週期可觀測性與評估平台,旨在協助團隊監控、分析與優化 AI 應用的效能與可靠性。
該平台主要解決 AI 應用在生產環境中的黑箱問題,提供從開發到運營的全鏈路追蹤、多維度評估、漂移檢測與風險告警,確保模型效能可控、業務成效可衡量。
Arize AI 支援與超過 20 個主流框架(如 LangChain、LlamaIndex)整合,並透過開源元件 Phoenix 提供靈活的接入方式,同時支援雲端 SaaS 與本地私有化部署。
通常需要註冊取得 API 金鑰,在應用中配置整合,平台即可自動追蹤工作流程的輸入輸出、令牌消耗、錯誤資訊等指標,並可透過儀表板進行可視化分析。
主要面向構建與運營生成式 AI 應用的團隊,包括 AI 研發工程師、資料科學家、MLOps 工程師以及關注模型效能的產品負責人。
它提供針對 RAG 系統的專項評估,能夠分析檢索命中率、證據充分性、引用一致性等關鍵指標,協助定位檢索增強生成流程中的效能瓶頸。

Maxim AI 是一個端對端的生成式人工智慧評估與可觀測性平臺,協助開發團隊更可靠、有效地構建、測試與部署 AI 代理與應用程式。

Future AGI 是一個面向企業的 LLM 可觀測性與評估優化平臺,專注於協助開發者與企業提升 AI 應用(特別是智能體)的準確性、可靠性與效能。該平臺集構建、評估、優化與觀測功能於一體,旨在透過自動化工具加速高精度 AI 應用的開發與部署週期。

Lyzr AI 是一個企業級智能體自動化平台,專注於透過低代碼方式協助企業快速構建、部署和管理生成式 AI 應用。該平台提供從開發到運維的端到端解決方案,旨在將複雜的企業工作流程轉化為安全、可擴展的 AI 驅動系統,助力企業實現智能化轉型與效率提升。

LangWatch AI 是一個面向 AI 開發團隊的 LLMOps 平台,專注於為 AI Agent 與大型語言模型應用提供測試、評估、監控與優化功能,旨在協助團隊建構可靠、可測試的 AI 系統,覆蓋從開發到生產的整個流程。
Zerve AI 是一個專為資料科學家與團隊設計的 AI 原生資料工作平臺,透過自適應 AI 代理與一體化工作空間,實現從資料探索到部署的完整協作工作流程。

Freeplay AI 是一個面向企業 AI 工程團隊的開發與運維平台,專注於協助團隊高效構建、測試、監控與優化基於大型語言模型的應用程式。平台透過提供協作開發、生產可觀測性及持續優化工具,旨在標準化開發流程,提升 AI 應用的可靠性與迭代效率。

Openlayer AI 是一個統一的人工智慧治理與可觀測性平台,旨在協助企業在安全合規的前提下構建、測試、部署與監控機器學習與大型語言模型系統,提升部署信心與運維效率。

Atla AI 是一個專為 AI 智能體設計的自動化評估與改進平台,透過系統化的分析、監控與優化工具,協助開發者提升智能體的性能、可靠性與開發效率。
Laminar AI 是一個開源的 AI 工程化與可觀測性平台,協助開發者構建、監控、評估和優化基於大型語言模型的應用程式與智能體。

WhyLabs AI 是一個專注於 AI 可觀測性與安全的平台,旨在為生產環境中的機器學習模型與生成式 AI 應用提供監控、保護與優化能力,協助團隊管理 AI 系統的性能與風險。