
RagaAI是一個端到端的AI品質保障平台,專注於AI智能體(Agent)和大型語言模型的全生命周期評估、調試與規模化部署,確保AI應用的可靠性與安全性。
平台支持大型語言模型(LLM)、計算機視覺模型、自然語言處理模型以及表格資料模型等多模態AI模型的測試與評估。
平台透過自動化測試套件、低代碼工作流建構與智慧根因分析,系統化評估AI工作流各階段,據稱可將 GenAI 專案部署速度提升67%。
Prism模組提供100多種資料品質測試,包括檢測資料漂移、異常值、類別不平衡和標註錯誤等,適用於影像、文字及表格資料的清洗與優化。
Catalyst提供300多項內建評估指標與防護欄,整合智慧追蹤、實驗管理與成本監控,並與NVIDIA NeMo等工具鏈整合,實現一站式AI測試解決方案。
平台透過強化學習等方式測試每個Agent回應,並設定實時防護欄(Guardrails)來檢測與降低上下文不準確或幻覺風險,確保輸出可靠性。
Ragas 是一個用於自動化評估、監控和提升檢索增強生成(RAG)系統性能的開源框架,幫助開發者實現可重複、可擴展的系統化評估。
Contextual AI 是一個面向企業的生產級上下文工程平台,透過建立統一的上下文層,將大型模型轉化為能深度理解業務數據的智能體,協助企業安全、有效地部署專業化 AI 應用。

Future AGI 是一個面向企業的 LLM 可觀測性與評估優化平臺,專注於協助開發者與企業提升 AI 應用(特別是智能體)的準確性、可靠性與效能。該平臺集構建、評估、優化與觀測功能於一體,旨在透過自動化工具加速高精度 AI 應用的開發與部署週期。

LangWatch AI 是一個面向 AI 開發團隊的 LLMOps 平台,專注於為 AI Agent 與大型語言模型應用提供測試、評估、監控與優化功能,旨在協助團隊建構可靠、可測試的 AI 系統,覆蓋從開發到生產的整個流程。
Cleanlab AI 專注於提升生成式 AI 的可靠性,透過自動化檢測與修正在 AI 幻覺問題,確保輸出內容安全、合規且可信賴。

Rubrik AI Agent Cloud 是一個企業級 AI 智能體運維平台,專注於為規模化部署的 AI 智能體提供監控、治理與恢復能力。該平台旨在協助企業安全地管理 AI 智能體,應對影子 AI、故障恢復信心不足以及資料治理等挑戰,從而在加速 AI 應用落地的過程中保持掌控力。

Giga AI 是一個企業級 AI 自動化支援平台,提供 Agent Canvas 代理建構平台與瀏覽器智慧體,協助企業快速建立、部署與管理客製化的 AI 客服與任務自動化解決方案。透過智能分析、自然語音互動與多語言支援,旨在提升複雜客戶支援情境的處理效率與使用者體驗。

FixaAI 是一個開源的 AI 語音代理自動化測試與監控平台,協助開發者高效測試、評估和優化語音對話系統,確保其性能與可靠性。
Cleanlab AI 專注於提升生成式 AI 的可靠性,提供幻覺偵測與資料品質解決方案。其技術旨在透過即時監控、錯誤識別與閉環優化工作流程,協助企業建立更安全、可信的 AI 應用,適用於客戶服務、內容產出等多種場景。

RaphaAI 是一款以人工智慧為核心的面試輔助工具,透過即時語音識別與智慧回答建議,協助求職者提升面試表現,同時為招募團隊提供結構化的面試紀錄與關鍵信息提取,旨在提升招募流程的效率與使用者體驗。