
Arize AI est une plateforme dédiée à l'observabilité et à l'évaluation des grands modèles de langage (LLM) et des agents, conçue pour aider les équipes à surveiller, analyser et optimiser la performance et la fiabilité des applications IA.
La plateforme adresse le problème de la boîte noire en production : elle fournit un traçage complet du développement à l'exploitation, des évaluations multi‑dimensions, la détection de dérive et des alertes de risque, afin de rendre la performance des modèles maîtrisable et les résultats mesurables.
Arize AI s'intègre avec plus de 20 frameworks majeurs (par exemple LangChain, LlamaIndex) et propose des composants open source via Phoenix pour un accès flexible. Elle supporte à la fois une offre SaaS cloud et des déploiements sur site.
Généralement, il faut s'enregistrer pour obtenir une clé API, configurer l'intégration dans l'application, puis la plateforme collecte automatiquement les entrées/sorties du workflow, la consommation de tokens, les erreurs, etc., et propose des tableaux de bord pour l'analyse visuelle.
Elle s'adresse principalement aux équipes qui conçoivent et exploitent des applications génératives : ingénieurs IA, data scientists, ingénieurs MLOps et responsables produit soucieux de l'efficacité des modèles.
La plateforme propose des évaluations spécifiques aux systèmes RAG, analysant le taux de récupération, la suffisance des preuves, la cohérence des citations et d'autres indicateurs clés pour identifier les goulets d'étranglement du flux de récupération‑augmentée.

Maxim AI est une plateforme complète d’évaluation et d’observabilité pour l’IA générative, aidant les équipes de développement à concevoir, tester et déployer des agents et des applications d’IA plus fiables et efficaces.

Future AGI est une plateforme d'observabilité et d'optimisation des évaluations destinée aux entreprises, axée sur l'amélioration de l'exactitude, de la fiabilité et des performances des applications IA, notamment des agents intelligents. Cette plateforme réunit les fonctions de construction, d'évaluation, d'optimisation et d'observabilité, afin d'accélérer le cycle de développement et de déploiement des applications IA de haute précision grâce à des outils d'automatisation.