23 herramientas
Arena (anteriormente LMArena) es una plataforma de pruebas y comparativas de modelos de IA impulsada por la comunidad. A través de duelos anónimos, votaciones de usuarios y un sistema de puntuación ELO, ayuda a evaluar y comparar el rendimiento real de modelos de IA de vanguardia como GPT, Claude, Gemini, en tareas de texto, imágenes, código y más.
Outlier AI es una plataforma de trabajo remoto que conecta a expertos de todo el mundo con empresas de IA, entrenando modelos mediante tareas como el etiquetado de datos y la evaluación de modelos, para que los profesionales aprovechen su conocimiento y obtengan ingresos flexibles.

ChatHub AI es una plataforma que integra múltiples modelos de lenguaje grandes populares, permite a los usuarios comparar las respuestas de distintos modelos en una misma interfaz lado a lado, con el objetivo de aumentar la eficiencia de la toma de decisiones, verificar la información y reducir el riesgo de alucinaciones de un solo modelo.

Arena AI ofrece dos soluciones principales: una plataforma de evaluación y enrutamiento de modelos de IA que ayuda a los usuarios a probar, comparar y elegir modelos mediante votaciones de la comunidad y ruteo inteligente; y una plataforma de interacción comunitaria impulsada por IA que permite a las empresas crear y gestionar comunidades en tiempo real en sus sitios web para aumentar la participación de usuarios y la conversión.

Arize AI es una plataforma de observabilidad y evaluación para el ciclo de vida completo de grandes modelos de lenguaje e agentes inteligentes, diseñada para ayudar a los equipos de ingeniería de IA a monitorizar, evaluar y optimizar el rendimiento de los modelos, asegurando la fiabilidad de las aplicaciones y los resultados para el negocio.

Evidently AI es una plataforma de código abierto centrada en la evaluación, prueba y monitoreo de modelos de aprendizaje automático y de grandes modelos de lenguaje (LLM), diseñada para garantizar la calidad, seguridad y fiabilidad de los sistemas de IA en entornos de producción.
Confident AI es una plataforma centrada en la evaluación y la observabilidad de grandes modelos de lenguaje, que ayuda a ingenieros y equipos de producto a probar, monitorizar y optimizar el rendimiento y la fiabilidad de sus aplicaciones de IA.
Ragas es un marco de código abierto para automatizar la evaluación, monitorización y mejora del rendimiento de los sistemas de recuperación aumentada por generación (RAG), que ayuda a los desarrolladores a lograr evaluaciones sistemáticas, repetibles y escalables.
Nexa AI es una plataforma centrada en la implementación y optimización de modelos de IA en el borde que ofrece bibliotecas de modelos y herramientas de desarrollo optimizadas para dispositivos locales. Su valor central es ayudar a desarrolladores y empresas a ejecutar modelos de IA de forma eficiente en el dispositivo, admite uso offline y presta especial atención a la privacidad de los datos.

Future AGI es una plataforma empresarial de observabilidad y optimización de evaluaciones para LLM, enfocada en ayudar a desarrolladores y empresas a mejorar la precisión, fiabilidad y rendimiento de las aplicaciones de IA (especialmente para agentes inteligentes). Esta plataforma integra las funciones de construcción, evaluación, optimización y observabilidad en una solución unificada, con el objetivo de acelerar el desarrollo y el despliegue de aplicaciones de IA de alta precisión mediante herramientas automatizadas.
Transluce AI (Transluce) es una herramienta de investigación de código abierto enfocada en mejorar la interpretabilidad y la seguridad de los sistemas de IA, que ayuda a investigadores y desarrolladores a entender, depurar y monitorear el comportamiento interno de los modelos de IA, promoviendo el desarrollo de una IA responsable.
Humanloop es una plataforma de desarrollo de IA a nivel empresarial, enfocada en proporcionar un flujo de herramientas completo para construir, evaluar, optimizar y desplegar aplicaciones basadas en modelos de lenguaje grandes (LLM). Al integrar ingeniería de prompts, evaluación de modelos y funcionalidades de observabilidad, ayuda a los equipos de desarrollo a mejorar la confiabilidad y el rendimiento de las aplicaciones de IA, y facilita la colaboración entre funciones y el despliegue seguro.

phospho AI es una plataforma de análisis de texto de código abierto diseñada para aplicaciones que utilizan grandes modelos de lenguaje (LLM). Analiza automáticamente las interacciones entre usuarios e IA, identifica eventos clave e intenciones de los usuarios, y ofrece herramientas de visualización de datos para ayudar a los desarrolladores a optimizar la experiencia de conversación y el rendimiento del modelo.
Alle-AI es una plataforma todo-en-uno que integra múltiples modelos de IA líderes. Permite a los usuarios realizar llamadas paralelas, comparar e integrar herramientas de IA generativa de distintos proveedores, con el objetivo de aumentar la eficiencia creativa y la fiabilidad de los resultados.

Enigma AI es un término general que cubre diversas aplicaciones e investigaciones en inteligencia artificial, que incluye principalmente sistemas de generación de decisiones, benchmarks de evaluación de modelos de lenguaje grande, modelos de decodificación de EEG y aplicaciones de chat inteligente. Proporciona a usuarios de distintos campos herramientas y soluciones de IA variadas, que abarcan desde la creación de contenido y la escritura de código hasta evaluaciones de razonamiento avanzado e investigación en neurociencia.
Captum es una biblioteca de interpretabilidad de modelos de código abierto basada en PyTorch, diseñada para ayudar a los desarrolladores a entender la lógica de predicción y la contribución de características de los modelos de redes neuronales, útil para depurar modelos, investigar algoritmos y optimizar el rendimiento.

Thisorthis.ai es una plataforma de comparación de modelos de IA generativa que, mediante pruebas paralelas y análisis multidimensional, ayuda a los usuarios a evaluar de forma eficiente y seleccionar el modelo de IA generativa que mejor se adapte a sus necesidades.

Atla AI es una plataforma de evaluación y mejora automatizada diseñada específicamente para agentes de IA, que utiliza análisis sistemáticos, monitoreo y herramientas de optimización para ayudar a los desarrolladores a mejorar el rendimiento, la fiabilidad y la eficiencia en el desarrollo de sus agentes.

OverallGPT Compare AI es una plataforma de comparación de rendimiento de grandes modelos de IA. Permite a los usuarios visualizar lado a lado las respuestas de diferentes modelos de IA. Esta plataforma tiene como objetivo ayudar a usuarios, desarrolladores y tomadores de decisiones tecnológicas a través de una comparación intuitiva para evaluar y elegir el modelo de IA que mejor se adapte a sus necesidades específicas.

Langtrace AI es una plataforma de observabilidad y evaluación de código abierto, que ayuda a los desarrolladores a supervisar, depurar y optimizar aplicaciones basadas en modelos de lenguaje grandes, convirtiendo prototipos de IA en productos empresariales confiables.
category.paginationSummary