79 outils
Prolific est une plateforme en ligne qui met en relation chercheurs et participants du monde entier, visant à collecter efficacement et avec qualité des données humaines utilisées dans la recherche académique, l'entraînement et l'évaluation de modèles d'IA, les études de marché, etc. Grâce à des mécanismes de sélection des participants et de contrôle de qualité rigoureux, la plateforme aide les utilisateurs à obtenir des ensembles de données multimodaux fiables.
Kaggle est la communauté mondiale de référence en science des données et apprentissage automatique. Grâce à ses compétitions, jeux de données et environnements collaboratifs, la plateforme aide les praticiens à monter en compétence, résoudre des problématiques réelles et se connecter à des experts internationaux.
MongoDB est une plateforme de base de données moderne orientée documents, dont le service cloud principal MongoDB Atlas offre des solutions de base de données entièrement gérées. Cette plateforme prend en charge nativement la recherche vectorielle, et vise à aider les développeurs à construire des applications intelligentes propulsées par l'IA générative, tout en soutenant les entreprises dans la modernisation de la gestion des données et la transformation de l'architecture de leurs systèmes.

Micro1 AI est une plateforme d'intelligence artificielle axée sur la conversion des connaissances humaines spécialisées en données d'entraînement de haute qualité et structurées. Elle intègre le recrutement d'experts, la production de données, l'évaluation de la qualité et un environnement d'apprentissage par renforcement pour fournir les infrastructures de données clés pour l'entraînement, l'évaluation et l'évolution des modèles d'IA, au service de laboratoires d'IA de pointe et de grandes entreprises technologiques.
clickworker est un prestataire de services de données basé sur le crowdsourcing. Grâce à un réseau mondial de freelances certifiés, il fournit aux entreprises des services d'étiquetage, d'analyse et de collecte de données, principalement destinés à l'entraînement des modèles d'IA et à l'optimisation des décisions commerciales, en aidant les clients à transformer des données non structurées en insights exploitables.

Labelbox est une plateforme d'usine de données IA destinée aux équipes IA/ML, offrant des services d'annotation de données de haute qualité, d'évaluation des modèles et d'hébergement, pour accélérer les projets IA du prototypage à la production à grande échelle.

Appen est une plateforme spécialisée dans la fourniture de données de haute qualité pour l'IA. Grâce à l'annotation de données multimodales, à l'évaluation de modèles et à un réseau mondial de crowdsourcing, elle aide les entreprises à accélérer le développement et le déploiement de leurs applications d'intelligence artificielle.

Firecrawl AI est une API open source d’extraction de données Web conçue pour les applications IA, capable de convertir le contenu de n’importe quelle page Web en données structurées prêtes pour les LLM, aidant les développeurs à construire efficacement des systèmes RAG et des pipelines de données IA.

Bright Data est une plateforme mondiale de collecte de données sur le Web et de services proxy, offrant des solutions de données publiques à grande échelle et conformes pour aider les entreprises à obtenir rapidement des informations sur le marché et des données d’entraUnion IA.
Scale AI est une plateforme mondiale leader en données et entraînement de modèles d'IA, offrant aux entreprises des services d'annotation de données de haute qualité, d'évaluation de modèles et des solutions tout-en-un pour accélérer le développement et le déploiement de l'IA.

Oxylabs est une plateforme de services proxy destinée aux entreprises, haut de gamme, proposant des solutions intelligentes et à grande échelle pour l’extraction de données publiques sur le web, afin d'aider les utilisateurs à accéder rapidement à des données web mondiales.
Thordata Proxy est une solution d'agence proxy d'entreprise spécialisée dans l'extraction de données sur internet, offrant plusieurs types de proxies : résidentiels, mobiles, ISP statique et centres de données. Elle aide les utilisateurs à contourner les protections anti-scraping, pour une collecte de données anonyme et stable, adaptée aux études de marché, à la vérification publicitaire et à l'optimisation pour les moteurs de recherche.
Extraction IA Raybit est un outil de scraping web sans code piloté par l'IA, qui permet, en quelques clics, d'extraire automatiquement des données structurées à partir de divers sites. Il aide les équipes de vente, d'exploitation et de recherche à réaliser efficacement la veille du marché et la collecte d'informations.

SuperAnnotate AI est une plateforme de données IA de bout en bout, spécialisée dans la production, la gestion et la gouvernance de données d’entraînement et d’évaluation de haute qualité pour les modèles d’apprentissage automatique. La plateforme propose des annotations de données multimodales, des outils d’aide à l’IA et un contrôle qualité couvrant l’ensemble du processus, aidant les équipes IA à accélérer la construction de jeux de données, à évaluer les performances des modèles et à optimiser les flux de travail des agents IA.
Qdrant est une base de données vectorielle open source haute performance et un moteur de recherche par similarité, conçu pour les applications IA. Il prend en charge le stockage et la recherche efficaces de données vectorielles de haute dimension, et convient pour construire des solutions intelligentes telles que le RAG et les systèmes de recommandation.

Airbyte est une plateforme d'intégration de données open source qui, grâce à plus de 600 connecteurs préconçus certifiés, aide les entreprises à construire des pipelines ELT et à synchroniser et activer efficacement les données entre diverses applications, bases de données et entrepôts de données.

CVAT est une plateforme open source de premier plan pour l’annotation de données d’images et de vidéos, conçue pour les flux de travail d’apprentissage automatique et d’IA, aidant les équipes du monde entier à réaliser efficacement les tâches d’annotation de données.
InfluxDB est une base de données de séries temporelles leader du secteur, spécialisée dans l'écriture, le stockage et l'analyse en temps réel de volumes massifs de données temporelles, pour optimiser les décisions basées sur les données dans l'IoT industriel et la supervision opérationnelle.

Dataiku AI est une plateforme intégrée de data science et d'intelligence artificielle pour entreprises, conçue pour simplifier la gestion du cycle de vie complet, de la préparation des données au déploiement des applications IA. Elle offre un environnement unifié pour le nettoyage des données, la modélisation en machine learning, le développement d’IA générative et l’exploitation des modèles, aidant les organisations à traiter des données complexes, à renforcer la collaboration d’équipes et à accélérer l’innovation pilotée par les données.

OpenTrain AI est une plateforme mondiale de marché de talents spécialisée dans la formation et l'annotation de données pour l'IA, reliant les donneurs d'ordre et les prestataires de services professionnels. La plateforme propose des solutions intégrées de recrutement, de gestion de projets et de paiement, aidant les entreprises à constituer efficacement des équipes à distance, tout en offrant aux freelances et prestataires des opportunités de projets centralisées.
category.paginationSummary