79 个工具
Prolific 是一个专注于连接研究人员与全球参与者的在线平台,旨在高效、高质量地收集用于学术研究、人工智能模型训练与评估、市场调研等领域的人类数据。平台通过严格的参与者筛选与质量控制机制,帮助用户获取可靠的多模态数据集。
Kaggle是全球领先的数据科学与机器学习社区平台,通过竞赛、数据集和协作环境,帮助从业者提升技能、解决实际问题并连接全球专家。
MongoDB 是一款面向文档的现代数据库平台,其核心云服务 MongoDB Atlas 提供全托管数据库解决方案。该平台原生支持向量搜索功能,旨在帮助开发者构建由生成式 AI 驱动的智能应用程序,并支持企业进行数据管理现代化与系统架构转型。

Micro1 AI是一个专注于将人类专业知识转化为高质量、结构化训练数据的人工智能平台。它通过整合专家招募、数据生产、质量评估及强化学习环境,为AI模型训练、评估与进化提供关键的数据基础设施,服务于前沿AI实验室及大型科技企业。
clickworker 是一家基于众包模式的数据服务提供商,依托全球认证工作者网络,为企业提供数据标注、分析与采集服务,主要应用于AI模型训练与商业决策优化,帮助客户将非结构化数据转化为可操作的洞察。

Labelbox 是一个面向AI团队的数据工厂平台,提供高质量数据标注、模型评估与托管服务,帮助加速从原型开发到规模化生产的AI项目进程。

Appen是一家专注于为AI提供高质量数据服务的平台,通过多模态数据标注、模型评估与全球众包网络,帮助企业加速AI应用的开发与部署。

Firecrawl AI 是一款专为AI应用设计的开源网络数据提取API,可将任意网页内容转换为LLM就绪的结构化数据,助力开发者高效构建RAG系统与AI数据管道。

亮数采(Bright Data)是全球领先的网络数据采集与代理服务平台,提供大规模、合规的公开网络数据解决方案,助力企业高效获取市场情报与AI训练数据。
Scale AI 是全球领先的AI数据与模型训练平台,为企业和机构提供高质量数据标注、模型评估与全流程解决方案,加速人工智能应用的开发与部署。

Oxylabs是一家高端企业级代理服务与数据采集平台,提供大规模、智能化的公共网络数据采集解决方案,帮助用户高效获取全球网页数据。
Thordata Proxy 是一款专注于网络数据抓取的企业级代理服务,提供住宅、移动、静态ISP和数据中心等多种代理类型。它通过庞大的全球IP网络帮助用户规避反爬虫限制,实现匿名、稳定的数据采集,适用于市场研究、广告验证、SEO优化等多种业务场景。
雷比特是一款AI驱动的无代码网页抓取工具,通过简单点击即可从各类网站自动提取结构化数据,帮助销售、运营及研究人员高效完成市场监控与信息收集。

SuperAnnotate AI 是一个端到端的AI数据工作平台,专注于为机器学习模型提供高质量训练与评测数据的生产、管理与治理。平台通过多模态数据标注、智能化辅助工具和全流程质量控制,帮助AI团队加速构建数据集、评估模型性能并优化智能体工作流。
Qdrant 是一款开源的高性能向量数据库与相似性搜索引擎,专为AI应用设计,支持高效存储和检索高维向量数据,适用于构建RAG、推荐系统等智能解决方案。

Airbyte是一款开源数据集成平台,通过600多个预建连接器帮助企业构建ELT管道,实现数据在各类应用、数据库与数据仓库间的高效同步与激活。

CVAT是一款领先的开源图像与视频数据标注平台,专为机器学习与AI工作流设计,帮助全球团队高效完成数据标注任务。
InfluxDB 是一款业界领先的时序数据库,专注于海量时序数据的高性能写入、存储与实时分析,助力工业物联网、运维监控等领域实现数据驱动的决策优化。

Dataiku AI 是一款企业级一体化数据科学与人工智能平台,旨在简化从数据准备到 AI 应用部署的全生命周期管理。它通过统一的环境支持数据清洗、机器学习建模、生成式AI开发与模型运维,帮助企业高效处理复杂数据,并促进团队协作与数据驱动的业务创新。

OpenTrain AI 是一个专注于AI训练与数据标注的全球性人才市场平台,连接企业需求方与专业服务提供方。平台提供一体化的人才招聘、项目管理与支付解决方案,帮助企业高效组建远程团队,同时为自由职业者与服务商提供集中的项目机会。
共 79 项