
Databricks AI 是一个面向企业的统一数据与人工智能平台,采用湖仓一体架构,旨在整合数据管理、分析及AI开发工作流。
其核心是湖仓一体架构,它融合了数据湖对多种数据类型的支持能力与数据仓库在性能、可靠性及治理方面的优势。
平台主要包含数据管理与工程(如Delta Lake、Lakeflow)、分析与商业智能(如Databricks SQL、AI/BI)以及人工智能与智能体开发(如AI平台、Databricks IQ)等核心模块。
该平台支持多云部署,兼容AWS、Azure、Google Cloud等主流云服务提供商。
平台通过Unity Catalog等组件提供跨云的统一数据治理方案,实现对数据资产的安全管控、访问控制与审计。
该平台主要服务于数据工程师、数据科学家、机器学习工程师、数据分析师以及需要构建和管理智能应用的企业技术团队。
用户通常需要具备数据处理、SQL或编程(如Python、Scala)的基础知识,平台也提供了SQL界面和可视化工具以降低部分使用门槛。
平台支持流批一体处理,能够进行实时数据摄取与转换,并基于Apache Spark框架提供分布式计算能力。
平台提供了覆盖机器学习全生命周期的工具,包括数据准备、自动化机器学习、实验跟踪、模型部署与监控等功能。

星爆数据湖仓是基于开源Trino构建的企业级数据湖仓平台,提供统一SQL查询与分析能力,帮助企业高效访问与分析分散在多源异构存储中的数据。