Milvus é um banco de dados vetorial de código aberto e alto desempenho, projetado para aplicações de IA. Sua função central é armazenar, gerenciar e recuperar de forma eficiente vetores de alta dimensão, tornando possível a construção de sistemas de recomendação, busca semântica, busca de imagens e outras aplicações que exigem correspondência por similaridade.
O Milvus oferece quatro opções de implantação: Milvus Lite (biblioteca Python leve usada para desenvolvimento local), Milvus Standalone (servidor único, adequado para produção de pequeno porte), Milvus Distributed (cluster distribuído com Kubernetes, para produção em grande escala) e o serviço totalmente gerenciado Zilliz Cloud.
Milvus oferece alta escalabilidade: sua arquitetura distribuída pode lidar com dados de vetores que vão desde milhões até centenas de bilhões, dependendo do modo de implantação e dos recursos de hardware disponíveis.
Para prototipagem, recomenda-se usar o Milvus Lite. Basta instalar o SDK Python com `pip install pymilvus` e você poderá inserir, buscar e validar rapidamente operações com vetores em um notebook Jupyter local ou em scripts.
O núcleo do Milvus oferece busca por similaridade de vetores. Além disso, suporta busca híbrida, que combina similaridade de vetores com metadados escalares (como rótulos, carimbos de data/hora) para filtragem, para obter resultados mais precisos.
MongoDB é uma plataforma moderna de banco de dados orientada a documentos. Seu serviço principal na nuvem, MongoDB Atlas, oferece uma solução de banco de dados totalmente gerenciada. A plataforma suporta nativamente busca vetorial, projetada para ajudar desenvolvedores a criar aplicações inteligentes impulsionadas por IA generativa e para apoiar empresas na modernização da gestão de dados e na transformação da arquitetura de sistemas.
Zilliz é uma empresa focada em tecnologia de bancos de dados vetoriais, oferecendo o serviço em nuvem totalmente gerenciado Zilliz Cloud, construído com base no projeto de código aberto Milvus. O serviço tem como objetivo ajudar empresas a processar e analisar eficientemente dados não estruturados; por meio da busca por similaridade vetorial, suporta a construção de aplicações de IA, como RAG (Recuperação Aumentada por Geração) e busca semântica, reduzindo a complexidade do desenvolvimento e da operação de aplicações de IA.