Milvus est une base de données vectorielle open source et haute performance, conçue pour les applications IA. Ses fonctionnalités clés permettent de stocker, gérer et interroger efficacement des vecteurs haute dimension, adaptées à des cas d'usage tels que les systèmes de recommandation, la recherche sémantique et la recherche d’images.
Milvus propose quatre options de déploiement : Milvus Lite (bibliothèque Python légère pour le développement local), Milvus Standalone (serveur unique, adapté à une petite production), Milvus Distributed (cluster distribué basé sur Kubernetes pour une production à grande échelle) et Milvus Cloud entièrement géré par Zilliz.
Milvus est hautement scalable: son architecture distribuée peut gérer des données vectorielles allant de quelques millions à des centaines de milliards, en fonction du mode de déploiement et des ressources matérielles.
Pour le prototypage, privilégiez Milvus Lite. Il suffit d’installer le SDK Python via pip install pymilvus et de tester rapidement l’insertion et la recherche de vecteurs dans un Jupyter Notebook local ou un script.
Milvus prend en charge la recherche de similarité vectorielle. Il prend également en charge la recherche hybride, qui combine la similarité vectorielle et des métadonnées scalaire (par exemple étiquettes, horodatages) pour affiner les résultats.
MongoDB est une plateforme de base de données moderne orientée documents, dont le service cloud principal MongoDB Atlas offre des solutions de base de données entièrement gérées. Cette plateforme prend en charge nativement la recherche vectorielle, et vise à aider les développeurs à construire des applications intelligentes propulsées par l'IA générative, tout en soutenant les entreprises dans la modernisation de la gestion des données et la transformation de l'architecture de leurs systèmes.
Zilliz est une société spécialisée dans les bases de données vectorielles et propose Zilliz Cloud, un service cloud entièrement géré basé sur le projet open source Milvus. Ce service aide les entreprises à traiter et analyser efficacement des données non structurées et, via la recherche par similarité vectorielle, à prendre en charge des applications d'IA telles que la génération augmentée par récupération (RAG) et la recherche sémantique, tout en réduisant la complexité du développement et de l'exploitation des applications IA.