Cerebras est une société spécialisée dans le matériel de calcul IA haute performance, dont le produit phare est le moteur wafer (WSE). Il résout principalement les goulets d'étranglement de mémoire et les inefficacités de calcul rencontrés par les GPU traditionnels lors de l’entraînement et de l’inférence de modèles d’IA à grande échelle.
La puce WSE est de grande taille et intègre de nombreuses cœurs de calcul et une mémoire à haut débit sur une seule puce, ce qui réduit considérablement la latence de communication des données, permettant des gains de vitesse et d’efficacité énergétique de plusieurs ordres de grandeur pour l’entraînement et l’inférence de gros modèles.
Cerebras propose une couche d’accès API Inference gratuite, incluant l’accès à tous les modèles et le support communautaire. Les niveaux payants Developer et Enterprise offrent des plafonds supérieurs, un traitement prioritaire, des modèles personnalisés et un support dédié.
Convient aux entreprises technologiques, aux instituts de recherche, et aux grandes entreprises figurant parmi les 1000 premières au niveau mondial, ainsi qu’aux organisations nationales ou régionales cherchant à déployer des solutions d’IA souveraines hautes performances et à coûts maîtrisés.
La plateforme logicielle de Cerebras est compatible avec TensorFlow et PyTorch, conçue pour simplifier la programmation et permettre aux utilisateurs de ne pas gérer des systèmes distribués complexes, réduisant ainsi la barrière technique du calcul IA à grande échelle.
Feux d'artifice IA est une plateforme d'inférence générative de niveau entreprise qui fournit un moteur d'inférence rapide et des services de fine-tuning personnalisés, aidant développeurs et entreprises à construire, déployer et optimiser rapidement des applications IA de haute qualité.
MindSpore est le cadre de calcul IA open source de Huawei couvrant l’ensemble des scénarios, prenant en charge le développement, l’entraînement et le déploiement de modèles d’apprentissage profond, du centre de données aux appareils finaux. Grâce à une programmation unifiée qui combine les modes dynamique et statique et à la parallélisation automatique, il vise à offrir une expérience de développement IA efficace et flexible, tout en optimisant en profondeur les performances des processeurs AI Ascend de Huawei.