Sommaire
Alibaba a récemment présenté son dernier modèle d’intelligence artificielle, le Qwen2.5-Max, qui a été entraîné avec plus de 20 billions de tokens. Ce modèle utilise la technologie Mixture-of-Expert (MoE) et se distingue par ses performances impressionnantes dans divers benchmarks. Il est désormais accessible via l’API d’Alibaba Cloud.
Performances exceptionnelles
Dans des comparaisons directes, le Qwen2.5-Max surpasse le DeepSeek V3 récemment lancé dans des tests tels que Arena-Hard, LiveBench et LiveCodeBench. Il montre également des performances compétitives par rapport à des modèles tels que GPT-4 et Claude-3.5-Sonnet.
Accessibilité et utilisation
Le modèle est disponible via Qwen Chat et propose une API compatible avec OpenAI. Les développeurs peuvent commencer à travailler avec le modèle après s’être inscrits sur Alibaba Cloud Model Studio.
Avenir prometteur
Alibaba souligne que la mise à l’échelle de la taille des données et des modèles n’est que le début. Grâce à un apprentissage renforcé, les futures versions de ce modèle devraient offrir encore plus de puissance et de capacités. Cela démontre l’engagement des entreprises chinoises à innover et à rivaliser sur le marché mondial de l’intelligence artificielle.