Alibaba Cloud présente Qwen 2.5 : La nouvelle révolution des modèles de langage

3 février 2025 | par la rédaction de Guide IT @Laetitia R.
À la une, Actualités, Réseaux et Télécom

Alibaba Cloud présente Qwen 2.5 : La nouvelle révolution des modèles de langage

Qwen, Qwen ? 

Le terme Qwen, ou plutôt la contraction de Tong Yi Qian Wen, qui se traduit par « répondre à mille questions en une seule fois », fait maintenant l’objet de toutes les attentions. Bien plus qu’un jeu de mots, il incarne la puissance d’un modèle de langage développé par Alibaba Cloud qui fait déjà le buzz sur la plateforme communautaire Hugging Face. 

Un développement éclair et de grandes ambitions

Depuis son lancement en octobre 2023, Qwen a déjà connu plusieurs versions, dont Qwen 1.0, 1.5 et maintenant le tout récent Qwen 2.5. Ce dernier, rendu public le 18 septembre, propose une collection de modèles de langage à la pointe de la technologie. Avec différentes tailles allant de 0,5 à 72 milliards de paramètres, Qwen 2.5 s’affirme comme un acteur incontournable dans le domaine des LLM (Language Models).

Une architecture qui impressionne

Les LLM de Qwen 2.5 se distinguent par leur architecture dense et sont dotés de jeux de données impressionnants, intégrant jusqu’à 18 000 milliards de tokens pour assurer des performances optimales. Notons que la version Qwen 2.5 Coder exploite 5 500 milliards de tokens consacrés au code public. Avec une fenêtre de contexte de 128 000 tokens, ces modèles offrent également la possibilité de générer jusqu’à 8 000 tokens. Plus de 29 langues sont prises en charge !

Performances et reconnaissance de la communauté

Des benchmarks confirment que Qwen 2.5-72B se positionne en haut des classements face à des concurrents comme Mistral et Llama. Sa capacité à exceller dans des tâches d’assistance quotidienne en fait un choix privilégié pour les utilisateurs.

Victor Mustar, responsable design produit chez Hugging Face, souligne que Qwen a établi de nouvelles références pour les modèles open-weight, et est souvent la meilleure option disponible. 

La promesse des modèles multimodaux

Qwen ne s’arrête pas là. Son modèle Qwen-VL-Plus, dédié à la vision, rivalise avec les meilleures solutions du marché. Que ce soit pour des tâches multimodales, Qwen prouve sa robustesse, rivalisant avec des puissances comme Claude 3.5 Sonnet ou GPT4-o.

Un suivi pris en charge par de nombreux frameworks

Un des atouts majeurs de Qwen réside dans sa disponibilité. Open weight, il est compatible avec divers frameworks, y compris Ollama, LM Studio, et TensorRT, rendant son utilisation accessible pour tous.

Vers une monétisation efficace

Alibaba Cloud ne compte pas s’arrêter là. Avec sa plateforme Alibaba Cloud Model Studio, il prévoit de commercialiser les variantes propriétaires de Qwen. La version Qwen 2.5 Turbo propose même des capacités allant jusqu’à 1 million de tokens. 

Des perspectives de croissance impressionnantes

En quelques mois, Alibaba Cloud a réussi à attirer plus de 300 000 clients, bien plus que les 90 000 en mai 2024. Un chiffre en constante évolution, surtout si on le compare à d’autres acteurs comme Azure AI.

Conclusion : Une ère nouvelle pour l’intelligence artificielle

Avec Qwen 2.5, Alibaba Cloud marque un tournant décisif dans l’univers des modèles de langage. Avec des performances compétitives et une architecture solide, Qwen se dessine comme un acteur majeur pour l’avenir de l’intelligence artificielle. Qui sait quelles innovations nous réserve l’équipe de Qwen dans les prochains mois ? 

Alibaba Cloud présente Qwen 2.5 : La nouvelle révolution des modèles de langage
Retour en haut