Sommaire
Google vient de publier son modèle d’IA le plus puissant à ce jour, Gemini, qui promet des capacités multimodales avancées. Découvrez tous les détails de cette annonce majeure qui remet en question le leadership d’autres modèles d’IA générative.
Qu’est-ce que Google Gemini ?
Gemini est le dernier modèle d’intelligence artificielle de Google, conçu pour comprendre du texte, mais aussi des images, des vidéos et du son. Ce modèle révolutionnaire est décrit comme étant capable d’accomplir des tâches complexes dans des domaines tels que les mathématiques, la physique et la programmation. Il offre également la possibilité de générer un code de haute qualité dans différents langages de programmation.
Qui a créé Gemini ?
Gemini a été développé par Google et Alphabet, la société mère de Google. Google DeepMind a également contribué de manière significative au développement de ce modèle d’IA avancé: « Gemini est le résultat d’une collaboration à grande échelle entre les équipes de Google, y compris nos collègues de Google Research », selon Dennis Hassabis, PDG et cofondateur de Google DeepMind. Google décrit Gemini comme un modèle flexible, capable de fonctionner aussi bien sur les centres de données de Google que sur les appareils mobiles.
Quelles sont les différentes tailles de Gemini ?
Gemini est disponible en trois tailles différentes pour répondre aux besoins spécifiques des utilisateurs :
– Gemini Nano : Cette taille de modèle est spécialement conçue pour fonctionner sur les smartphones, tels que le Google Pixel 8. Il permet d’effectuer des tâches sur l’appareil lui-même, sans nécessiter de connexion à des serveurs externes.
– Gemini Pro : Ce modèle, exécuté sur les centres de données de Google, alimente le chatbot IA de l’entreprise, Bard. Il offre des temps de réponse rapides et est capable de comprendre des requêtes complexes.
– Gemini Ultra : Bien qu’il ne soit pas encore disponible pour une utilisation généralisée, Gemini Ultra est décrit comme le modèle le plus performant de Google. Il dépasse les résultats actuels de l’état de l’art sur les repères académiques dans la recherche et le développement des modèles de langage (LLM). Gemini Ultra est conçu pour des tâches hautement complexes et devrait être commercialisé à l’issue de sa phase de test.
Comment accéder à Gemini ?
Gemini est déjà disponible sur certains produits Google tels que le Google Pixel 8 et le chatbot Bard. Google prévoit également d’intégrer progressivement Gemini à d’autres services, tels que Search, Ads et Chrome.
Les développeurs et les entreprises pourront accéder à Gemini Pro via l’API Gemini dans AI Studio de Google et Google Cloud Vertex AI à partir du 13 décembre. Les développeurs Android auront également accès à Gemini Nano via AICore, disponible en preview.
Gemini est-il disponible en France ?
Pour le moment, Gemini Pro est disponible gratuitement dans 170 pays, mais pas encore en France, et uniquement en anglais. Cependant, Google prévoit d’étendre la disponibilité de Gemini à d’autres langues et à d’autres régions du monde dans un avenir proche. Pour le tester, il suffit d’utiliser le chatbot de Google.
La différence avec d’autres modèles d’IA
Comparé à d’autres modèles populaires tels que GPT-4, Gemini se distingue par son caractère multimodal natif. Alors que certains modèles dépendent de plugins et d’intégrations pour être réellement multimodaux, Gemini excelle dans l’exécution de tâches multimodales complexes.
De plus, Google Gemini semble être davantage axé sur les produits et les services de l’entreprise: il est intégré (ou est prévu de l’être) à l’écosystème Google, alimentant des appareils tels que Bard et Pixel 8. En revanche, d’autres modèles tels que GPT-4 et Llama de Meta sont davantage axés sur les services et sont disponibles pour divers développeurs tiers.
Gemini marque une nouvelle étape dans le développement de l’intelligence artificielle et ouvre la voie à de nombreuses applications et possibilités intéressantes. Soyez à l’écoute pour découvrir les futures innovations de Google dans ce domaine.