Ce petit comparatif a pour objectif de faire un très rapide état des lieux des principaux outils d’IA génératives à…
⭐ Évaluation collective ❔
🤖 Fonctionnalités | |
📱 Utilisabilité | |
🛡️Sécurité | |
💰 Prix | |
🎓 Alignement pédagogique | |
🐣 Maturité | |
Moyenne
|
|
![]() |
🗨️ Vos retours libres
📢 On en parle sur l’ObsiaFormation
📰 Actualités récentes depuis la source
🗓️ 2 octobre 2025 ⌚ 16h00
Get the scoop on how to use Nano Banana, the Gemini app’s viral new image generation and editing model from Google DeepMind.
🗓️ 1 octobre 2025 ⌚ 17h18
Learn more about the new Google Home Premium subscription plan, including pricing, what’s included and more.
🗓️ 1 octobre 2025 ⌚ 13h00
Learn more about Gemini for Home, new Home hardware and the totally redesigned Google Home app.
🗓️ 1 octobre 2025 ⌚ 13h00
Learn more about the newly redesigned Google Home app, built for Gemini.
🗓️ 1 octobre 2025 ⌚ 13h00
Learn more about Gemini for Home, powering new, smarter AI features for Google Nest and other smart home products.
🗓️ 1 octobre 2025 ⌚ 12h00
The Global AI Film Award is now accepting applications from creators using Google AI tools, with the winner awarded a prize of USD 1 million by the 1 Billion Followers S…
🗓️ 24 septembre 2025 ⌚ 16h00
Google AI Pro and Ultra subscribers now get higher limits to Gemini CLI and Gemini Code Assist IDE extensions.
🗓️ 23 septembre 2025 ⌚ 19h00
Google AI Plus — our newest AI plan — is now available in more than 40 more countries.
🗓️ 23 septembre 2025 ⌚ 16h00
Earlier this year, we launched the second iteration of our GenAI Intensive course, which attracted over 280,000 learners. Now, we’re taking things to the next level with…
🗓️ 23 septembre 2025 ⌚ 14h23
Guided Learning with Gemini is a new feature from Google that offers people a personalized, interactive and effective way to learn.
🗓️ 19 septembre 2025 ⌚ 16h00
Gemini Drops is our new monthly update on how to get the most out of the Gemini app.
🗓️ 19 septembre 2025 ⌚ 16h00
Here’s how I’ve been using Gemini’s photo-to-video tool as a multimedia storyteller, plus some tips for making your own videos.
🗓️ 18 septembre 2025 ⌚ 16h00
You can now share your custom Gems in the Gemini app.
🗓️ 17 septembre 2025 ⌚ 17h30
Gemini achieves gold status at the ICPC, marking a new leap in AI’s abstract problem-solving.
🗓️ 17 septembre 2025 ⌚ 14h30
Google’s deep investments in American technical infrastructure, R&D and the workforce will help the U.S. continue to lead the world in AI.
ℹ️ Plus d’infos via Wikipédia
Gemini (IA)
Generalized Multimodal Intelligence Network
Créateur | |
---|---|
Développé par | Google DeepMind |
Première version | Bard Expérimental () |
Dernière version | Gemini 2.5 Flash/Pro (25 mars 2025 - 17 avril 2025) |
État du projet | Actif |
Système d'exploitation |
Windows, macOS, Linux (Web) Android (Application) iOS (Application) |
Environnement | Navigateur web, Android et iOS |
Langues | 46 langues |
Type |
Dialogueur Prototype Grand modèle de langage IA conversationnelle (d) Application web Chatbot d'intelligence artificielle générative (d) |
Site web | https://gemini.google.com |
Gemini, anciennement Bard, est un assistant conversationnel développé par Google. Pour générer du texte, il se base sur une famille de grands modèles de langage également appelée Gemini, introduite au public le [1]. Gemini est l'acronyme de Generalized Multimodal Intelligence Network. Les modèles se déclinent en trois tailles: nano, pro et ultra[2].
Gemini peut comprendre et interagir avec l'audio et la vidéo, et générer du texte (poésie, scripts, pièces musicales, courriels, lettres, etc.), du code, des traductions (entre plus de 100 langues). Il peut produire plusieurs types de contenu créatif (images, dessins, sons, musique, vidéos…), aider des chercheurs en analysant des données ou en générant des hypothèses. Gemini peut répondre aux questions de manière informative ou en produisant des cours personnalisés, des jeux, des tutoriels, etc., avec les limites des IA (erreurs, biais, « hallucinations »…).
Il est disponible via une application moblile et est directement intégré sur plusieurs appareils dont les écrans (smartphones, tablettes, montres pixel watch, etc...) Google pixel ainsi que les produits de la gamme Nest de Google.[3]
Description
Gemini désigne une famille de transformeurs génératifs préentraînés permettant notamment de générer du texte. Le terme désigne également l'assistant conversationnel qui utilise ces modèles.
Multimodalité
Gemini a été annoncé en 2023 comme devant surpasser les modèles existants comme GPT-4, en pouvant traiter simultanément et de manière polyvalente divers types différents de données (texte, images, sons et vidéos). Il peut ainsi répondre à une large variété de demandes, comme la génération de textes écrits, d'images, de sons et de code ; l'analyse de flux vidéo, la création de modèles 3D complexes, l'analyse et l'interprétation de graphiques complexes, de cartes, etc.[4],[5]. L'architecture de Gemini comporte un encodeur et un décodeur. L'encodeur de Gemini convertit certains types de données en vecteurs, que le décodeur peut comprendre et utiliser pour la génération[6].
Variantes
Selon Google, Gemini est particulièrement douée pour le codage informatique, grâce à son nouveau système de génération de code AlphaCode 2 basé sur Gemini Pro, qui lui permettrait de surpasser 85 % des concurrents[7]. Google DeepMind a également conçu Gemini Robotics, un modèle vision-langage-action permettant de contrôler des robots[8].
Histoire
Contexte
Au début des années 2020, dans le domaine de l'IA générative, Google a été distancé par ChatGPT. Tout en poursuivant ses projets d'IA (ex. : Teachable Machine, Quick Draw, AutoDraw, Art Palette, ou Semantris et BARD) Google a mis en avant son nouveau projet majeur : Gemini AI, qui est une collaboration entre Google Brain (connue pour avoir créé l'outil Google Traduction, ainsi que TensorFlow, les modèles Transformer (le T de GPT) et le modèle LaMDA, qui permet à Bard de fonctionner) et DeepMind (filiale de Google, notamment connue pour avoir créé AlphaGo, le système d'IA qui a battu Lee Sedol au jeu de go en 2016, et AlphaFold capable de prédire la structure des protéines). Ces deux groupes ont fusionné en 2023 pour accélérer la mise au point de Gemini après le succès de ChatGPT.
En novembre 2022, OpenAI a lancé ChatGPT, un assistant conversationnel (chatbot) initialement basé sur GPT-3.5. ChatGPT a attiré l'attention du monde entier après sa sortie, devenant une sensation virale sur Internet. Alarmé par la menace potentielle de ChatGPT pour la recherche Google, le PDG de Google, Sundar Pichai, a émis une alerte « code rouge » à l'échelle de l'entreprise, réaffectant plusieurs équipes pour venir renforcer les efforts de l'entreprise en matière d'IA[9]. Dans un geste rare et sans précédent, les cofondateurs de Google Larry Page et Sergey Brin, qui avaient quitté leurs fonctions de co-PDG de la société mère de Google Alphabet en 2019, ont été convoqués à des réunions d'urgence avec des dirigeants de l'entreprise pour discuter de la réponse de Google à ChatGPT.
Interrogés par les employés lors d'une réunion générale pour savoir si le grand modèle de langage LaMDA était une occasion manquée pour Google de concurrencer ChatGPT, Sundar Pichai et Jeff Dean (le dirigeant de Google AI) ont déclaré que Google avait des capacités similaires, mais aller trop vite dans ce domaine représenterait un « risque réputationnel » majeur en raison du fait que Google est nettement plus grand qu'OpenAI[10],[11]. En janvier 2023, le PDG de DeepMind, Demis Hassabis, a annoncé les plans d'un rival de ChatGPT, et les employés de Google ont été chargés d'accélérer les progrès sur un concurrent de ChatGPT, en testant intensivement « Apprentice Bard » et d'autres chatbots[12],[13]. Sundar Pichai a assuré lors de l'appel aux investisseurs pendant la présentation des résultats trimestriels de Google en février que la société avait l'intention d'étendre la disponibilité et les applications de LaMDA[14].
Peu de données étaient disponibles sur Gemini avant décembre 2023, mais selon Google, ce nouveau système d'IA pourrait remplacer et améliorer PaLM 2 de Google, dont en intégrant des techniques plus efficaces d'apprentissage par renforcement, permettant une amélioration continue des capacités des systèmes d'IA à répondre à des questions complexes.
Dès le début d'année 2023, Google avait annoncé une riposte claire à OpenAI au travers du projet Sparrow un chatbot qui avait l'avantage, contrairement à ChatGPT, de citer ses sources[15], gagnant ainsi en crédibilité.
Gemini a été entrainé sur les Tensor Processing Units (TPU) de Google[réf. nécessaire]. Plus rapide et moins couteux dans ses exécutions que les précédents modèles de Google (comme PaLM), Gemini intègre en particulier des « mécanismes d'attention » (MA) perfectionnés, permettant aux réseaux de neurones artificiels de « concentrer » leurs calculs sur les parties les plus pertinentes des « données d'entrée », pour générer ensuite des « sorties » plus cohérentes, et répondant plus fidèlement aux « invites » des utilisateurs.
La capacité annoncée de Gemini à générer et combiner des objets sonores, visuels (graphiques et cartographie y compris) et du texte devrait également lui permettre de générer plus d'un type de données à la fois. Gemini pourra probablement, par exemple, extraire des caractéristiques d'une vidéo, d'un podcast ou d'un texte complexe pour en générer une analyse ou un résumé en tenant compte plus finement des demandes de l'utilisateur, mais aussi — et éventuellement dans le même temps — créer du contenu nouveau et le mettre en page, l'illustrer d'images, de graphiques et/ou de cartographies, en créer une version vidéo ou podcast, multilingue, etc.
Bard et Gemini Pro
Le 2023, Google a annoncé Bard, un chatbot utilisant LaMDA pour générer du texte[16]. Bard a d'abord été déployé auprès d'un groupe restreint de « testeurs de confiance[17] », avant une large diffusion prévue à la fin du mois[18],[19]. Il a été développé sous le nom de code « Atlas »[20]. Dans la foulée de l'annonce de Google, le rival de Google, Microsoft, a révélé son partenariat avec OpenAI pour intégrer ChatGPT dans son moteur de recherche Bing, après avoir précédemment investi 10 milliards $ dans OpenAI[21],[22].
Bard a été présenté dans une vidéo promotionnelle sur Twitter le . Lors de cette vidéo, Bard s'est trompé en répondant à une question sur le télescope James Webb, provoquant l'inquiétude quant à la fiabilité du chatbot et dans la foulée la chute de l'action Google (Alphabet) de plus de 7 %[23]. Google Bard a été interrogé sur les nouvelles découvertes du télescope spatial James Webb et a répondu avec trois puces, y compris une déclaration selon laquelle le télescope « a pris les toutes premières images d'une planète en dehors de notre propre système solaire ». Cependant, cette affirmation était incorrecte[24].
Mi-2023, Gemini est encore en phase d'entraînement, et testé pour sa sécurité. Comme c'était déjà le cas pour PaLM 2, Google propose plusieurs itérations du modèle, de tailles différentes, qui seront exploitées en fonction des avancées de l'IA, des besoins émis en interne par les services ou filiales de Google, puis par les utilisateurs et clients, et en fonction de contraintes spécifiques[25]. Les versions de Gemini, en différentes tailles et capacités[26], pourraient être disponibles via le « Google Cloud Vertex AI » (anciennement « Google AI Platform »), une « plateforme d'apprentissage automatique, qui regroupe tous les services cloud de Google, permet de faciliter le déploiement et la maintenance des modèles d'IA »[25]. Une version préliminaire de Gemini a été fournie à un petit groupe externe de développeurs et d'entreprises afin d'effectuer des tests[27].
Depuis le [28], Bard utilise un modèle d'intelligence artificielle appelé Gemini Pro lorsqu'il communique en anglais. Ce modèle peut traiter et fusionner différents types d'informations tels que le texte, les images, l'audio et le code. Gemini Pro est actuellement disponible uniquement pour l'anglais sur Bard, mais son expansion à d'autres langues et régions, notamment en Europe, est prévue prochainement. Gemini Pro se concentre actuellement sur le traitement de textes, mais devrait bientôt être capable de travailler avec d'autres types de contenus[29]. De plus une suite qui compte trois modèles est annoncée :
- Gemini Nano : version allégée de Gemini est prévue pour tourner nativement et hors-ligne sur des smartphones Android en commençant par le Google Pixel 8 Pro et uniquement à partir de texte ;
- Gemini Pro : le modèle intermédiaire, remplacera LaMDA dans Bard pour les pays anglophones ;
- Gemini Ultra (qui ne sera finalement lancé qu'en ) : le modèle le plus avancé, et le plus performant.
Si Google DeepMind ne précise pas les tailles des modèles, l'accent est mis sur les performances du plus puissant (Gemini Ultra) par rapport à GPT-4[30] d'OpenAI, qui est alors de loin le modèle le plus puissant du marché.
Il est annoncé aussi que Gemini Pro sera disponible pour les développeurs via le Google Generative AI Studio ou Vertex AI sur Google Cloud le et que Gemini Ultra sera proposée aux Data Centers et aux entreprises, d'abord en version beta contrôlée et dans un contexte expérimental sécurisée.
Gemini
Le , Google a annoncé renommer Bard en Gemini afin de refléter l'utilisation de la famille de modèles Gemini[31].
Le , Google lance une nouvelle version plus avancée nommée Gemini 1.5 Pro. C'est aussi le premier modèle capable de prendre jusqu'à 1 million de tokens en entrée, même si la limite est fixée à 128 000 tokens dans un premier temps.
Le même mois, Google suspend son outil de création d'images Gemini, « pensé pour promouvoir la diversité », après qu'il a généré des résultats embarrassants, refusant dans certains cas de représenter des personnes blanches ou générant des images historiquement fausses, telles que « des soldats nazis de couleur » ou le « pape imaginé en femme ». Des polémiques en série, dont l'une liée à l'affirmation de Gemini selon laquelle il serait « difficile de dire » qui de Hitler ou d’Elon Musk avait eu l’impact le plus négatif sur la société, poussent Sundar Pichai, le PDG de Google, à recadrer ses équipes. Il leur rappelle le risque de briser la confiance envers les produits Google. Il déplore les réponses embarrassantes de Gemini qui « ont fait preuve de partialité »[32],[33]
En mai, une version allégée est lancée, nommée Gemini 1.5 Flash et capable d'accepter 1 million de tokens. Gemini 1.5 Pro bénéficie d'une amélioration à ce niveau, permettant d'utiliser jusqu'à 2 millions de tokens en entrée.
En , Google introduit les « Gems », qui permettent de créer des versions personnalisées de Gemini que les utilisateurs définissent en fonction de leurs besoins[34]. C'est une réponse au GPT Store de OpenAI ou au Copilot Studio de Microsoft, et l'un des nombreux efforts que déploie le groupe pour tenter d'attirer du public vers Gemini, alors que l'adoption des professionnels et développeurs restent très faible par rapport aux rivaux[35].
En mars 2025 Google annonce la sortie du modèle Gemini 2.5 (disponible en 3 versions : Pro, Flash et Flash-Lite), dont la déclinaison la plus puissante se retrouve directement en haut du classement de LMArena. Bénéficiant d'une fenêtre d'un million de token en entrée, le modèle domine encore actuellement les benchmarks scientifiques et mathématiques AIME et GPQA [36].
Références
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « LaMDA#Bard » (voir la liste des auteurs).
- ↑ « Google renomme son assistant Bard en Gemini », sur Le Monde Informatique, (consulté le )
- ↑ Hugo Bernard, « Gemini : tout savoir sur l'IA de Google qui veut remplacer ChatGPT », sur Frandroid, (consulté le )
- ↑ Ulrich ROZIER, « Comment Gemini va remplacer Google Assistant sur les enceintes Home et Nest », Frandroid, 21/08/2025 • 15:37 (lire en ligne)
- ↑ Yohann Poiron, « Qu’est-ce que Google Gemini : la nouvelle génération d’IA ? », sur blog-nouvelles-technologies.fr, .
- ↑ Eray Eliaçık, « Qu’est-ce que l’IA Gemini de Google qui quintuple GPT-4 ? », sur dataconomy.com, .
- ↑ (en) Sahil Kapoor, « What Is Google's AI Project Gemini and What Is It Working On? », sur makeuseof.com, (consulté le ).
- ↑ « AlphaCode 2, la dernière IA de programmation compétitive de DeepMind », sur ActuIA, (consulté le )
- ↑ « Google sort un modèle Gemini capable de tourner en local sur des robots », sur L'Usine Digitale,
- ↑ « "Code rouge" chez Google : la popularité de ChatGPT inquiète la direction », sur www.lesnumeriques.com (consulté le )
- ↑ (en) Jennifer Elias, « Google execs warn company's reputation could suffer if it moves too fast on AI-chat technology » [archive du ], CNBC, (consulté le )
- ↑ Vincent, « Google won't launch ChatGPT rival because of 'reputational risk' » [archive du ], The Verge, (consulté le )
- ↑ (en) Jennifer Elias, « Google is asking employees to test potential ChatGPT competitors, including a chatbot called 'Apprentice Bard' » [archive du ], CNBC, (consulté le )
- ↑ Zacharie Tazrout, « Google veut rivaliser avec ChatGPT grâce à Apprentice Bard », sur Siècle Digital, (consulté le )
- ↑ (en) Aisha Mailk, « Google tries to reassure investors on AI progress as ChatGPT breathes down its neck » [archive du ], TechCrunch, (consulté le )
- ↑ Alexis Lood, « Choqué par ChatGPT, l’empire Google lance une contre-attaque », sur Android MT, (consulté le )
- ↑ Maurine Briantais, « Bard, l'IA révolutionnaire de Google : ça va barder pour ChatGPT ! », sur www.commentcamarche.net, (consulté le )
- ↑ (en) Sundar Pichai, « An important next step on our AI journey », sur Google, (consulté le )
- ↑ « IA : Google officialise Bard pour répondre à ChatGPT », sur Génération NT (consulté le )
- ↑ « Google officialise son agent conversationnel Bard, le rival de ChatGPT », sur MSN (consulté le )
- ↑ (en) Michael Liedtke, « Google hopes 'Bard' will outsmart ChatGPT, Microsoft in AI » [archive du ], Associated Press, (consulté le )
- ↑ Kevin Roose, « Intelligence artificielle: Comment ChatGPT a provoqué une « course à l’armement » », La Presse, (lire en ligne, consulté le )
- ↑ Pierre FONTAINE, « Microsoft va intégrer GPT-4 à Bing, et OpenAI prépare une appli mobile de ChatGPT », sur 01net.com, (consulté le )
- ↑ « Le chatbot de Google Bard commet une bourde à plusieurs milliards de $ », sur Astuto, (consulté le )
- ↑ (en) Tom, « Google Bard AI gets fact-checked: The story behind the $100 billion mistake »
, sur skymagzines, (consulté le )
- Florian Bayard, « Gemini : le « ChatGPT 4 » de Google arrive à grands pas », sur 01net.com, (consulté le ).
- ↑ (en) Adam Speight, « What is Google Gemini? The next-generation AI model explained », sur Trusted Reviews, (consulté le ).
- ↑ (en) « Google Nears Release of Gemini AI to Challenge OpenAI », sur The Information (consulté le )
- ↑ Marc Zaffagni, « Bard, la réponse de Google à ChatGPT »
, sur www.science-et-vie.com, (consulté le )
- ↑ (en) Sissie Hsiao, « Bard gets its biggest upgrade yet with Gemini »
, sur Google, (consulté le )
- ↑ Victor Lafosse-Barthès, « Google sort Gemini (par surprise) et annonce surpasser GPT-4 d'OpenAI », sur Ariel World, (consulté le )
- ↑ (en-US) « Bard becomes Gemini: Try Ultra 1.0 and a new mobile app today », sur Google, (consulté le )
- ↑ Carla Plomb, «C’est totalement inacceptable» : après les dérapages de son IA Gemini, le PDG de Google recadre ses équipes, lefigaro.fr, 28 février 2024
- ↑ IA : le patron de Google reconnaît les erreurs « totalement inacceptables » de Gemini, latribune.fr, 28 février 2024
- ↑ « Google introduit les Gems pour personnaliser l’IA Gemini et le générateur Imagen 3 », Cnet France, (lire en ligne).
- ↑ (en) « Why AI Developers Are Skipping Google's Gemini », The Information, (lire en ligne)
- ↑ (en-US) « Gemini 2.5: Our most intelligent AI model », sur Google, (consulté le )
Voir aussi
Articles connexes
- Agent conversationnel
- Apprentissage par renforcement
- Apprentissage supervisé
- Grand modèle de langage
- Intelligence artificielle digne de confiance
Liens externes
- Site officiel
- Qu'est-ce que l'IA Gemini qui quintuple GPT4 ? sur Dataconomy (12 septembre 2023)
- L'IA Gemini de Google sur Digitiz (15 septembre 2023)
- Google Gemini, une IA plus puissante que GPT-4 sur ZDNet (20 septembre 2023)
- Google Gemini, l'intelligence artificielle qui promet de révolutionner l'IA sur 01net (25 septembre 2023)
Dernière mise à jour il y a 2 jours