Gemini : l’IA surpuissante de Google comprend l’écrit, l’audio et même les vidéos

Le domaine de l’intelligence artificielle est en plein essor. La plupart des géants d’internet sont en lice pour remporter la course à l’IA la plus performante. Google pourrait bien être victorieux avec sa nouvelle IA : Gemini.

Gemini
IA Gemini ©Google

Bien que certains craignent que l’intelligence artificielle soit dangereuse pour l’humanité, c’est une véritable frénésie de l’IA qui secoue le monde de la tech en ce moment. L’intégralité des GAFAM ont aujourd’hui un nombre incalculable de projets liés à l’intelligence artificielle.

Les projets novateurs concernant l’intelligence artificielle s’enchaînent  donc les uns après les autres. Parmi eux, on peut citer Open AI et ses chatbots personnalisés, ainsi que la démocratisation à outrance de l’IA par Microsoft. Dernièrement, la firme de Redmond intègre Copilot absolument partout et souhaiterait même commercialiser des ordinateurs dopés à l’IA.

Google n’est pas en reste et son IA, Bard, est elle aussi intégrée dans la plupart de ses projets, comme l’expérience Instrument Playground qui permet de jouer de la musique avec seulement quelques mots. Il semblerait que cet engouement pour l’IA ne soit loin de se terminer, puisque le géant de Mountain View vient de dévoiler Gemini, son IA générative la plus puissante à ce jour.

L’IA Gemini, trop puissante pour la concurrence ?

Selon Google, c’est donc l’IA la plus performante que l’entreprise ait créée, ainsi que la plus utile. De plus, Gemini serait de nature multimodale et pourrait accepter du texte, du code, de l’audio, des images et des vidéos comme consigne de travail.

Google ajoute que la nature de l’IA lui permet de surpasser ses concurrents actuels comme ChatGPT 4, par exemple. D’après l’entreprise, Gemini serait sortie vainqueur de sept benchmarks sur huit centrés autour de consignes textuelles. En ce qui concerne les tests multimodaux, elle aurait remporté l’intégralité des dix tests réalisés par la firme.

La nouvelle intelligence artificielle devrait servir dans de nombreux domaines et serait disponible en trois versions différentes : Ultra, Pro et Nano. En ce qui concerne Gemini Ultra, celle-ci pourrait être extrêmement énergivore et serait réservée aux domaines pouvant se permettre une telle consommation d’énergie, comme les nombreux data centers du globe.

Nano, quant à elle, serait spécialement conçue pour être utilisée sur un smartphone, permettant aux modèles de Google comme les Pixel 8 d’être les meilleurs “AI Phones” du marché. Une nouvelle qui pourrait potentiellement faire de l’ombre à Samsung et à son Galaxy S24.

Image 1 : Gemini : l'IA surpuissante de Google comprend l'écrit, l'audio et même les vidéos
IA Gemini ©Google

Gemini est étroitement surveillée pour éviter les problèmes potentiels

Évidemment, Google est conscient des risques de dérapage de l’intelligence artificielle et ne veut rien laisser au hasard avec Gemini. La firme serait en train de faire des tests rigoureux afin d’identifier et de prévenir les potentielles utilisations malveillantes de son IA surpuissante.

Pour l’instant, Gemini n’est disponible qu’en anglais et est intégré dans les fonctionnalités Smart Reply de Gboard et Summarize de Recorder des Pixel 8 Pro. Évidemment, le chatbot de l’entreprise n’a pas été laissé sur la touche, puisque Gemini, selon Google, représente la plus grande amélioration de Bard depuis son lancement.

Malheureusement, ce sont les seuls domaines où l’intelligence multimodale est présente pour le moment. En revanche, Google a bien précisé que Gemini serait disponible petit à petit dans la plupart des services de l’entreprise, comme Chrome, Ads ou Duet AI.

Quoi qu’il en soit, le projet Gemini de Google semble particulièrement impressionnant. Néanmoins, on espère qu’une telle “puissance” ne sera pas responsable de dérapages de l’IA à la hauteur de ses performances.