Intelligence artificielle : Google présente Gemini 1.5, un chatbot conversationnel ultra-puissant

Le secteur de l’intelligence artificielle conversationnelle est en pleine effervescence depuis quelques mois. Porté par le succès fulgurant de ChatGPT, développé par OpenAI, de nombreux géants de la tech comme Google ou Microsoft se sont lancés dans la course aux agents conversationnels. C’est dans ce contexte que le moteur de recherche vient de dévoiler son nouveau modèle, Gemini 1.5. Après un premier jet prometteur avec Gemini 1.0 lancé en décembre 2022, Google frappe fort avec cette itération améliorée à tous les niveaux. Au point que les performances de Gemini 1.5 seraient comparables au récent modèle ultra-puissant Gemini Ultra !

Gemini 1.5, le nouvel agent conversationnel de Google

Avec Gemini 1.5, Google entend bien rattraper son retard sur ChatGPT et les solutions concurrentes. Dévoilé le 16 février 2023, ce modèle conversationnel de nouvelle génération s’appuie sur l’architecture de pointe « Mixture-of-Experts » développée en interne. Par rapport à son prédécesseur Gemini 1.0, les capacités de Gemini 1.5 explosent à tous les niveaux.

Absorption d’informations, compréhension de concepts complexes, génération de réponses pertinentes… Sur tous les critères, le bond en avant semble spectaculaire. Au point que Sundar Pichaï, le PDG de Google, n’hésite pas à comparer les performances du chatbot aux capacités de Gemini Ultra. Ce modèle au sommet de la gamme Gemini avait déjà bluffé les experts du secteur lors de sa présentation en février 2023.

Des capacités décuplées pour Gemini 1.5

Par rapport à la version 1.0, Gemini 1.5 affiche des capacités largement décuplées, à commencer par son absorption d’informations. Alors que son prédécesseur plafonnait à 32 000 « jetons » (unités de mesure du texte ingéré), le nouveau modèle peut en ingérer jusqu’à 1 million ! De quoi analyser des documents autrement plus volumineux et complexes.

Autre évolution majeure : Gemini 1.5 sait désormais traiter des contenus multimodaux, mélangeant texte, audio et vidéo. Lors de tests, le chatbot a, par exemple, pu ingérer une vidéo muette de 44 minutes et répondre ensuite à un flot de questions dessus. Une prouesse qui ouvre la voie à des applications futuristes, avec une IA capable de comprendre des concepts à partir de différents médias.

Des résultats au top sur les benchmarks

Côté performances pures, Gemini 1.5 semble également au niveau. Sur 87 % des critères utilisés en interne par Google pour tester ses modèles d’IA, les résultats obtenus surpassent ceux de la version 1.0. Le chatbot s’est également illustré lors de tests de référence externes comme « Needle In A Haystack » (NIAH) ou « Machine Translation from One Book » (MTOB), démontrant des capacités d’apprentissage et une finesse d’analyse bluffantes.

De quoi rassurer sur la solidité des fondations technologiques de Gemini 1.5. En effet, des performances au top sur les benchmarks sont essentielles pour envisager un déploiement à grande échelle d’un tel modèle d’IA conversationnelle.

Un déploiement progressif soumis à vigilance

Avant une diffusion à grande échelle de Gemini 1.5, Google entend procéder par étape et s’assurer que son usage ne présente aucun risque éthique. Des batteries de tests ont ainsi été menées en interne pour détecter d’éventuels biais ou dérives problématiques.

Pour l’heure, Gemini 1.5 n’est disponible qu’en accès limité pour les développeurs, au sein de l’environnement Google AI Studio. L’idée est de recueillir un maximum de retours du terrain pour parfaire le modèle avant une intégration dans les produits grand public comme le moteur de recherche ou l’assistant virtuel.

Preuve que malgré l’enthousiasme technologique, la prudence reste de mise lorsqu’il s’agit de modèles d’IA aussi avancés.

Des promesses alléchantes, mais un chemin escarpé

Avec Gemini 1.5, Google frappe fort et place la barre très haute pour ses concurrents. Les performances déjà bluffantes de ce nouvel agent conversationnel laissent entrevoir un avenir plein de promesses. Mais le chemin est encore long avant une diffusion massive, et de nombreux défis restent à relever.

Qu’il s’agisse des questions éthiques, de fiabilité, ou même d’acceptation par le grand public, ce nouveau modèle devra encore faire ses preuves.

Lire plus d’articles sur DigiTechnologie :
– Les avnacés prodigieuses de ChatGPT 5, cliquez-ici
– Les raisons d’analyser les backlinks de son site, cliquez-ici
– Découvrir l’épisode 4 de « En Route Pour le Futur », cliquez-ici
– Tout savoir sur le piratage massif des numéros de sécu, cliquez-ici