Ce n’est pas un scoop, Google n’a pas l’intention de se faire distancer par ses rivaux sur le sujet de l’intelligence artificielle (IA), et nous savons tous qu’il en a les moyens. Ce dernier est bien décidé à reprendre la tête de la course à l’IA.
C’est donc dans cet état d’esprit que Google vient de dévoiler Gemini, son nouveau modèle d’IA, prétendu être le plus avancé à ce jour. Contrairement aux modèles précédents axés principalement sur le texte, Gemini est « nativement multimodal », entraîné non seulement sur du texte, mais aussi sur des images, des vidéos et de l’audio. Cette innovation marque une avancée significative, Gemini pouvant désormais traiter une gamme beaucoup plus large d’informations.
Google is back avec Gemini
Le 6 décembre dernier, Google a dévoilé son tout nouveau modèle d’intelligence artificielle multimodal baptisé Gemini. Sundar Pichai, le PDG du groupe, s’est félicité de cette avancée majeure en déclarant : « Aujourd’hui, nous franchissons une nouvelle étape de notre aventure grâce à Gemini, notre modèle le plus performant et polyvalent à ce jour. Il affiche des performances de pointe dans de nombreux domaines de référence. Cette nouvelle ère de modèles représente l’un des plus grands efforts scientifiques et techniques que nous ayons entrepris depuis la création de Google. »
Déploiement et accessibilité de Gemini
Gemini se décline en trois versions : Ultra, la plus avancée ; Nano, plus compacte ; et Pro, de taille intermédiaire.
La version Pro alimente dès aujourd’hui le chatbot Bard de Google, avec une intégration prévue dans d’autres produits Google, notamment la recherche, la publicité et Chrome. La version Ultra, attendue en 2024, promet d’être la plus puissante, mais est toujours en attente de tests approfondis de sécurité et de fiabilité.
Impacts et potentiel de Gemini
Gemini se distingue par sa capacité à traiter des tâches complexes telles que la synthèse de documents, la planification, et la rédaction de code de programmation. Les démonstrations de Google ont mis en évidence la polyvalence de Gemini, capable de répondre à des questions impliquant des informations visuelles et de participer à des recherches scientifiques. Cette avancée représente un grand pas vers une IA plus proche de la compréhension humaine du monde.
IA : Comparaison avec les modèles concurrents
Dans un contexte international où la compétition entre modèles d’IA s’intensifie, Google affirme que Gemini surpasse les modèles concurrents, y compris le GPT-4 d’OpenAI, dans la plupart des benchmarks. Cette performance supérieure est principalement due à ses capacités multimodales, une caractéristique centrale du plan Gemini dès le début. Il serait intéressant d’avoir accès à un benchmark avec Grok de Elon Musk.
Sécurité et responsabilité, les priorités de Google
Face à l’évolution rapide de l’IA, Google souligne l’importance de tests de sécurité rigoureux. Le modèle Gemini a été soumis à des tests utilisant un ensemble de données de modèles toxiques et à des évaluations externes pour découvrir ses points faibles. Ces étapes sont cruciales pour garantir une utilisation sûre et responsable de l’IA, en particulier dans les produits destinés aux entreprises.
Vers une nouvelle ère chez Google
L’ère Gemini marque le début d’une nouvelle phase pour Google dans le domaine de l’IA. Avec des plans d’intégration dans une multitude de produits et une amélioration continue du modèle, Gemini pourrait non seulement aider Google à rattraper OpenAI dans la course à l’IA générative, mais aussi inaugurer une ère où l’IA transforme profondément notre interaction avec la technologie.
L’avènement de l’IA plus puissant que le mobile ou qu’internet ?
Dans une note de blog, le PDG de Google et d’Alphabet, Sundar Pichai, a récemment exprimé son enthousiasme pour les progrès de l’intelligence artificielle (IA) et son impact sur la société. Selon lui, chaque évolution technologique représente une opportunité de faire progresser la découverte scientifique, d’accélérer le progrès humain et d’améliorer la vie des gens. Il considère que la transition actuelle vers l’IA sera la plus profonde de notre époque, surpassant même les transitions vers la téléphonie mobile et Internet.
Sundar Pichai souligne le potentiel de l’IA à créer des opportunités pour les individus du quotidien jusqu’à l’extraordinaire, en favorisant l’innovation, le progrès économique et en stimulant la connaissance, l’apprentissage, la créativité et la productivité à une échelle sans précédent. Il exprime son enthousiasme pour l’idée que l’IA puisse devenir un outil utile pour tout le monde, partout dans le monde.
Le PDG mentionne que Google, en tant qu’entreprise axée sur l’IA depuis près de huit ans, constate une accélération significative des progrès dans ce domaine. Des millions de personnes utilisent désormais l’IA générative dans les produits de Google pour effectuer des tâches qu’ils ne pouvaient pas accomplir il y a un an, comme trouver des réponses à des questions complexes ou collaborer de manière innovante. De plus, les développeurs utilisent les modèles et l’infrastructure d’IA de Google pour créer de nouvelles applications génératives, et des entreprises du monde entier se développent grâce à ces outils.
Pourtant, selon Sundar Pichai, ce n’est que le début de ce qui est possible avec l’IA. Il insiste sur le fait que Google aborde ce travail avec audace et responsabilité, en recherchant des avancées significatives tout en mettant en place des mécanismes de protection et en collaborant avec les gouvernements et les experts pour atténuer les risques liés à l’IA de plus en plus performante. Google continue également d’investir dans les meilleurs outils, modèles de base et infrastructures d’IA, les intégrant dans ses produits et les mettant à la disposition d’autres, conformément à ses principes d’IA.
En relation : Elon Musk lance une IA à l’humeur facétieuse : « Grok », le Chatbot qui parle Humain