Suite au lancement par Apple de sa toute dernière gamme d’iPad la semaine dernière lors de l’événement “Let Loose », Google vient de répliquer avec sa conférence des développeurs I/O ce mardi 14 mai. L’événement a eu lieu au Shoreline Amphitheater à Mountain View, en Californie, à quelques pas du siège social de Google.
Traditionnellement, l’entreprise utilise cet événement pour dévoiler une variété de nouvelles mises à jour logicielles et, occasionnellement, des matériels. Cependant, la Google I/O de cette année n’a présenté aucune annonce de nouveau matériel, car Google avait déjà introduit son nouveau téléphone Pixel 8A le 7 mai dernier, le jour même de l’introduction des nouveaux iPad par Apple.
À la place, la keynote du 14 mai a été une démonstration de force des mises à jour logicielles basées sur l’IA et de ses applications à travers divers produits et services, soulignant la stratégie de Google pour dominer le domaine en pleine croissance de l’intelligence artificielle générative.
Google I/O 2024 : marquée par l’Intelligence Artificielle
Cette année, la Google I/O a voulu marquer les esprits par l’omniprésence de l’IA.
Dès les premières minutes de la conférence, il était clair que l’IA serait au cœur des discussions. Au total, le terme « intelligence artificielle » a été mentionné pas moins de 120 fois au cours de la keynote, témoignant de l’importance cruciale que Google accorde à cette technologie.
Google a dévoilé Gemini, une nouvelle plateforme d’IA qui pourrait potentiellement remplacer Google Assistant à terme. Gemini promet des capacités avancées de traitement du langage naturel, de génération de texte, et d’intégration poussée avec les produits Google tels que Search, Chrome, et G Suite. L’objectif est de créer une expérience utilisateur plus fluide et intuitive, propulsée par des algorithmes de pointe.
Mais bien que l’IA ait été la vedette de l’événement, Android 15 n’a pas été complètement négligé. Google a présenté quelques nouvelles fonctionnalités intéressantes, notamment la messagerie par satellite et une barre d’état redessinée. Ces améliorations visent à offrir une meilleure gestion de la batterie et une interface utilisateur plus ergonomique, répondant ainsi aux attentes des utilisateurs en quête de performances optimisées.
Voici les annonces les plus importantes de la Google I/O 2024 :
Ask Photos, la recherche photo intelligente
Google Photos introduit une nouvelle fonctionnalité expérimentale baptisée Ask Photos, propulsée par les modèles d’IA Gemini. Elle permet aux utilisateurs de rechercher dans leur bibliothèque de photos de manière intuitive, en utilisant des requêtes en langage naturel comme « Montre-moi la meilleure photo de chaque rando de l’année passée. » Ask Photos peut également aider à sélectionner les moments forts d’un voyage et à générer des légendes. Google assure que la confidentialité est une priorité, les données personnelles étant protégées par des mesures de sécurité de pointe et non utilisées à des fins publicitaires. Cette fonctionnalité sera déployée dans les prochains mois.
Veo, des vidéos générées par l’IA
Google a dévoilé Veo, un nouveau modèle de génération vidéo capable de créer des vidéos 1080p de plus d’une minute dans divers styles cinématographiques. Veo comprend parfaitement le langage naturel et les sémantiques visuelles, capturant avec précision le ton et les détails d’une demande tout en respectant les lois de la physique pour des mouvements réalistes. Actuellement en prévisualisation privée pour certains créateurs, Veo devrait bientôt être intégré à YouTube Shorts et d’autres applications.
Imagen 3, le meilleur modèle texte-image de Google
Imagen 3, le modèle texte-image le plus avancé de Google, produit des images photoréalistes avec moins d’artefacts visuels que ses prédécesseurs. Parmi les améliorations attendues, la génération de texte intégré aux images pourrait révolutionner la création de contenu. Des cartes d’anniversaire personnalisées par l’IA ne sont que le début des possibilités offertes par Imagen 3.
Circle to Search pour vos devoirs
La fonctionnalité Circle to Search, déjà disponible sur divers appareils Pixel et Samsung, s’enrichit pour aider les élèves avec leurs devoirs. En cerclant une question complexe, les élèves peuvent recevoir des instructions détaillées pour résoudre des problèmes de physique et de mathématiques. Cette année, la fonctionnalité sera améliorée pour traiter des problèmes plus complexes impliquant des formules symboliques, des diagrammes et des graphiques, grâce aux modèles d’apprentissage LearnLM. Circle to Search doublera sa disponibilité d’ici la fin de l’année.
Gemini sur Android
Google améliore son assistant IA Gemini sur Android pour une meilleure compréhension contextuelle des applications utilisées. Cette expérience IA générative, intégrée au système d’exploitation Android, deviendra plus polyvalente et conviviale. Les utilisateurs pourront accéder à Gemini en superposition de l’application en cours, facilitant l’interaction avec l’assistant IA pour des actions comme glisser-déposer des images générées dans Gmail, Google Messages, etc. Les abonnés Gemini Advanced pourront également utiliser la fonction « Ask this PDF » pour extraire automatiquement des réponses des documents PDF. Cette mise à jour est prévue dans les prochains mois.
Gemini pour la recherche Google
Un nouveau modèle Gemini, conçu pour la recherche Google, combine des capacités avancées comme le raisonnement multi-étapes avec les systèmes de recherche existants de Google. Les Aperçus IA — une fonctionnalité des Labs offrant des réponses rapides et des aperçus des requêtes des utilisateurs en agrégeant des sources multiples — seront bientôt disponibles pour tous aux États-Unis, avec une expansion mondiale prévue d’ici la fin de l’année. Les utilisateurs pourront ajuster les Aperçus IA en simplifiant le langage ou en détaillant davantage les informations.
Recherche par vidéo
La fonctionnalité « Search with video » permet désormais de rechercher du contenu vidéo en utilisant l’IA. Par exemple, pour résoudre un problème avec un tourne-disque, il suffit d’enregistrer une vidéo du problème et de la soumettre à l’IA pour une assistance ciblée. Disponible prochainement pour les utilisateurs de Search Labs aux États-Unis, cette fonctionnalité s’étendra à d’autres régions dans un avenir proche.
Gemini 1.5 Pro pour une lecture approfondie
Google a présenté Gemini 1.5 Pro, son modèle d’IA le plus avancé, avec une fenêtre contextuelle élargie à un million de tokens, permettant de comprendre de longs documents jusqu’à 1500 pages ou de résumer 100 emails. À l’avenir, il pourra traiter une heure de contenu vidéo ou des bases de code dépassant 30 000 lignes. Les utilisateurs peuvent uploader des fichiers directement ou via Google Drive pour obtenir des réponses rapides et des insights précis, facilitant ainsi la compréhension de documents complexes.
Gems personnalisés
La nouvelle fonctionnalité Gems permet aux abonnés Gemini Advanced de créer des versions personnalisées de l’assistant IA. Que vous cherchiez un coach sportif, un sous-chef, un partenaire de codage ou un guide d’écriture créative, il suffit de décrire vos besoins pour que Gemini adapte ses réponses en conséquence. Par exemple, demandez à Gemini de devenir votre coach de course et de vous fournir un plan d’entraînement quotidien avec des encouragements positifs.
Gmail optimisé
La nouvelle icône Gemini dans l’application Gmail mobile offrira des options utiles comme résumer des emails, lister les prochaines étapes ou suggérer des réponses. Les utilisateurs pourront également utiliser la boîte de demande ouverte pour des requêtes spécifiques, comme trouver un document particulier ou poser des questions pour une réunion à venir.
Grâce à ces innovations Google projette d’intégrer l’intelligence artificielle dans tous les aspects de la vie numérique pour la rendre plus intuitive et efficace.
Connexe : Nouveautés Apple 2024 : sortie des nouveaux iPad Pro et iPad Air, Pencil Pro et Magic Keyboard