Google annonce de nouvelles intégrations et de nouveaux produits d’IA lors de la conférence Google I/O. Vue d’ensemble.
Gmail « Aidez-moi à écrire »
Google intègre l’IA générative de texte dans Gmail dans le cadre des mises à jour de son espace de travail, ce qui permet de générer des suggestions de réponses détaillées. Google en fait la démonstration avec l’exemple d’une demande de remboursement auprès d’une compagnie aérienne, avec un courriel élaboré et détaillé conçu pour augmenter les chances d’un remboursement complet.
Itinéraires de visualisation immersive pour Google Maps
L’année dernière, Google a présenté Immersive Visualisation, une visualisation en 3D générée par l’IA de sites célèbres dans le monde entier. Aujourd’hui, Google met en œuvre cette visualisation à plus grande échelle pour les itinéraires en 3D dans les villes. Le service devrait être disponible d’ici la fin de l’année pour Amsterdam, Berlin, Dublin, Florence, Las Vegas, Londres, Los Angeles, New York, Miami, Paris, Seattle, San Francisco, San Jose, Tokyo et Venise.
Magic Editor pour Google Photos
Magic Editor est une IA générative pour vos photos. Il vous permet de déplacer des éléments dans l’image et de compléter les informations manquantes. Google en fait la démonstration en utilisant la photo d’un enfant tenant des ballons qui sont coupés sur le bord de l’image. En faisant glisser l’enfant vers le centre, les ballons sont automatiquement insérés sur le bord. Le nouvel éditeur sera disponible pour certains smartphones Pixel dans le courant de l’année, et Google est conscient qu’il ne donnera pas toujours les résultats escomptés.
Bard prend en charge PaLM-2 et bénéficie de nouvelles fonctionnalités
Google a annoncé des améliorations à son chatbot Bard, notamment des fonctionnalités pour les images, le codage et l’intégration d’applications, ainsi qu’une extension de l’accès mondial. Bard utilisera désormais PaLM 2, un modèle de langage complet doté de capacités mathématiques, logiques et de programmation améliorées. Selon Google, PaLM 2 est nettement plus performant que le modèle PaLM annoncé en avril 2022.
L’outil d’IA, qui n’était auparavant disponible qu’aux États-Unis et au Royaume-Uni, sera désormais proposé dans plus de 180 pays et territoires. La prise en charge du japonais et du coréen a été ajoutée, et bientôt 40 langues seront prises en charge.
Bard prendra bientôt en charge les réponses et les messages-guides avec des images, grâce à l’intégration de Google Lens dans Bard, qui permet aux utilisateurs d’utiliser des images en plus du texte dans leurs messages-guides.
Les nouvelles mises à jour de code et les fonctions d’exportation comprennent des citations de polices plus précises, un design sombre et un bouton « export » qui permet aux développeurs d’exporter et d’exécuter du code avec Replit, en commençant par Python. Les utilisateurs peuvent également créer des courriels et des documents directement dans Gmail et Docs.
Bard prévoit d’intégrer des applications et des services Google, tels que Docs, Drive, Gmail et Maps, ainsi que des services du web, notamment Firefly d’Adobe, le modèle d’IA générative d’Adobe, et d’autres partenaires tels que Kayak, OpenTable, ZipRecruiter, Instacart, Wolfram et Khan Academy.
« Instantané de l’IA : réponses de l’IA dans la recherche Google
Comme annoncé précédemment, Google intègre des réponses générées par l’IA directement dans Google Search. Les réponses expérimentales apparaîtront avant les résultats de recherche traditionnels de Google. La nouvelle interface de recherche permet de poser des questions de suivi et d’engager des conversations avec des chatbots sur la base des suggestions de l’IA, et intègre des liens provenant d’éditeurs, d’entreprises et de médias sociaux.
« Nous savons que les gens apprécient les opinions des autres », a déclaré Cathy Edwards, responsable de la recherche chez Google. Toutefois, la nouvelle visualisation des recherches par l’IA occupe beaucoup d’espace sur l’écran et risque d’affecter le trafic des éditeurs.
Les capacités d’IA générative sont également étendues à la recherche Google Shopping. L’IA fournit une vue d’ensemble des produits, y compris les facteurs pertinents, les évaluations, les prix et les images des produits, le tout basé sur le Google Shopping Graph, qui contient plus de 35 milliards de listes de produits.
Les réponses de l’IA ne sont fournies que lorsque l’algorithme de Google le juge approprié. Pour l’instant, le système évite les sujets sensibles tels que la santé et la finance.
L’accès aux instantanés d’IA est possible en rejoignant le programme Search Generative Experience, qui fait partie de la nouvelle fonctionnalité Search Labs. L’accès au programme devrait être disponible dans les semaines à venir, et Search Labs est disponible dès maintenant.
Universal Translator
Universal Translator est un outil de traduction audiovisuelle basé sur les derniers modèles de traduction IA, selon Google. Il peut traduire la langue parlée dans une vidéo et la convertir en voix en synchronisant les mouvements des lèvres de la personne qui parle. En raison du risque de « deepfakes », Google ne met cet outil à la disposition que de partenaires sélectionnés dans un premier temps.
IA générative pour Android : messages et fonds d’écran
Pour Android, Google a annoncé « Magic Compose », une sorte d’autocomplétion élaborée pour les messages. L’intelligence artificielle générative utilise le contexte de la conversation et est également capable d’adopter certains styles, comme une communication de type professionnel, shakespearien ou particulièrement détendu.
En outre, Google introduit un outil d’intelligence artificielle pour la création de fonds d’écran, qui génère des motifs d’arrière-plan à partir de photos et de motifs existants. Cet outil sera disponible dans la prochaine mise à jour d’Android.
Emoji Wallpaper permet aux utilisateurs de personnaliser l’arrière-plan de leur appareil avec leurs combinaisons préférées d'emojis, de motifs et de couleurs. Cinematic Wallpaper transforme les photos sélectionnées par l’utilisateur en images animées qui prennent vie lorsque l’appareil est déverrouillé ou incliné, grâce à l’IA locale de l’appareil.
Autre nouveauté : la fonction Generative AI Wallpaper. Les utilisateurs peuvent décrire leur vision créative et le téléphone génère des fonds d’écran uniques en utilisant le modèle de diffusion texte-image de Google. Les suggestions sont pré-structurées afin que vous puissiez créer de magnifiques fonds d’écran sans avoir à embaucher un ingénieur en suggestions.
Ces nouveaux fonds d’écran seront disponibles le mois prochain, en commençant par les appareils Pixel. Ils sont basés sur le cadre de conception Material You de Google et ajustent automatiquement la palette de couleurs de l’appareil pour qu’elle corresponde au fond d’écran sélectionné.
Lancement de MusicLM
En janvier, Google a annoncé le modèle de conversion de texte en chanson MusicLM, qui est maintenant lancé dans la cuisine d’essai de l’IA pour le Web, Android et iOS. En réponse à une description lyrique d’un style musical spécifique, MusicLM génère deux chansons, dont l’une peut être considérée comme meilleure pour l’entraînement ultérieur de l’IA.