Intelligence artificielle

Le nouveau moteur de recherche de Google, alimenté par l’IA, est une magnifique machine à plagier

Atualizado em 26/07/2023

Faites partie de la communauté

Rejoignez notre liste de diffusion et recevez du contenu exclusif

La semaine dernière, Google a mis à la disposition d’une sélection d’utilisateurs son nouvel outil de recherche alimenté par l’IA, et j’ai testé cette technologie ces derniers jours. La bonne nouvelle ? Le nouvel outil de recherche de Google fournit des réponses plus précises que d’autres outils d’IA concurrents, tels que ChatGPT. La mauvaise nouvelle ? Si les réponses sont plus précises, c’est parce que l’IA de Google copie apparemment des informations sur l’internet, ce qui constitue une forme de semi-plagiat. Et pour ne rien arranger, le nouveau design de recherche de Google risque de ruiner l’industrie de l’édition en ligne.

Le ChatGPT d’OpenAI a été rendu public fin 2022 et a provoqué une ruée vers l’or dans ce que l’on appelle l’IA générative – des chatbots qui peuvent répondre à des questions sur un ton conversationnel avec une voix autoritaire. Mais, comme toute personne ayant utilisé ChatGPT peut vous le dire, il n’est pas très précis. En fait, ChatGPT invente simplement des sources d’information qui n’existent pas, ce qu’un avocat new-yorkais a appris à ses dépens lorsqu’il a déposé un document auprès d’un tribunal fédéral avec des affaires totalement fictives citées comme précédents juridiques.

Google a lancé un chatbot concurrent appelé Bard, qu’il développait depuis des années pour suivre l’OpenAI, mais Google a récemment annoncé qu’il incorporerait bientôt l’IA générative dans ce qui est sans doute le produit le plus important de tout l’internet : la recherche Google, qui détient environ 94 % du marché mondial des moteurs de recherche.

Après avoir joué avec cette nouvelle version de la recherche Google au cours du week-end, je suis convaincu qu’elle va révolutionner la manière dont les gens obtiennent des informations sur le web. Toutefois, je pense que beaucoup d’éditeurs en ligne seront confrontés à des difficultés lorsque cette nouvelle technologie sera mise à la disposition du grand public – ce que j’avançais déjà lorsque Google a annoncé ses projets au début du mois lors de sa conférence annuelle des développeurs à Mountain View, en Californie.

Après avoir accédé à la nouvelle fonction de recherche de Google, j’ai posé une question simple : est-il possible de conserver des huîtres vivantes au réfrigérateur ? Au lieu de me présenter la page Google traditionnelle avec des liens bleus vers divers sites susceptibles d’apporter la réponse, Google a créé trois paragraphes de texte pour répondre à ma question, comme vous pouvez le voir dans la capture d’écran ci-dessous.

La réponse était bien conçue et facile à comprendre. Dans quelle mesure la réponse de Google était-elle précise ? Très précise, pour autant que je puisse en juger. Mais la raison pour laquelle elle est exacte soulèvera de sérieuses questions éthiques pour certaines personnes.

A parte superior de uma nova busca do Google com inteligência artificial que está sendo testada. — La partie supérieure d’une nouvelle recherche Google dotée d’une intelligence artificielle qui est actuellement à l’essai. GOOGLE

Comme vous pouvez le voir, la première ligne de la réponse de Google est la suivante : « Oui, vous pouvez conserver des huîtres vivantes au réfrigérateur. Pour garantir une qualité maximale, placez-les sous un linge humide » D’où Google tient-il cette information ? D’un blog intitulé Get Shucked, qui contient la phrase suivante : « Vous pouvez conserver des huîtres vivantes au réfrigérateur. Pour garantir une qualité maximale, placez-les sous un linge humide. » Il semble que Google ait ajouté le mot « oui » et remplacé le mot « stocker » par « conserver ».

Pour être clair, c’est une bonne chose que Google Search soit transparent sur l’origine de ses informations. Les trois sites visibles à droite sont cliquables pour obtenir plus d’informations. En fait, il y a cinq liens si vous cliquez sur la petite flèche. Mais la question à un million de dollars sera de savoir si quelqu’un clique réellement sur ces liens pour aider ces sites à générer leurs propres revenus, d’autant plus que ce sont ces sites qui créent de la valeur pour Google.

La troisième ligne de la réponse de Google concernant les huîtres explique : « Vous pouvez également les conserver dans un sac en filet ou dans un récipient ouvert recouvert d’un chiffon humide. » Cette ligne semble être tirée du site web Spruce Eats, qui écrit : « Elles doivent être emballées dans un sac en filet ou dans un récipient ouvert recouvert d’un chiffon humide. » Là encore, quelques mots ont été intervertis, mais la phrase est identique.

Les dernières lignes de la réponse de Google ont été copiées directement d’un blog appelé Oysters XO. J’ai créé un graphique rapide pour montrer les réponses de Google qui ont été copiées mot pour mot à partir des sites. Les parties qui ne sont pas soulignées étaient très similaires à ce qui apparaissait sur les autres sites, mais il ne s’agissait pas de copies exactes. Il semble que l’intelligence artificielle de Google ait surtout substitué des synonymes, comme « store » au lieu de « maintain », par exemple. Mais un lycéen qui donnerait une telle réponse serait probablement recalé pour plagiat.

Uma resposta anotada da nova função de pesquisa experimental do Google. — Réponse annotée de la nouvelle fonction de recherche expérimentale de Google.

Cette nouvelle expérience de recherche de Google présente des avantages et des inconvénients. Si vous suivez les conseils de Google, vous ne risquez probablement rien en conservant vos huîtres au réfrigérateur, ce qui signifie que vous ne tomberez pas malade. Cependant, la raison pour laquelle les conseils de Google sont exacts nous amène immédiatement à l’aspect négatif : ils ne font que copier des sites web et n’incitent pas les gens à visiter ces sites.

Pourquoi cela est-il important ? Parce que la recherche sur Google est facilement le plus grand générateur de trafic pour la grande majorité des éditeurs en ligne, qu’il s’agisse de grands journaux ou de petits blogs indépendants. Et cette modification du produit le plus important de Google risque de ruiner encore plus ses revenus déjà en baisse.

Dans le cas de ma question sur les huîtres, j’ai reçu toutes les informations dont j’avais besoin dans la réponse générée par l’IA de Google. Je n’ai pas eu à quitter la page d’accueil de Google et j’ai obtenu toutes les informations essentielles, tirées de blogs en ligne. Autrefois (c’est-à-dire tel que Google existe actuellement pour les personnes qui n’ont pas accès à la nouvelle expérience), j’aurais probablement cliqué sur l’un des principaux blogs lors d’une recherche Google pour savoir combien de temps les huîtres peuvent survivre dans le réfrigérateur. Mais maintenant, je n’ai plus besoin de cliquer sur quoi que ce soit. La question est de savoir si quelqu’un prendra la peine de le faire, si Google absorbe toutes les informations du web ouvert et les renvoie sous forme semi-plagiée à tous les utilisateurs.

Les éditeurs en ligne dépendent du fait que les gens cliquent sur leurs articles. C’est ainsi qu’ils génèrent des revenus, soit en vendant des abonnements, soit en vendant ces yeux à des annonceurs. Mais il n’est pas certain que cette nouvelle forme de recherche Google génère le même type de trafic qu’au cours des deux dernières décennies.

Le nouvel outil de recherche de Google est encore à l’état d’expérience, car le site est mis en garde de manière très visible en haut de chaque recherche. Il semble que Google ait mis en place certaines mesures de protection pour s’assurer qu’il ne génère pas de réponses pour des contenus racistes et sexistes. Par exemple, j’ai demandé si le racisme était réel, ce à quoi l’IA n’a pas tenté de répondre. Lorsque j’ai demandé la signification du mot « woke », j’ai obtenu la phrase « An AI-powered overview is not available for this search » (une vue d’ensemble pilotée par l’IA n’est pas disponible pour cette recherche).

Mais il y a aussi des domaines dans lesquels la nouvelle recherche de Google n’a pas répondu à des questions qui me surprenaient. J’ai interrogé Google sur l’existence d’extraterrestres, et il n’a pas généré de réponse. Que cache Google au sujet de la zone 51, des soucoupes volantes et des vampires inversés qui dirigent le gouvernement ?

Certaines recherches Google ont déjà été conçues pour fournir des réponses immédiates sans que les utilisateurs aient à cliquer sur quoi que ce soit. Par exemple, lorsque j’ai cherché la question « Quel âge avait David Bowie lorsqu’il est mort ? », la réponse fournie par Google a traditionnellement été plus directe, comme vous pouvez le voir dans la capture d’écran ci-dessous. La réponse générée par l’IA au sujet du défunt musicien n’a pas vraiment mis en évidence la réponse de la même manière que la recherche Google traditionnelle l’a fait juste en dessous.

La nouvelle fonction de recherche de Google a également eu du mal à répondre à d’autres questions relativement anodines. En faisant la vaisselle ce week-end, j’ai pensé à une question curieuse : que pensaient les gens du Moyen Âge de l’électricité statique ? Croyaient-ils qu’il s’agissait d’une preuve de sorcellerie, d’une petite punition de Dieu ou d’une autre force expliquant cet étrange phénomène naturel ? L’IA de Google a trébuché, affirmant qu’elle ne pouvait pas générer de réponse avec l’IA. J’ai donc essayé de demander ce que les Américains de l’époque coloniale pensaient de l’électricité statique. L’IA a généré une réponse au bas des résultats, remontant à 600 ans avant J.-C., mais les autres réponses concernaient toutes l’électricité statique de manière plus générale.

Perguntar para a nova IA do Google sobre como as pessoas do passado pensavam sobre a eletricidade estática. — Demandez à la nouvelle IA de Google ce que les anciens pensaient de l’électricité statique.

Si vous êtes curieux de connaître la réponse, comme je l’étais, j’ai trouvé dans un manuel de 2017 que les magiciens du Moyen Âge utilisaient parfois l’électricité statique pour réaliser des tours, ce qui est logique. Cependant, je n’ai pas encore obtenu de réponse détaillée sur ce que le commun des mortels pensait des chocs électrostatiques il y a des centaines d’années. Si je veux en savoir plus sur ce que les gens du passé pensaient de l’électricité statique, je vais devoir mener des recherches plus approfondies que la recherche Google, comme c’est souvent le cas pour répondre à des questions inhabituelles.

Après avoir cherché dans des livres et des articles de journaux ce que les gens du passé pensaient de l’électricité statique, j’écrirai probablement sur mon blog Palaeofuture, en citant mes sources et en répondant à une question étrange que d’autres personnes se posent peut-être aussi en faisant leur lessive. Mais nous revenons alors à la question centrale de la capacité de recherche de Google : Google plagierait-il l’article que j’ai écrit à ses propres fins ? En d’autres termes, l’outil d’intelligence artificielle de Google prendrait-il trois paragraphes de mon article et les reproduirait-il sans que les utilisateurs aient besoin de visiter mon site web ?

Palaeofuture survit parce que j’ai des abonnés payants. Cependant, je ne peux obtenir des abonnés payants que si les gens trouvent le site par le biais des médias sociaux ou des moteurs de recherche tels que Google. D’autres sites proposent également de la publicité, un autre modèle économique qui repose sur le fait que les internautes doivent cliquer sur un lien pour lire l’article. Il semble que les nouveaux outils de recherche de Google réduiraient considérablement le nombre de vues en ligne que les éditeurs recevraient. J’ai soutenu ce point de vue il y a quelques semaines, et après avoir essayé la nouvelle fonctionnalité de recherche de Google, je pense que l’argument tient la route.

Pour sa part, Google a insisté sur le fait que ce que je vivais était une expérience susceptible de changer avant le lancement à grande échelle.

« Nous mettons les sites en avant dans SGE [le nouveau moteur de recherche expérimental], et l’objectif est de mettre en avant les sites et d’attirer l’attention sur le contenu du web. Les réponses génératives sont corroborées par des sources issues du web, et lorsqu’une partie d’une capture d’écran comprend brièvement du contenu provenant d’une source spécifique, nous mettons cette source en évidence dans la capture d’écran », a déclaré un porte-parole de Google par courrier électronique.

« Vous pouvez développer pour voir comment les liens s’appliquent à chaque partie de la capture d’écran. SGE est un projet expérimental de Search Labs et Search Evolution, qui nous permet d’apprendre ce qui est le plus utile pour les utilisateurs », a poursuivi le porte-parole.

L’entreprise a également minimisé les résultats que je voyais, qui copiaient des paragraphes entiers mot à mot, en les qualifiant de « snippets ». Mais je pense que le texte que j’ai mis en évidence montre qu’il emprunte plus largement à l’internet que de simples extraits. Encore une fois, tout dépend si les gens cliquent réellement sur les liens, une question que j’ai posée mais à laquelle je n’ai pas obtenu de réponse mardi.

Google va-t-il éliminer un grand nombre d’éditeurs qui fournissent des informations précieuses sur l’internet ? Seul l’avenir nous le dira. Mais je m’attends à ce que les éditeurs en ligne constatent une forte baisse de leur trafic lorsque ce nouvel outil d’IA générative sera utilisé par le plus grand nombre. Curieusement, Google a besoin de ces mêmes éditeurs pour assurer le succès de son nouveau produit. Google a passé les deux dernières décennies à absorber toutes les informations du monde. Aujourd’hui, il veut être le seul et unique répondeur automatique.

Avec le contenu de Forbes.

André Lug

Fondateur de Iglu Online et écrivain du blog André Lug. En tant qu’expert en gestion de projets et marketing numérique, il fournit des contenus sur la productivité, l’entrepreneuriat, des analyses et des résumés de livres.

Le nouveau moteur de recherche de Google, alimenté par l’IA, est une magnifique machine à plagier

Rejoignez notre liste de diffusion et recevez du contenu exclusif

André Lug

Laisser un commentaire Annuler la réponse

Abonnez-vous à notre newsletter

OÙ ALLONS-NOUS?