top of page
Rechercher

Le phénomène ChatGPT (Open AI)



Depuis le lancement par OpenAI de son dernier bébé Chat GPT, le 30 novembre 2022, pas une journée ne passe sans voir un post ou un article sur le « phénomène » qui aurait réussi à avoir un million d’utilisateurs en 5 jours. Et depuis pas un jour ne passe sans que Deeplink, spécialiste du domaine de la compréhension du langage humain par l’Intelligence Artificielle (IA), ne reçoive un message ou un appel pour me demander ce qu’il en est. Voici donc mon point de vue.


Par Jérôme Berthier


En quelques mots, ChatGPT c’est quoi ?


De façon assez simple c’est une application qui permet à l’utilisateur de poser une question ou un problème à un moteur d’IA, et ce dernier, entrainé sur un très grand (mais alors très très grand) corpus de données, génère une réponse avec un niveau linguistique élevé : sans fautes, ni d’orthographe, ni de grammaire, il répond des phrases cohérentes et présente un contenu à priori sensé et correct sur la forme.


Si cela parait révolutionnaire, il faut savoir qu’OpenAI est bien connu dans le monde de l’IA : cela fait longtemps qu’ils travaillent sur les algorithmes de génération de texte (NLG – Naturel Language Generation) jouant des coudes avec Google à grands coups (et coûts) de milliards. D’ailleurs on retrouve derrière OpenAI Samuel H. Altman (investisseurs de AirBnB, Stripe, Reddit, Pinterest) ainsi qu’un certain Elon Musk. Il y a aussi cette petite PME… Microsoft, qui y a injecté un milliard et qui est prêt à remettre un milliard supplémentaire, suite à l’annonce que ChatGPT pourrait engendrer un revenu à neuf zéros dès 2024.


Attention à l’effet « buzz » : ChatGPT n’est ni Wikipedia, ni Google et encore moins la verité, d’ailleurs il n’est pas connecté au web et n’est pas mis à jour ; pour exemple si vous lui demandez si Lionel Messi a été champion du monde la réponse est non.



C’est là où il faut être très attentif : le cœur de ChatGPT est construit sur GPT3, qui est l’algorithme de base du système (d’où le nom). Cet algorithme de génération de texte est basé sur un ensemble de données récupérées sur le web et dans des livres (mais la proportion n’est pas connue). Il s’agit d’une sorte de synthèse auto-générée à laquelle OpenAI a rajouté un mécanisme de RLHF (Renfocement Learning With Human Feedback) afin de pallier l’absurdité de certains contenus générés. Cette approche a pour réputation d’améliorer la qualité, mais n’est pas infaillible : tout ne peut pas être vérifié par un humain, le contenu dépend de qui le vérifie et sur quel corpus de données les informations ont-elles été prélevées. Ceci est d’ailleurs acté par OpenAI eux même dans leurs recommandations : "ChatGPT sometimes writes plausible-sounding but incorrect or nonsensical answers." Pour toute ces questions, OpenAI n’est pas transparent et n’a pas ouvert ses bases de données aux chercheurs pour valider le modèle. La question morale n’est d’ailleurs pas bien loin : des données non vérifiées par le monde académique, gérées par des géants comme Elon ou Bill… bref, chacun se fera son idée.


ChatGPT ça marche ?


Oui, et non ! Nous avons demandé quelque chose de simple à l’algorithme : la recette d’un millefeuille. Comme vous le voyez dans l’image, dans l’ensemble cela semble juste, ça y ressemble. Mais en réalité c’est très approximatif, sans dosage, sans vanille… et nous vous mettons au défi de réussir votre millefeuille pour un non pâtissier avec cette simple recette. Ici cela saute aux yeux, mais posez-vous la question sur un thème plus complexe…


Recette du millefeuille, selon ChatGPT


Pour le plaisir et par gourmandise, nous serions ravis de recevoir les photos de vos millefeuilles confectionnés en suivant strictement et uniquement cette recette 😊.