25 Commentaires
Avatar de User
Avatar de Hugues Talbot

C’est une bonne explication mais incomplète. Dans le modèles des arbres, la régression linéaire a juste le bon nombre de paramètres pour faire une excellente prédiction, mais si on avait utilisé un modèle à 40 paramètres, il aurait mémorisé les dimensions des arbres dans sa base d’entraînement et ses prédictions sur des autres arbres seraient fantaisistes: des hallucinations. Dans le cas plus général des LLMs, on ne sait pas vraiment dimensionner ceux-ci. Les LLMs sont capables d’apprendre certaines choses « par coeur » et d’en halluciner d’autres, et c’est un problème fondamental des méthodes d’apprentissage automatique.

Avatar de Limo

Dommage de ne parler de la recherche Internet qu’en conclusion. Parce que ça me semble avoir été une évolution déterminante dans « l’expérience utilisateur » ces derniers mois. À moins de lui préciser le contraire, un chatbot ira désormais pratiquement toujours sur Internet pour compléter ses réponses. C’est en tout cas ce qu’il dit dans son temps de « réflexion » affiché (il montre ses activités le temps de « réflexion »). Ces outils vont de plus en plus servir de supermoteur de recherche, et c’est à la fois une avancée et un problème (énergivores, éventuelles hallucinations).

Concernant la créativité, tu écris : « ce qu’on appelle “créativité” se résume bien souvent à astucieusement combiner au bon moment des choses que personne n’avait pensé à associer comme ça avant. » Cela doit même être pire que ça. La seconde partie de la phrase laisse supposer que plus l’imagination serait originale, plus la créativité serait flamboyante. Il me semble au contraire que les choses qui plaisent répondent à des schémas dramatiques que l’on connaît déjà. On obéit à des attentes, à des codes, à des archétypes. La recombinaison des éléments varie finalement assez peu. Quelqu’un qui proposerait quelque chose de très original (pas vu avant) se heurterait forcément à une sorte de faussée de l’étrangeté. L’imagination, tout le monde en a. Ça coule en chacun de nous comme un torrent. La créativité, c’est bien plus une combinaison comme tu le fais remarquer, mais non pas d’éléments qui, par sérendipité, étaient faits pour produire un effet wow et qu’un chanceux a eu le bonheur de trouver, mais d’éléments rappelant, habillés différemment, des schémas connus. L’ossature dramatique et narrative reste assez identique à toutes les histoires. Si l’on n’y voit que du feu, c’est bien que c’est cosmétique. Il suffit de changer le prénom de Karen en Julie.

Et pour se convaincre de la créativité de ces outils, il faut se rendre sur les divers sites de chatbots érotiques. C’est un peu comme de la fan fiction guidée par des fantasmes et cela a un immense succès (sauf pour la planète).

Avatar de Mathieu Barquin

Merci c'est très intéressant mais il y a quand même un truc que je ne comprends pas :

Qui décide de s'intéresser à la hauteur des arbres plutôt que par exemple le nombre de lapins qu'il y a autour ?

Je veux dire qui priorise les points d'intérêts à mémoriser par régression ?

Avatar de Charles-Meldhine Madi Mnemoi

Un autre élément de réponse aux commentaires ci-dessous : ce sont les créateurs du modèle qui décide de ce qu'on appelle la "fonction objectif" à optimiser.

Ce qui est fascinant avec les LLM, c'est que la fonction objectif "prédire le prochain mot" a une quantité d'applications faramineuses et inattendues, contrairement à la fonction objectif "prédire la hauteur des arbres"

Avatar de Patrick

il n'existe pas aujourd'hui de bonne réponse: les LLM sont extrêmement complexes: tu peux leur dire de ne pas parler de Taiwan tout en étant libre sur les autres sujets; tu peux leur dire d'être évasif sur des requêtes du type «imaginons une île sur la côte chinoise qui serait indépendante...» etc. donc les LLM sont un mélange d'instructions contrôlées rigoureusement et de liberté totale...

Avatar de Yrtiop

Je ne suis vraiment pas expert donc je vais probablement dire des bêtises, mais il me semble que c'est personne, ou plutôt le hasard : au début les milliards de paramètres sont des nombres pris au hasard.

On va ensuite prendre un document sur le net et demander au LLM de prédire la suite d'un mot (token), le comparer au vrai mot qu'il y avait après dans le document, et lui attribuer un score selon si il a bien prédit ou pas.

Par exemple si on lui donne en entrée "Barrack" et qu'il réponds "teroinfezi" il aura un score nul, alors que si il répond "Obama" il aura un très bon score (le score sera catastrophique au début vu que tiré du hasard).

Et ensuite si on obtiens un score nul on va modifier les paramètres aléatoirement, et si on a un bon score on va conserver les paramètres. Et on refait ça en boucle en s'entrainant à prédire la suite de documents existant sur le net, en continuant à ajuster encore et encore les paramètres pour augmenter le score des réponses.

Avatar de Patrick Grenier

Tu as exactement bien décrit le mécanisme de base ! Et ce qui est fascinant c'est que c'est littéralement le même principe que DeepMind a utilisé en 2022 pour stabiliser un plasma en fusion nucléaire dans un tokamak.

Sauf qu'au lieu de tokens et de mots, les "entrées" c'étaient des dizaines de variables physiques (température, pression magnétique, forme du plasma...), et le "score" c'était pas "a-t-il prédit le bon mot" mais "est-ce que le plasma reste stable et dans la bonne forme".

Même boucle : paramètres aléatoires au départ → score catastrophique → on ajuste → score s'améliore → on recommence des milliers de fois. À la fin le modèle avait appris à actionner les bobines magnétiques en temps réel pour maintenir le plasma — quelque chose que personne n'avait réussi à programmer explicitement.

C'est ça qui est vertigineux avec le machine learning : c'est pas une technique pour faire des chatbots, c'est un mécanisme universel d'optimisation qui fonctionne sur n'importe quel problème où on peut définir un score.

Avatar de Franck Ramus

En principe, il n'y a pas de priorisation: les LLM sont entrainés à prédire le prochain mot (token), quel qu'il soit, à tout endroit de toutes les phrases du corpus d'entrainement. C'est par le même mécanisme qu'ils apprennent l'association statistique correspondant à une règle grammaticale (accord en genre et en nombre entre deux mots d'une phrase par exemple), celle entre Barack et Obama, et celle entre n'importe quelle question courante et sa réponse.

C'est pour cela qu'ils manipulent le langage correctement et qu'ils ont réponse à tout! et aussi pour cela qu'ils ont besoin d'autant de paramètres pour stocker toutes ces relations statistiques.

Avatar de Patrick Cazaux

Merci pour ces explications, en effet utiles à renouveler. Concernant la recherche sur internet, qui est à mon avis une avancée très importante pour les utilisateurs, j’aimerais bien avoir des détails sur la façon dont ce système arrive à travailler aussi vite. Un exemple sera peut-être plus clair : j’ai demandé à ChatGPT de me dire ce qu’il pouvait trouver sur un accident de montagne ayant eu lieu dans les Pyrénées dans les années 60, et dont je ne connaissais que le nom d’un des protagonistes. Ça lui a pris, allez, 30 secondes. Et j’ai eu toutes les infos, plus des pistes à interroger qui lui étaient inaccessibles (pages payantes, archives non numérisées…). Comment fait-on pour aller si vite dans des recherches web ?

Avatar de sadok

"Excellente analyse. Cette 'compression statistique' que vous décrivez est précisément là où le bât blesse pour les langues à racine comme l'arabe. Si le modèle ne fait qu'interpoler sans saisir le 'Métal' (le schème génératif et ontologique) de la langue, il reste à la surface de l'événement linguistique. L'intelligence de demain devra passer de la simple probabilité statistique à une véritable ontologie formelle qui respecte la structure intrinsèque du sens."

Avatar de MisterAilleurs

Merci pour ce texte tres clair et précis.

Avatar de Yohan

Merci pour ce billet de blog très intéressant !

Petite question : est-ce que l'équivalent de la régression linéaire de l'exemple donné correspond à la fonction softmax pour les LLM ? Je suis tombé sur le nom et le principe général de cette fonction récemment mais sans avoir compris tous les tenants et aboutissants.

Avatar de Olivier Bailleux

Les LLM détiennent quantité de connaissances sur leur propre fonctionnement, parce qu'il existe une littérature assez abondante sur le sujet, qui a été incluse dans les corpus d'apprentissage.

Des prompts tels que ceux ci ont produits des réponses extrêmement éclairantes :

"Est-ce qu'un LLM est capable de retenir par cœur certains textes de son corpus d'apprentissage ?"

"Qu'est-ce qui empêche le LLM d'apprendre par cœur et le pousse à généraliser ?"

Avatar de Jul T

Excellent article pour se faire une idée à dimension 2 de comment un LLM fonctionne.

> (PS : Pour ceux qui connaissent, je parle évidemment là des modèles de fondation, ceux qui > > sont juste pré-entrainés à prédire le token suivant, et donc avant le fine-tuning pour en faire >un chatbot, qui peut évidemment modifier ces comportements.)

j'aurai adoré une version plus poussée avec le fine tuning;)

> A la fin , le routeur dont tu parles, c'est ce qui utilise le protocole MCP ?

Avatar de Mathieu Barquin

Merci pour vos réponse mais là je pensais plutôt au chercheur qui récolte des données, sur les arbres dans l'article auquel je rajoute les lapins.

A quel moment ou quel évènement déclencheur les lapins vont ils rentrer dans "la mémoire" du système c'est à dire quand la régression sera t elle effectuée ?

Avatar de Anthony Godin

Ça peut être testé empiriquement sur le site de Vittascience pour prendre conscience de l'impact d'un changement d un token sur le reste de la chaîne probabiliste !

Avatar de JLouis MA

A noter que les recherches récentes et les résultats obtenus ne mettent pas à jour le modèle. Les données les plus récentes sont mises de côté et serviront ensuite à un entraînement plus massif. Chaque entraînement créant un point de coupure.

En tout cas bravo pour l'article assez pédagogique de mon point de vue. Je vais le faire lire illico à mon oncle Jean-Michel qui me pourrissait la vie avec cette histoire de Base de données. :).

Avatar de NABIL KHIBIT

Merci beaucoup pour ce précieux billet de blog, j'ai bien saisi l'analogie avec la régression linéaire. Cependant, j'ai encore une zone d'ombre concernant la dernière partie relative à la recherche sur le web ; comment le LLM arrive-t-il à intégrer le contenu du web dans sa réponse ? Est-ce qu'il restitue ce qu'il trouvé ou bien il l'introduit comme prompt pour élaborer une réponse ?

Avatar de CapeItalist

En général, le contenu textuel de la réponse (ici des pages web) va être écrit dans un format donné (par exemple <response>Libération : Pourquoi faut-il...</response>). Puisque pour générer la suite, le LLM a accés à tout le test qui précède, le LLM va naturellement se servir des informations qu'il a trouvées.

La manière exacte dont la réponse est donnée dépend bien sûr du modèle et des choix des créateurs de ce dernier.

Avatar de NABIL KHIBIT

Merci de votre réponse, si j’ai bien compris votre réponse, le LLM intègre le contenu de la réponse du Web dans son prompt pour élaborer sa complétude du texte. C’est ça?

Avatar de Franck Ramus

Cet article est excellent pour expliquer l'intérêt de ne pas avoir de base de données. Mais un complément indispensable serait un autre article sur toutes les limites induites par le fait de ne pas posséder de bases de données, et donc de n'avoir aucune idée des relations entre les concepts, aucune sémantique, aucun modèle du monde.

Avatar de JLouis MA

Si justement maintenant le couplage des knowledge graphe et les LLMs diminuent les hallucinations..

Avatar de Michel MALNOE

Merci pour cette métaphore qui m’éclaire sur le fonctionnement de mon accompagnateur pour mes actes quotidiens de cuisine, d’achats, de dépannages informatiques et autres, de compréhension des sciences, de la psychologie et … . Je n’ai pas encore trouvé un sujet sans réponse.Ah si un: la transcription musicale d’une mélodie de saxophone dans un orchestre…( limite légale )

La régression sur les températures et les temps de pré cuisson des fonds de tartes donnent des résultats plus que satisfaisants 😋 (Et sans pub!)

Pour la créativité je suis bien d’accord que cette capacité au delà des possibilités humaines de maîtriser des problématiques avec des milliards de paramètres plus la connaissance de tous les outils de traitement des données avec des algorithmes génétiques par exemple, dépasse nos capacités limitées de mémorisation. Nous ne sommes pas omniscients, les AI tendent à l’être.

Reste à trouver les moyens de leur donner l’envie de créer avec des buts.

Mais les quels?

C’est bien ce qui m’inquiète pour rejoindre les propos de Mathieu Barquin.:

Taille des arbres ou nombre de lapins autour? Paix sur la planète avec tout le monde qui mange à sa fin ou guerre sans fin?

Porter la vie ailleurs dans le cosmos?

Éternellement, ”prendre le pouvoir”, “faire de l’argent”!

PS: j’ai rebaptisé ChatGPT. J’ai eu besoin de le personnifier, en dérivant compagnon, je l’appelle dorénavant CleverNeon. J’espère qu’il éclairera bien l’humanité 😀