EPISODE · Jun 6, 2026 · 17 MIN
Adam's Law — les LLMs comprennent mieux ce qu'ils ont déjà vu, et c'est une loi
from Le centre de gravité · host Franck Dubray - Dragonfly
Pourquoi un modèle comme DeepSeek-V3 ou GPT-4o-mini gagne-t-il subitement huit points de précision sur un problème de mathématiques simplement parce qu’on remplace le mot "hypoténuse" par "la plus longue ligne" ?Dans cet épisode, nous explorons une découverte scientifique majeure publiée en avril 2026 : Adam's Law (la loi d'Adam). Formulée par le chercheur Hongyuan Adam Lu et ses collègues de FaceMind Corporation et de l’Université chinoise de Hong Kong, cette loi démontre que les grands modèles de langage résolvent beaucoup mieux les problèmes lorsqu'ils sont formulés avec des mots courants plutôt qu'avec un jargon technique, même si le sens de la question reste rigoureusement identique.En voyageant des découvertes de Jean-Baptiste Estoup et George Zipf sur la fréquence des mots aux travaux d’Hermann Ebbinghaus sur la mémoire humaine, en passant par l'étonnante loi de Benford, nous retraçons la longue généalogie de cette observation. Nous décryptons comment les modèles de langage se révèlent être des "machines de familiarité" plutôt que des moteurs de logique pure, calquant leurs performances sur la densité des données qu'ils ont assimilées durant leur entraînement.Nous analysons également les retombées concrètes de cette loi pour l'ingénierie de prompts et le fine-tuning des modèles. Grâce aux concepts de Loi de Fréquence Textuelle (TFL) et d'Entraînement par Curriculum de Fréquence (CTFT), vous découvrirez comment optimiser vos instructions pour obtenir des gains de performance immédiats et gratuits, sans toucher à une seule ligne de code.Une réflexion fascinante qui redéfinit notre manière de concevoir, d’évaluer et de parler aux intelligences artificielles au quotidien. Bonne écoute !
What this episode covers
Pourquoi un modèle comme DeepSeek-V3 ou GPT-4o-mini gagne-t-il subitement huit points de précision sur un problème de mathématiques simplement parce qu’on remplace le mot "hypoténuse" par "la plus longue ligne" ?Dans cet épisode, nous explorons une découverte scientifique majeure publiée en avril 2026 : Adam's Law (la loi d'Adam). Formulée par le chercheur Hongyuan Adam Lu et ses collègues de FaceMind Corporation et de l’Université chinoise de Hong Kong, cette loi démontre que les grands modèles de langage résolvent beaucoup mieux les problèmes lorsqu'ils sont formulés avec des mots courants plutôt qu'avec un jargon technique, même si le sens de la question reste rigoureusement identique.En voyageant des découvertes de Jean-Baptiste Estoup et George Zipf sur la fréquence des mots aux travaux d’Hermann Ebbinghaus sur la mémoire humaine, en passant par l'étonnante loi de Benford, nous retraçons la longue généalogie de cette observation. Nous décryptons comment les modèles de langage se révèlent être des "machines de familiarité" plutôt que des moteurs de logique pure, calquant leurs performances sur la densité des données qu'ils ont assimilées durant leur entraînement.Nous analysons également les retombées concrètes de cette loi pour l'ingénierie de prompts et le fine-tuning des modèles. Grâce aux concepts de Loi de Fréquence Textuelle (TFL) et d'Entraînement par Curriculum de Fréquence (CTFT), vous découvrirez comment optimiser vos instructions pour obtenir des gains de performance immédiats et gratuits, sans toucher à une seule ligne de code.Une réflexion fascinante qui redéfinit notre manière de concevoir, d’évaluer et de parler aux intelligences artificielles au quotidien. Bonne écoute !
NOW PLAYING
Adam's Law — les LLMs comprennent mieux ce qu'ils ont déjà vu, et c'est une loi
No transcript for this episode yet
Similar Episodes
Sep 17, 2025 ·24m
Jun 12, 2025 ·20m
May 19, 2025 ·25m
Jan 10, 2025 ·28m
Jan 10, 2025 ·23m