IA: Comprendre les SLM (Small Model Language) episode artwork

EPISODE · Feb 17, 2026 · 1H 17M

IA: Comprendre les SLM (Small Model Language)

from A la French

Peut-on battre les modèles de Google ou Meta avec seulement 4 GPU et une disquette Zip ? C’est le pari fou de notre invité.e qui nous explique comment le "Data Design" est en train de ringardiser le scraping massif du web.🥖 L'IA qui tient sur une disquette : La fin du gigantisme ?Dans cet épisode, on plonge dans le coeur de l'IA souveraine : pourquoi la qualité des données (tokens) prime sur la quantité, et comment les Small Language Models (SLM) vont permettre de décentraliser l'intelligence.🚀 Ce que vous allez apprendre :- Baguette-o-tron : Le modèle de 320M de paramètres qui raisonne mieux que des géants.- Data Design vs Scraping : Pourquoi "nettoyer" la donnée ne suffit plus, il faut la concevoir.- Le secret des données synthétiques : Comment éviter le "Model Collapse" (l'appauvrissement de l'IA).- Souveraineté : L'enjeu des bibliothèques nationales et de l'Open Data face au pillage des "Shadow Libraries".⏳ Timestamps pour naviguer :00:00 - Intro : Le format Pionnier/Pionnière de la tech04:20 - Indice 4 points : Qui est la chercheuse secrète ? 11:50 - Pourquoi le "Common Crawl" est pollué (cookies, copyright) 18:30 - Le crash des données : Le cas New York Times vs OpenAI 27:15 - Baguette-o-tron : Une IA performante sur disque Zip ! 35:40 - Données synthétiques : Ancrer l'IA dans le réel (Code & Math) 45:10 - L'IA comme "Primitive" : Pourquoi le local est l'avenir 52:00 - Les modèles hiérarchiques (HRM) et le système de pensée 1 & 2🔗 Liens et ressources :Playas : https://playas.frModèles & Datasets : Retrouvez "Common Corpus" sur Hugging Face.Vous préférez une IA géante dans le Cloud ou une IA agile sur votre téléphone ? On attend votre avis en commentaire ! 👇#IntelligenceArtificielle #SLM #OpenSource #TechFrançaise #ALaFrench #MachineLearning #SouverainetéNumériqueCréditsProductrice- Fatima IdhammouProduction exécutive : BKERéalisateur : Nicolas JaluCadreurs : Florian Kuenemann, Fairooze ShariffIngénieur du son : Quentin GomezChef monteur : Victor BourdonGénérique (images assistées par IA)Production : AurevoircharlieProduit par : Anne-Lise LanglaisRéalisateur / DA image : Olivier LelardouxMusique originale : Keryan SerrainConseillers éditoriaux : Ronan Letoqueux, NES ProductionRéseaux sociaux : Samir AkachaRemerciements : l’équipe de Néon Noir, Camille Hamez, Natacha Holtzhausser, , Elie Séonnet, Abdel-Hafid Cherrab, Paguy Shako Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Peut-on battre les modèles de Google ou Meta avec seulement 4 GPU et une disquette Zip ? C’est le pari fou de notre invité.e qui nous explique comment le "Data Design" est en train de ringardiser le scraping massif du web.🥖 L'IA qui tient sur une disquette : La fin du gigantisme ?Dans cet épisode, on plonge dans le coeur de l'IA souveraine : pourquoi la qualité des données (tokens) prime sur la quantité, et comment les Small Language Models (SLM) vont permettre de décentraliser l'intelligence.🚀 Ce que vous allez apprendre :- Baguette-o-tron : Le modèle de 320M de paramètres qui raisonne mieux que des géants.- Data Design vs Scraping : Pourquoi "nettoyer" la donnée ne suffit plus, il faut la concevoir.- Le secret des données synthétiques : Comment éviter le "Model Collapse" (l'appauvrissement de l'IA).- Souveraineté : L'enjeu des bibliothèques nationales et de l'Open Data face au pillage des "Shadow Libraries".⏳ Timestamps pour naviguer :00:00 - Intro : Le format Pionnier/Pionnière de la tech04:20 - Indice 4 points : Qui est la chercheuse secrète ? 11:50 - Pourquoi le "Common Crawl" est pollué (cookies, copyright) 18:30 - Le crash des données : Le cas New York Times vs OpenAI 27:15 - Baguette-o-tron : Une IA performante sur disque Zip ! 35:40 - Données synthétiques : Ancrer l'IA dans le réel (Code & Math) 45:10 - L'IA comme "Primitive" : Pourquoi le local est l'avenir 52:00 - Les modèles hiérarchiques (HRM) et le système de pensée 1 & 2🔗 Liens et ressources :Playas : https://playas.frModèles & Datasets : Retrouvez "Common Corpus" sur Hugging Face.Vous préférez une IA géante dans le Cloud ou une IA agile sur votre téléphone ? On attend votre avis en commentaire ! 👇#IntelligenceArtificielle #SLM #OpenSource #TechFrançaise #ALaFrench #MachineLearning #SouverainetéNumériqueCréditsProductrice- Fatima IdhammouProduction exécutive : BKERéalisateur : Nicolas JaluCadreurs : Florian Kuenemann, Fairooze ShariffIngénieur du son : Quentin GomezChef monteur : Victor BourdonGénérique (images assistées par IA)Production : AurevoircharlieProduit par : Anne-Lise LanglaisRéalisateur / DA image : Olivier LelardouxMusique originale : Keryan SerrainConseillers éditoriaux : Ronan Letoqueux, NES ProductionRéseaux sociaux : Samir AkachaRemerciements : l’équipe de Néon Noir, Camille Hamez, Natacha Holtzhausser, , Elie Séonnet, Abdel-Hafid Cherrab, Paguy Shako Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

NOW PLAYING

IA: Comprendre les SLM (Small Model Language)

0:00 1:17:35

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

MG Show MG Show The MG Show, hosted by Jeffrey Pedersen and Shannon Townsend, is a leading alternative media platform dedicated to uncovering the truth behind today’s most pressing political issues. Launched in 2019, the show has grown exponentially, offering unfiltered insights, comprehensive research, and real-time analysis. With a commitment to independent journalism and factual integrity, the MG Show empowers its audience with knowledge and encourages active participation in the political discourse. Ask A Spaceman Archives - 365 Days of Astronomy Ask A Spaceman Archives - 365 Days of Astronomy Podcasting Astronomy Every Day of the Year French Your Way Jessica: Native French teacher founder of French Your Way Boost your French listening skills and test your comprehension with this one of a kind series of podcasts. Get the chance to listen to a real conversation between native speakers talking at normal speed AND customise your learning experience through carefully designed sets of questions (2 levels of difficulty) available for download at www.frenchvoicespodcast.com. All interviews also come with the transcript. French teacher Jessica interviews native speakers of French from around the world who share a bit of their life and passion. Where else would you meet in one same place a French yoga teacher based in Melbourne, a soap manufacturer from Provence, or a couple cycling around the world? The Small Business Startup School – Business Notes | Financial Literacy | Retail Psychology – For Professionals & Entrepreneurs The Small Business Startup School Inc. Starting or buying a small business? While personal circumstances may vary, business patterns remain timeless. On The Small Business Startup School, we explore strategies, insights, and practical solutions to help entrepreneurs confidently navigate their journey.Hosted by Ola Williams—a retail entrepreneur, fintech founder, and financial coach with over two decades of experience—this podcast marries financial awareness and retail psychology with optimism to deliver actionable takeaways.Join us to learn, grow, and connect as we uncover the keys to business success.Let’s continue to learn together and be encouraged to keep on connecting!

Frequently Asked Questions

How long is this episode of A la French?

This episode is 1 hour and 17 minutes long.

When was this A la French episode published?

This episode was published on February 17, 2026.

What is this episode about?

Peut-on battre les modèles de Google ou Meta avec seulement 4 GPU et une disquette Zip ? C’est le pari fou de notre invité.e qui nous explique comment le "Data Design" est en train de ringardiser le scraping massif du web.🥖 L'IA qui tient sur une...

Can I download this A la French episode?

Yes, you can download this episode by clicking the download button on the episode player, or subscribe to the podcast in your preferred podcast app for automatic downloads.
URL copied to clipboard!