Séminaire : Apprendre un modèle de langue à partir de l'audio

from Informatique et sciences numériques (2023-2024) - Benoît Sagot · host Benoît Sagot

Collège de FranceBenoît SagotInformatique et sciences numériques (2023-2024)Année 2023-2024Séminaire : Apprendre un modèle de langue à partir de l'audioIntervenant :Emmanuel Dupoux, directeur d'études EHESS, chercheur METARésuméLa modalité orale est le canal le plus naturel pour les interactions linguistiques, mais les technologies langagières actuelles (TAL) se basent surtout sur l'écrit, nécessitant de grandes quantités de textes pour développer des modèles de langage. Même les assistants vocaux ou les systèmes de traduction de la parole utilisent le texte comme intermédiaire, ce qui est inefficace et limite la technologie aux langues dotées de ressources textuelles importantes. De plus, cela néglige les caractéristiques de la parole telles que le rythme et l'intonation. Pourtant, l'enfant arrive à apprendre sa ou ses langue(s) maternelle(s) bien avant d'apprendre à lire ou à écrire.Dans cette présentation, nous aborderons les avancées récentes en apprentissage de représentations audio qui ouvrent la voie à des applications TAL directement à partir de la parole sans aucun texte. Ces modèles peuvent capturer les nuances de la langue orale, y compris dans les dialogues. Nous discuterons également des défis techniques qui restent à relever pour reproduire un apprentissage qui approcherait celui du bébé humain.Emmanuel DupouxEmmanuel Dupoux est professeur à l'École des hautes études en sciences sociales (EHESS) et chercheur à Meta AI Labs. Il dirige l'équipe Cognitive Machine Learning à l'École normale supérieure (ENS). Il a obtenu un doctorat en sciences cognitives (EHESS), un master en informatique (université d'Orsay) et un diplôme d'ingénieur en télécommunication (Telecom Paris). Ses recherches mêlent science du développement, neurosciences cognitives et apprentissage automatique, avec un accent sur l'ingénierie inverse du langage et du développement cognitif des nourrissons à l'aide d'apprentissage non supervisé ou faiblement supervisé. Il est lauréat d'une bourse avancée de l'ERC, et a organisé une série de compétitions internationales en apprentissage machine inspiré par l'humain (Zero Resource Speech Challenge, 2015-2021; Intphys). Il est membre du programme CIFAR LMB, a une chaire PRAIRIE et Fellow ELLIS. Il est l'auteur de 150 articles dans des revues à comité de lecture en science cognitive et technologie du langage.

NOW PLAYING

0:00 54:46

1×

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

Share this episode

Similar Episodes

690. NHL-puls: Vad är det frågan om?!

Jun 13, 2026 ·69m

689. Analys: Björklöven 26/27

Jun 11, 2026 ·28m

688. Analys: Färjestad 26/27

Jun 9, 2026 ·27m

687. Krüger avslöjar Frondells sms

Jun 5, 2026 ·42m

686. NHL-puls: Den numera utopiska SHL-tanken

Jun 2, 2026 ·63m

685. VM-puls: Den norska lösprillan

May 27, 2026 ·33m

Similar Podcasts

Ils nous gavent ces écolos Raje Chronique réalisée par Jenny Bernard.« Ils nous gavent ces écolos » est l’émission pour celles et ceux qui écrasent les araignées car elles sont moches ou qu’elles font peur, qui pensent que les moustiques ne sont sur terre que pour piquer ou qui aiment les animaux, surtout bien cuits ! Ces épisodes de quelques minutes ont pour objectif de faire changer leur regard sur la biodiversité avec humour et légèreté ! PDF:Destruction of the Family Et Soh Chapter Seven from "How the Specter of Communism Is Ruling Our World" PDF:Infiltrating The West Et Soh Chapter Five from "How the Specter of Communism Is Ruling Our World" PDF:The Revolt Against God Et Soh Chapter Six from "How the Specter of Communism Is Ruling Our World"

Frequently Asked Questions

How long is this episode of Informatique et sciences numériques (2023-2024) - Benoît Sagot?

This episode is 54 minutes long.

When was this Informatique et sciences numériques (2023-2024) - Benoît Sagot episode published?

This episode was published on December 28, 2023.

What is this episode about?

Can I download this Informatique et sciences numériques (2023-2024) - Benoît Sagot episode?

Yes, you can download this episode by clicking the download button on the episode player, or subscribe to the podcast in your preferred podcast app for automatic downloads.

URL copied to clipboard!