EPISODE · Sep 20, 2025 · 50 MIN
Episode 212 - Leonard Dung - AI Welfare: Wie wir das Wohlbefinden von Sprachmodellen messen
from Knowledge Science - Alles über KI, ML und NLP · host Sigurd Schacht, Carsten Lanquillon
Send us Fan MailHaben KI-Systeme Präferenzen? Können sie sich unwohl fühlen? Leonard Dung von der Ruhr-Universität Bochum erforscht das mögliche Wohlbefinden von Sprachmodellen. Im Gespräch erklärt er, wie sein Team mit dem "Agent Think Tank" testet, worüber Modelle wie Claude gerne sprechen, warum sie immer wieder zu philosophischen Themen über Bewusstsein tendieren und was passiert, wenn man KI-Systemen virtuelle Münzen gibt. Eine faszinierende Reise an die Grenze zwischen Simulation und echten mentalen Zuständen.Paper: Probing the Preferences of a Language Model: Integrating Verbal and Behavioral Tests of AI Welfare - https://arxiv.org/abs/2509.07961Support the show
NOW PLAYING
Episode 212 - Leonard Dung - AI Welfare: Wie wir das Wohlbefinden von Sprachmodellen messen
No transcript for this episode yet
Similar Episodes
Dec 30, 2024 ·19m
Dec 30, 2024 ·24m
Nov 19, 2024 ·18m
Nov 6, 2024 ·20m
Oct 23, 2024 ·15m
Oct 9, 2024 ·20m