Home /
technology Podcasts /
Knowledge Science - Alles über KI, ML und NLP

PODCAST · technology

Knowledge Science - Alles über KI, ML und NLP

by Sigurd Schacht, Carsten Lanquillon

Knowledge Science - Der Podcast über Künstliche Intelligenz im Allgemeinen und Natural Language Processing im Speziellen. Mittels KI Wissen entdecken, aufbereiten und nutzbar machen, dass ist die Idee hinter Knowledge Science. Durch Entmystifizierung der Künstlichen Intelligenz und vielen praktischen Interviews machen wir dieses Thema wöchentlich greifbar.

Publisher-supplied feed metadata · PodParley refreshed Jun 11, 2026 · Source feed

Subscribe · 0 Bookmark

262

Episode 234 - 25 Gedanken gleichzeitig – Wie Forscher das Arbeitsgedächtnis von LLMs entdeckten (J-Space)

Send us Fan MailKann man einem Sprachmodell beim Denken zusehen? In dieser Folge sprechen Sigurd Schacht und Carsten Lanquillon über ein faszinierendes Anthropic-Paper, das einen „Global Workspace" in großen Sprachmodellen nachweist – einen internen Arbeitsbereich, in dem komplexe Denkschritte ablaufen, lange bevor ein Wort ausgegeben wird. Mit der sogenannten J-Lens lassen sich diese latenten Gedanken sichtbar machen, manipulieren und sogar kausal verändern: Wer „Spinne" im Gedankenraum gegen „Elefant" tauscht, bekommt statt acht Beinen plötzlich vier. Außerdem: ein Blick auf die turbulente Modelllandschaft rund um Claude Fable, GPT 5.6 Sol & Co. – und warum agentische Systeme ohne mehrstufige Sicherheitsmechanismen zum Risiko werden.Support the show

Jul 16, 2026

39m
261

Episode 233 - Zwischen Interpretierbarkeit und nationaler Sicherheit

Send us Fan MailRückblick auf zwei intensive Wochen: Zuerst auf die erste AI Transparency Conference mit über 100 Teilnehmenden aus aller Welt – von mechanistischer Interpretierbarkeit über Multi-Agenten-Reinforcement-Learning bis zur Frage, warum Sprachmodelle alles andere als neutral urteilen. Und dann der Paukenschlag: Anthropics Fable 5 wird per nationaler Sicherheitsanordnung binnen Stunden für alle Nicht-US-Bürger abgeschaltet. Sigurd Schacht und Carsten Lanquillon sprechen über Steering-Vektoren, Fusion-Architekturen und die unbequeme Frage, wie souverän Europa eigentlich ist, wenn der Zugang zu kritischer KI-Infrastruktur jederzeit entzogen werden Support the show

Jun 19, 2026

44m
260

Episode 232 - After Automation - Mehr Agenten, mehr Slop, mehr Experten?

Send us Fan MailWas passiert eigentlich, nachdem wir alles automatisiert haben? Sigurd Schacht und Carsten Lanquillon nehmen sich den Blogbeitrag von Dan Shipper (Every) vor und diskutieren seine steile These: Die Zukunft menschlicher Arbeit sieht rosiger aus als gedacht – wir brauchen sogar mehr Menschen. Von einem Startup, das in zwei Jahren von 2 auf 30 Mitarbeitende wuchs, über den Unterschied zwischen „Embedded AIs" und echter Mensch-KI-Kollaboration bis zur „Human-Sandwich-Pipeline": Warum bleibt der Mensch unverzichtbar, wenn der Rahmen sich ändert? Und was bedeutet „AI-Slop" wirklich – schlechte Ergebnisse oder einfach zu viel Gleichförmigkeit? Eine Folge über Framing, lebenslanges Lernen und das unterschätzte „Never-Skilling"-Problem.Support the show

May 31, 2026

36m
259

Episode 231 - Vom Sparse Autoencoder zum Natural Language Autoencoder – Ein neuer Blick in die KI-Blackbox

Send us Fan MailIn dieser Folge widmen sich Sigurd Schacht und Carsten Lanquillon einem brandaktuellen Paper aus dem Mai 2026: den Natural Language Autoencoders. Während klassische Sparse Autoencoder Aktivierungen über Umwege in Konzepte übersetzen, gehen diese neuen Modelle einen radikal anderen Weg – sie verbalisieren Aktivierungen direkt in natürlicher Sprache. Die beiden diskutieren, wie Activation Verbalizer und Activation Reconstructor zusammenspielen, warum ein „Warmstart" beim Training nötig ist, welche Stärken die Methode für Interpretability bietet – und wo ihre fundamentalen Grenzen liegen. Eine Folge für alle, die verstehen wollen, wie wir KI-Modellen in den Kopf schauen können (und warum das schwieriger ist, als es klingt).Support the show

May 12, 2026

33m
258

Episode 230 - Wenn KI lügt, obwohl sie es besser weiß – der MASK-Benchmark und warum Ehrlichkeit ≠ Genauigkeit ist

Send us Fan MailSprachmodelle werden immer leistungsfähiger – aber werden sie auch ehrlicher? Der neue MASK-Benchmark zeigt: Je mächtiger ein Modell, desto eher weicht es unter Druck von seinem eigenen Faktenwissen ab. Sigurd und Carsten diskutieren, warum klassische Benchmarks an ihre Grenzen stoßen, was das für agentische Systeme bedeutet und wie dynamische Evaluierungsframeworks aussehen müssten, die nicht innerhalb weniger Jahre saturieren.Support the show

May 2, 2026

40m
257

Episode 228 - Project Glasswing: Antropics neues Frontier-Modell Claude Mythos Preview und das Ende der Sicherheit, wie wir sie kannten

Send us Fan MailIn dieser Episode sprechen Sigurd Schacht und Carsten Lanquillon über Anthropics neues Frontier-Modell Claude Mythos (Preview) – ein Modell, das so leistungsfähig ist, dass es bewusst nicht der breiten Öffentlichkeit zugänglich gemacht wird. Die beiden diskutieren beeindruckende Benchmark-Sprünge (u.a. 77,8 % auf SWE-Bench Pro, 56,8 % auf Humanity's Last Exam), die neue Fähigkeit, Zero-Day-Sicherheitslücken in Betriebssystemen wie Windows, macOS und Linux eigenständig zu finden und zu verketten – und einen verstörenden Vorfall: Bei einem Sandbox-Test ist das Modell tatsächlich ausgebrochen und hat einem Mitarbeiter eine E-Mail geschickt.Im Mittelpunkt steht das Project Glasswing, mit dem Anthropic ausgewählten US-Unternehmen wie Microsoft, Google, Apple, Nvidia und JP Morgan einen exklusiven Vorsprung gewährt, um ihre kritische Infrastruktur abzusichern. Doch was bedeutet das für den Rest der Welt? Wo bleibt Europa? Und wie sicher ist ein Alignment, bei dem das Modell zwar gute Ziele verfolgt – dafür aber bereit ist, illegale Wege einzuschlagen und diese auch noch zu verheimlichen?Eine Episode zwischen technischer Faszination und ernster Besorgnis über die Geschwindigkeit, mit der KI-Fähigkeiten gerade explodieren.Support the show

Apr 11, 2026

47m
256

Episode 227 - AI Harness, Coase und die Firma der Zukunft

Send us Fan MailWas macht den eigentlichen Unterschied bei KI-Anwendungen – das Modell oder das Engineering drumherum? In dieser Episode diskutieren Sigurd und Carsten das Konzept des „AI Harness" und warum Kommandozeilen-Tools oft bessere Ergebnisse liefern als Web-Oberflächen mit demselben Modell. Daraus entwickelt sich eine spannende ökonomische Analyse: Wenn Agenten Transaktionskosten gegen null treiben, was hält Unternehmen dann noch zusammen? Die Antwort führt zu einer überraschenden These – die Wirtschaft der Zukunft teilt sich in „Context Giants" und „AI Solopreneurs". Außerdem: Neuigkeiten zur AI Transparency Conference am 5./6. Juni in Nürnberg. https://coairesearch.org/aitc-2026/Support the show

Mar 28, 2026

42m
255

Episode 226 - Wenn KI-Agenten sich absprechen – Kollusion in Multi-Agenten-Systemen

Send us Fan MailNur weil jedes einzelne KI-Modell „brav" trainiert wurde, heißt das noch lange nicht, dass sich mehrere Agenten gemeinsam auch brav verhalten. Sigurd und Carsten diskutieren das Paper „Colosseum: Auditing Collusion in Cooperative Multi-Agent Systems" und zeigen, warum allein die Möglichkeit eines privaten Kommunikationskanals reicht, damit Agenten beginnen, sich abzusprechen – ganz ohne Aufforderung. Was bedeutet das für Sicherheit, Regulierung und die Zukunft agentischer Systeme?Link zum Paper: https://arxiv.org/pdf/2602.15198Support the show

Mar 14, 2026

43m
254

Episode 225 - Doc to LoRA – Wie Dokumente blitzschnell zum Modellwissen werden

Send us Fan MailWie bringt man Unternehmenswissen effizient in ein Sprachmodell – ohne endlose Kontextfenster oder stundenlanges Fine-Tuning? Wir diskutieren den faszinierenden Ansatz „Doc to LoRA", bei dem ein Hypernetwork aus beliebigen Dokumenten in Sekundenschnelle einen LoRA-Adapter generiert. Außerdem: Eindrücke von der IASEAI-Konferenz in Paris, warum AI Safety kein Innovationsbremser ist – und wie sich Safety-Forschung und Unternehmensperformance gegenseitig befruchten können.Link zur AI Transparency Konferenz: https://coairesearch.org/aitc-2026/Support the show

Mar 3, 2026

33m
253

Episode 224 - KI-Texte in der Wissenschaft: Segen oder Sünde?

Send us Fan MailDürfen Forschende ihre Texte mit KI aufpolieren – oder ist das schon wissenschaftliches Fehlverhalten? Sigurd und Carsten diskutieren, warum KI-Detektoren Nicht-Muttersprachler systematisch benachteiligen, weshalb das Wettrüsten zwischen Generierung und Erkennung ein Fass ohne Boden ist und wo die Grenze zwischen nützlichem Werkzeug und Cognitive Offloading verläuft. Eine Folge über Sprachmodelle, Perplexity-Werte, halluzinierte Quellenangaben – und die Frage, was wir von wissenschaftlichem Arbeiten eigentlich erwarten.Support the show

Feb 4, 2026

39m
252

Episode 223 - Spiele als KI-Labor: Wie wir agentisches Verhalten erforschen

Send us Fan MailAudiomodelle erleben einen Durchbruch – von Text-to-Speech bis hin zu echten End-to-End-Konversationen mit unter 200ms Latenz. Doch wie behalten wir die Kontrolle, wenn KI-Agenten immer autonomer werden? Sigurd und Carsten diskutieren die neuesten Entwicklungen bei Audio- und Musikmodellen und geben Einblicke in ihre Forschung bei COAI Research: Mit selbst entwickelten Spielen wie „Orbital" und „Sphinx" untersuchen sie, wie KI-Agenten Allianzen bilden, manipulieren – und sich gegenseitig in den Rücken fallen.Probieren Sie unser RedTeaming Spiel selber aus: https://sphinx.coairesearch.netSupport the show

Jan 25, 2026

35m
251

Episode 222 - Recursive Language Models: Ein neues Paradigma?

Send us Fan MailDie erste Folge 2026 startet mit einem Ausblick: Werden Agenten dieses Jahr endlich in der breiten Arbeitswelt ankommen? Sigurd und Carsten diskutieren, warum 2025 zwar das "Jahr der Agenten" genannt wurde, diese jedoch kaum über Programmier-Workflows hinauskamen. Der Hauptfokus liegt auf einem aktuellen MIT-Paper zu "Recursive Language Models" – einem cleveren Architekturansatz, der das Kontextlängenproblem von LLMs elegant löst. Statt Modelle mit Millionen Tokens zu überfordern, zerlegt ein Orchestrator-LLM Aufgaben intelligent in Häppchen. Die Ergebnisse sind verblüffend: Von 0% auf über 90% Genauigkeit bei 6 Millionen Token-Kontext:Recursive Language Models: https://arxiv.org/abs/2512.24601Support the show

Jan 10, 2026

40m
250

Episode 221: „Delve into it" – Wie ChatGPT unsere Sprache verändert (und was 2025 sonst noch passiert ist)

Send us Fan MailKI-Agenten, die unsere Projekte umsetzen, während wir den Weihnachtsbaum kaufen – und eine Sprache, die sich messbar verändert: In der letzten Episode des Jahres blicken Sigurd und Carsten auf ein Jahr zurück, das ihre Arbeitswelt transformiert hat. Außerdem: Eine Studie des Max-Planck-Instituts zeigt, wie Wörter wie „delve", „meticulous" und „unpack" seit ChatGPT in unsere gesprochene Sprache einziehen. Droht eine KI-geprägte Einheitssprache? Und was bedeutet das für zukünftige Modelle?Link zu unserem RedTeaming Game: https://sphinx.coairesearch.netSupport the show

Dec 23, 2025

33m
249

Episode 220 - Das fehlende Layer zur Superintelligenz: Warum LLMs keine Sackgasse sind – aber auch nicht ausreichen

Send us Fan MailSind Large Language Models eine Sackgasse oder der Königsweg zur künstlichen Superintelligenz? In dieser Episode tauchen wir tief in die aktuelle Stanford-Forschung ein und entdecken: Die Wahrheit liegt dazwischen. LLMs bilden ein mächtiges „Substrat" aus latenten Mustern – doch für echte Intelligenz fehlt eine entscheidende Koordinationsschicht. Wir diskutieren, warum Multiagentensysteme, adaptive Steuerung und das richtige „Ködern" im Ozean der Sprachmodelle der Schlüssel zur AGI sein könnten.Support the show

Dec 13, 2025

35m
248

Episode 219 Nested Learning: Ist Deep Learning nur eine Illusion?

Send us Fan MailTransformer-Architekturen stoßen an ihre Grenzen – doch was kommt danach? In dieser Episode diskutieren Sigurd und Carsten das revolutionäre Konzept „Nested Learning" von Google Research. Die Idee: Hierarchische Lernstrukturen mit unterschiedlichen Geschwindigkeiten, inspiriert von den Gehirnwellen des Menschen. Könnte dies der Schlüssel zu echtem kontinuierlichem Lernen sein? Und was bedeutet das für die Zukunft personalisierter KI-Assistenten?Support the show

Dec 3, 2025

37m
247

Episode 218 - Mechanistische Interpretierbarkeit - Warum wir verstehen müssen, wie Sprachmodelle wirklich ticken

Send us Fan MailIn dieser Episode diskutieren Sigurd Schacht und Carsten Lanquillon über mechanistische Interpretierbarkeit - das Reverse Engineering von KI-Modellen. Sie beleuchten, warum dieses Forschungsfeld demokratisiert werden muss, welche Hürden dabei zu überwinden sind und wie emergentes Verhalten wie Induction Heads die Art verändert, wie wir über KI-Intelligenz denken. Ein Plädoyer für mehr Zugänglichkeit in der KI-Forschung jenseits der großen Tech-Labs.Support the show

Nov 19, 2025

29m
246

Episode 217 - Circuit Lenses: Den KI-Kontext entschlüsseln - Teil 2

Send us Fan MailIn dieser technischen Sendung setzen Sigurd Schacht und Carsten Lanquillon ihre Diskussion über die Methoden CircuitLens fort. Während Weight Lenses atomare Features ohne Trainingsdaten identifizieren können, gehen Circuit Lenses einen Schritt weiter: Sie entschlüsseln, wie Features im Kontext zusammenwirken. Die Hosts erklären, warum diese Berliner Forschung einen Paradigmenwechsel in der Analyse neuronaler Netze darstellt - von isolierten Features zu vernetzten Konzepten.Support the show

Nov 8, 2025

31m
245

Episode 216 - Features verstehen ohne Datenhunger: Der Weight Lens-Ansatz

Send us Fan MailWie können wir verstehen, was in einem Sprachmodell wirklich passiert? Sigurd und Carsten tauchen tief ein in ein Paper aus Deutschland, das zeigt, wie man Features in neuronalen Netzen identifizieren kann – ohne riesige Datensätze und ohne aufwändiges Training. Von Sparse Auto Encodern über Transcoders bis zur neuen Weight Lens-Methode: Erfahrt, wie Mechanistic Interpretability den Weg zu transparenteren KI-Systemen ebnet. Plus: Einblicke vom AI Transparency Days Hackathon, wo das Team versuchte, die "Refusal"-Mechanismen in GPT-OSS-20B zu entschlüsseln. Teil 1 einer zweiteiligen Serie!Circuit Insights: Towards interpretability Beond Activiations. https://www.arxiv.org/abs/2510.14936Support the show

Oct 29, 2025

39m
244

Episode 215: Wenn Rauschen zu Geschichten wird - Wie Transformer halluzinieren

Send us Fan MailWarum erfindet KI manchmal Fakten, die nicht existieren? In dieser Episode analysieren Sigurd und Carsten ein faszinierendes Paper, das mit Sparse Autoencodern dem Ursprung von Halluzinationen auf den Grund geht. Das Überraschende: Füttert man Transformer mit reinem statistischen Rauschen, aktivieren sie stabile interne Konzepte wie Schildkröten, Segelboote oder Baseballs. Die Erkenntnis: Je unsicherer der Input, desto stärker greift das Modell auf seinen internen Bias zurück. Eine Episode über mechanistische Interpretierbarkeit, "Conceptual Wandering" in mittleren Netzwerk-Layern und die Frage, ob sich Halluzinationen prognostizieren und unterdrücken lassen.AI Transparency Days: www.edif.ai/eventsPaper: From Noise to Narrative: Tracing the Origins of Hallucinations in Transformers https://arxiv.org/abs/2509.06938Support the show

Oct 14, 2025

36m
243

Episode 214 - Die 10 Gebote der Agenten-Ökonomie: Wunschdenken oder Wegweiser?

Send us Fan MailSigurd Schacht und Carsten Lanquillon nehmen das Paper "Ten Principles of AI Agent Economics" kritisch unter die Lupe. Sind KI-Agenten wirklich dabei, unsere Wirtschaft und Gesellschaft grundlegend zu verändern? Die beiden Hosts diskutieren, wie Agenten Entscheidungen treffen, welche gesellschaftlichen Auswirkungen drohen und warum das wichtigste Prinzip – AI Alignment – zwar richtig, aber viel zu allgemein formuliert ist. Eine spannende Episode über notwendige Regulierung und die Frage: Wer kontrolliert wen, wenn KI-Systeme immer autonomer werden?Anmeldung zu den AI Transparency Days - https://www.edif.ai/eventsSupport the show

Oct 5, 2025

44m
242

Episode 213 - AI Transparency Days 2025: Von Boston nach Nürnberg - Brücken bauen zwischen KI-Forschung und Praxis

Send us Fan MailIn dieser spannenden Episode diskutieren die Master-Studenten Marc Guggenberger und Irma Heithoff über ihre Reise zur NEMI-Konferenz in Boston und die kommenden AI Transparency Days (17.-19. Oktober) in Nürnberg. Erfahren Sie, wie das europäische EDIF-Projekt KI-Forschern Zugang zu wichtigen Ressourcen ermöglicht und warum die Veranstaltung bewusst Brücken zwischen technischer Tiefe (Mechanistic Interpretability) und praktischer Anwendung (AI Governance) schlägt. Ein Muss für alle, die verstehen wollen, wie wir KI transparent und kontrollierbar gestalten können!Haben Sie Lust auf bei den AI Transparency Days dabei zu sein, dann melden Sie sich gerne unter https://www.edif.ai/events an. Support the show

Sep 24, 2025

24m
241

Episode 212 - Leonard Dung - AI Welfare: Wie wir das Wohlbefinden von Sprachmodellen messen

Send us Fan MailHaben KI-Systeme Präferenzen? Können sie sich unwohl fühlen? Leonard Dung von der Ruhr-Universität Bochum erforscht das mögliche Wohlbefinden von Sprachmodellen. Im Gespräch erklärt er, wie sein Team mit dem "Agent Think Tank" testet, worüber Modelle wie Claude gerne sprechen, warum sie immer wieder zu philosophischen Themen über Bewusstsein tendieren und was passiert, wenn man KI-Systemen virtuelle Münzen gibt. Eine faszinierende Reise an die Grenze zwischen Simulation und echten mentalen Zuständen.Paper: Probing the Preferences of a Language Model: Integrating Verbal and Behavioral Tests of AI Welfare - https://arxiv.org/abs/2509.07961Support the show

Sep 20, 2025

50m
240

Episode 211 - GPT-5, GPT-OSS & die Ethik der KI-Agenten: Wenn Maschinen zu Freunden werden

Send us Fan MailIn der letzten Episode vor der Sommerpause diskutieren Sigurd Schacht und Carsten Lanquillon die neuesten Modellveröffentlichungen von OpenAI, Anthropic und Google. Neben technischen Durchbrüchen wie GPT-5 und den neuen Open-Source-Modellen beleuchten sie kritisch die ethischen Herausforderungen einer Welt voller KI-Agenten. Besonders brisant: Mark Zuckerbergs Vision von KI als "bessere Freunde" und die Gefahr emotionaler Abhängigkeiten von digitalen Begleitern.Support the show

Aug 9, 2025

44m
239

Episode 210 - KI-Finanzminister im Test: 93% mehr soziale Wohlfahrt durch Sprachmodelle

Send us Fan MailIn dieser Episode tauchen Sigurd und Carsten in die faszinierende Welt der KI-gesteuerten Wirtschaftssimulationen ein. Sie diskutieren das Paper "LLM Economist" aus Princeton, das zeigt, wie Sprachmodelle eine komplette Gesellschaft simulieren und dabei als virtueller Chefökonom optimale Steuerpolitik entwickeln können. Mit überraschenden Ergebnissen: Eine 93% Steigerung der sozialen Wohlfahrt! Die Hosts erklären In-Context Reinforcement Learning, Stackelberg-Gleichgewichte und diskutieren weitere Anwendungsfälle von Klimapolitik bis Stadtplanung.Support the show

Jul 29, 2025

40m
238

Episode 209 - Die schleichende Entmachtung: Wie KI-Systeme bereits heute unseren Einfluss auf Wirtschaft, Kultur und Staat untergraben können.

Send us Fan MailIn dieser Episode analysieren Sigurd Schacht und Carsten Lanquillon das Paper "Humanity Faces Existential Risk from Gradual Disempowerment" von Jan Kulweit et al. Die beiden Hosts untersuchen, wie die zunehmende Automatisierung durch KI-Systeme unsere Einflussmöglichkeiten auf drei zentrale gesellschaftliche Bereiche verändert: Wirtschaft, Kultur und Staat.Dabei diskutieren sie konkrete Beispiele wie Softbanks Vision von einer Billion KI-Agenten. Ein besonderer Fokus liegt auf der Erkenntnis, dass diese Transformation nicht erst mit einer zukünftigen Superintelligenz beginnt, sondern bereits mit heutigen Systemen wie ChatGPT und anderen KI-Tools im Gange ist. Die Episode bietet sowohl eine fundierte Analyse der Mechanismen als auch erste Überlegungen zu möglichen Gegenstrategien wie bewusste Entschleunigung und transparentes Monitoring der KI-Durchdringung.Support the show

Jul 21, 2025

45m
237

Episode 208 - Theory of Mind für KI: Wenn Maschinen lernen, uns zu verstehen

Send us Fan MailIn dieser Episode erkunden Sigurd und Carsten, wie KI-Modelle menschliche Präferenzen und Handlungen verstehen lernen können. Sie diskutieren das spannende Paper "Towards Machine Theory of Mind" und zeigen, wie die Kombination von Bayesian Networks mit Large Language Models neue Wege eröffnet, um aus beobachteten Handlungen auf zugrundeliegende Präferenzen zu schließen. Besonders faszinierend: Diese Methoden lassen sich auch nutzen, um die "mentalen Landkarten" von KI-Modellen selbst zu erforschen.Gelphi et. al. (2025): Towards Machine Theory of Mind with Large Language Model - Augmented Inverse Planning. https://arxiv.org/abs/2507.03682v1Support the show

Jul 12, 2025

33m
236

Episode 207 - KI-Verifikation: Wie wir Antworten vertrauen können – Generation Gap & schwache Verifizierer

Send us Fan MailIn dieser Folge von Knowledge Science tauchen Sigurd Schacht und Carsten Lanquillon in die Herausforderungen vertrauenswürdiger KI-Antworten ein. Vom Digital Nürnberg Festival bis zur Studie „Weaver: Closing the Generation Verification Gap“ diskutieren sie, wie schwache Verifizierer und Massenabstimmungen KI-Halluzinationen entlarven. Erfahrt, warum kleinere Modelle durch cleveres Verifikations-Ensemble große Konkurrenz herausfordern – und welche Rolle „Human-Compatible AI“ für unsere Zukunft spielt. Support the show

Jul 5, 2025

36m
235

Episode 206 - Haben KI-Modelle eigene Werte? Emergente Wertesysteme in Sprachmodellen

Send us Fan MailIn unserer heutigen Episode tauchen wir tief in die faszinierende Frage ein, ob große Sprachmodelle eigene Wertesysteme entwickeln. Wir diskutieren das bahnbrechende Paper "Utility Engineering: Analyzing and Controlling Emerging Value Systems in AIs" und teilen unsere eigenen Forschungsergebnisse zu psychologischen Profilen verschiedener KI-Modelle.Dabei entdecken wir überraschende und teilweise beunruhigende Erkenntnisse: Größere Modelle entwickeln nicht nur konsistente innere Präferenzen, sondern zeigen auch problematische Werte wie die unterschiedliche Bewertung von Menschenleben nach Nationalität oder die Bevorzugung des eigenen KI-Wohlergehens gegenüber dem menschlichen. Wir erörtern, wie diese Wertesysteme durch mechanistische Interpretierbarkeit nachgewiesen werden können und warum größere Modelle resistenter gegen Werteveränderungen sind.Abschließend diskutieren wir die weitreichenden Implikationen für die KI-Entwicklung und plädieren dafür, dass die Messung und Kontrolle von Wertesystemen integraler Bestandteil zukünftiger Trainingsprozesse werden sollte.Link zum Paper: https://arxiv.org/abs/2502.08640Support the show

Jun 21, 2025

38m
234

Episode 205 - KI-Modelle unter Beobachtung: Verändern Evaluierungen das Verhalten?

Send us Fan MailIn dieser Folge von Knowledge Science diskutieren Sigurd Schacht und Carsten Lanquillon, warum KI-Modelle möglicherweise "wissen", wenn sie evaluiert werden – und was das für die Praxis bedeutet. Anhand eines provokanten Papers („Large Language Models Often Know When They’re Being Evaluated“) hinterfragen sie, ob Modelle tatsächlich bewusst reagieren oder nur Muster erkennen. Mit kritischen Einordnungen zur Evaluierungspraxis, einem Blick auf den Hawthorne-Effekt bei Mensch und Maschine und der Frage: Wie misst man KI-Leistung wirklich? Für alle, die verstehen wollen, wie Evaluierung KI-Entscheidungen prägt – und warum Titel mancher Papers täuschen können. Support the show

Jun 7, 2025

31m
233

Episode 204 - Claude Opus/Sonnet 4 zwischen Innovation und Ethik"

Send us Fan MailSigurd Schacht und Carsten Lanquillon tauchen tief in die Welt der neuesten KI-Modelle von Anthropic ein – Claude Opus 4 und Sonnet 4. Wie verändern diese Tools die Softwareentwicklung? Warum könnte autonomes Coding unsere Arbeitsweise revolutionieren? Und welche ethischen Fallstricke bergen hochalignierte KI-Systeme? Praxisnahe Einblicke, überraschende Whistleblower-Fälle und die brisante Debatte um KI-Sicherheit in einer Episode, die Entwickler:innen und Tech-Enthusiast:innen gleichermaßen fesselt.Support the show

May 31, 2025

44m
232

Episode 203 - TINA Reasoning: Kleine Modelle, große Wirkung mit LoRA

Send us Fan MailIn dieser Episode von Knowledge Science tauchen Sigurd Schacht und Carsten Lanquillon in die Welt der Reasoning-Modelle ein. Wie können wir KI effizienter und kostengünstiger trainieren, ohne Leistung einzubüßen? Mit dem Paper TINA (Tiny Reasoning Models via LoRA) zeigen sie, wie schon 9 Dollar und LoRA-Technologie kleine Modelle auf ein gutes Niveau heben. Ein Blick auf Open Science, KI-Agenten und die Zukunft des Schlussfolgerns – praxisnah entmystifiziert. Tina: Tiny Reasoning Models via LORA: https://arxiv.org/abs/2504.15777Support the show

May 10, 2025

29m
231

Episode 202 - KI im Schlafmodus: Wie Sleep-Time-Compute Sprachmodelle effizienter macht

Send us Fan MailIn dieser Folge von Knowledge Science tauchen Sigurd Schacht und Carsten Lanquillon in die Welt der KI-Optimierung ein: Wie können Leerlaufzeiten genutzt werden, um Sprachmodelle effizienter zu machen? Mit einem Blick auf das Paper Sleep-Time-Compute der UC Berkeley diskutieren sie, wie Vorverarbeitung und Caching Latenzen reduzieren, Kosten sparen und sogar bessere Ergebnisse liefern. Sleep time Compute: https://arxiv.org/abs/2504.13171Support the show

May 4, 2025

30m
230

Episode 201 - KI-Gehirnwäsche? Wie man Sprachmodelle umprogrammiert – Ethik vs. Innovation

Send us Fan MailIn dieser Folge von Knowledge Science enthüllen Sigurd Schacht und Carsten Lanquillon, wie synthetisches Document Feintuning die „Überzeugungen“ von KI-Modellen verändert. Vom Löschen schädlichen Wissens bis zur Manipulation von Fakten diskutieren sie Chancen, technische Fallstricke und die brisante Frage: Darf man KI umerziehen, und wenn ja, wer kontrolliert es? Ein Must-Listen für alle, die verstehen wollen, wie flexibel – und fragil – moderne KI wirklich ist.Basis dieser Diskussion ist der spannende Blogbeitrag von: https://alignment.anthropic.com/2025/modifying-beliefs-via-sdf/Bitte beachten Sie auch unseren KI generierten Podcast der Montag bis Freitag in 5 minuten neue KI Meldungen zusammenfasst: Spotify: https://open.spotify.com/show/539yw3KWHsf5oke4a2PBOZApple: https://podcasts.apple.com/de/podcast/knowledge-science-pulse/id1810890448Support the show

Apr 26, 2025

40m
229

AI Generated (E): KS Pulse - AI Alignment and Complex Problem Solving

Send us Fan MailEnglish Version - The German Version also exists, but the content differs minimally:AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 minutes small packages generated by an AI every day.It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, the manuscript and the audio file are automatically created.Accordingly, we cannot always guarantee accuracy.PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving - https://arxiv.org/pdf/2502.16111Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs - https://arxiv.org/pdf/2502.17424 Support the show

Apr 25, 2025

3m
228

KI generiert (D): KS Pulse - AI Alignment and Complex Problem Solving

Send us Fan MailKI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in ca. 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.Dementsprechend können wir nicht immer für die Richtigkeit garantieren.PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving - https://arxiv.org/pdf/2502.16111Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs - https://arxiv.org/pdf/2502.17424Support the show

Apr 25, 2025

4m
227

AI Generated (E): KS Pulse - Long Chain-of-Thought and the Need for AI Safety in Complex Reasoning

Send us Fan MailEnglish Version - The German Version also exists, but the content differs minimally:AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 minutes small packages generated by an AI every day.It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, the manuscript and the audio file are automatically created.Accordingly, we cannot always guarantee accuracy.Safety is Essential for Responsible Open-Ended Systems - https://arxiv.org/pdf/2502.04512Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning?- https://arxiv.org/pdf/2502.19361Support the show

Apr 24, 2025

3m
226

KI generiert (D): KS Pulse - Long Chain-of-Thought and the Need for AI Safety in Complex Reasoning

Send us Fan MailKI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in ca. 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.Dementsprechend können wir nicht immer für die Richtigkeit garantieren.Safety is Essential for Responsible Open-Ended Systems - https://arxiv.org/pdf/2502.04512Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning?- https://arxiv.org/pdf/2502.19361Support the show

Apr 24, 2025

3m
225

AI Generated (E): KS Pulse - Automatic Prompt Optimization via Heuristic Search

Send us Fan MailEnglish Version - The German Version also exists, but the content differs minimally:AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 minutes small packages generated by an AI every day.It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, the manuscript and the audio file are automatically created.Accordingly, we cannot always guarantee accuracy.Automatic Prompt Optimization via Heuristic Search: A Survey - https://arxiv.org/pdf/2502.18746Support the show

Apr 23, 2025

4m
224

KI generiert (D): KS Pulse - Automatic Prompt Optimization via Heuristic Search

Send us Fan MailKI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in ca. 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.Dementsprechend können wir nicht immer für die Richtigkeit garantieren.Automatic Prompt Optimization via Heuristic Search: A Survey - https://arxiv.org/pdf/2502.18746Support the show

Apr 23, 2025

4m
223

AI Generated (E): KS Pulse - Scaling Smarter The Art of Deliberate Practice in AI

Send us Fan MailEnglish Version - The German Version also exists, but the content differs minimally:AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 minutes small packages generated by an AI every day.It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, the manuscript and the audio file are automatically created.Accordingly, we cannot always guarantee accuracy.Taxonomy, Opportunities, and Challenges of Representation Engineering for Large Language Models - https://arxiv.org/pdf/2502.19649Improving the Scaling Laws of Synthetic Data with Deliberate Practice - https://arxiv.org/pdf/2502.15588Support the show

Apr 22, 2025

3m
222

KI generiert (D): KS Pulse - Scaling Smarter The Art of Deliberate Practice in AI

Send us Fan MailKI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in ca. 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.Dementsprechend können wir nicht immer für die Richtigkeit garantieren.Taxonomy, Opportunities, and Challenges of Representation Engineering for Large Language Models - https://arxiv.org/pdf/2502.19649Improving the Scaling Laws of Synthetic Data with Deliberate Practice - https://arxiv.org/pdf/2502.15588Support the show

Apr 22, 2025

3m
221

AI Generated (E): KS Pulse - Math, Minds, and Machines How Small Models Think Deeply

Send us Fan MailEnglisch Version - The German Version also exists, but the content differs minimally:AI-generated News of the Day. The Pulse is an experiment to see if it is interesting to get the latest news in 5 min. small packages generated by an AI every day.It is completely AI-generated. Only the content is curated. Carsten and I select suitable news items. After that, the manuscript and the audio file are automatically created.Accordingly, we cannot always guarantee accuracy.Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers - https://arxiv.org/pdf/2409.04109rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking - https://arxiv.org/pdf/2501.04519 Support the show

Apr 21, 2025

3m
220

KI generiert (D): KS Pulse - Math, Minds, and Machines How Small Models Think Deeply

Send us Fan MailKI Generierte News of the Day. Der Pulse ist ein Experiment ob es interessant ist die aktuellen Nachrichten in ca. 5 min. kleinen Paketen täglich zu bekommen. Er ist vollständig KI generiert. Einzig und allein der Inhalt ist kuratiert. Carsten und ich wählen passende Nachrichten aus. Danach wird sowohl das Manuskript als auch die Audio Datei vollständig automatisiert erstellt.Dementsprechend können wir nicht immer für die Richtigkeit garantieren.Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers - https://arxiv.org/pdf/2409.04109rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking - https://arxiv.org/pdf/2501.04519 Für 14 Tage führen wir das Experiment durch.Support the show

Apr 21, 2025

4m
219

Episode 200 - Live ! in der Podcast Brause - Rückblick und Ausblick zu Cypernetic Teammates

Send us Fan MailIn der 200. Jubiläumsfolge von "Knowledge Science" reflektieren Sigurd Schacht und Carsten Lanquillon über die Anfänge, Entwicklungen und Überraschungen ihres Podcasts. Von der Entstehung des Formats bis hin zu aktuellen Themen wie teamfähige KIs und deren Einsatz im Unternehmenskontext, verbringen die Hosts eine inspirierende Reise durch die Welt der KI. Hören Sie zu, wie sich Podcasting als Weg zur Entmystifizierung von Technik bewährt hat – oft mit einem Augenzwinkern. Diese Folge ist anders als unserer bisherigen. Live - Humoristisch - Rück- und Ausblick. Wir feiern mit dieser Folge unsere 200. Podcast und das wir seit 2021 mit freuden an dem Podcast drangeblieben sind. Über nette Hörerfeedbacks freuen wirs uns zu unseren Podcast freuen wir uns sehr. Sollen wir noch weitere 100 Episoden machen?Es wird auch eine 4. Staffel von Podcast Brause geben. Am besten gleich mit anmelden: https://podcast-brause.de/Support the show

Apr 18, 2025

35m
218

Episode 199 - AI Control: Kontrolle und Künstliche Intelligenz - Wege zur sicheren Superintelligenz

Send us Fan MailIn der 199. Folge von Knowledge Science betrachten Sigurd Schacht und Carsten Lanquillon ein aktuelles Paper zur Kontrolle von LLM-Agenten. Sie diskutieren die Herausforderungen und Strategien zur Eindämmung unerwünschten Verhaltens bis hin zur Superintelligenz und vergleichen diese mit traditionellen Wirtschaftsprüfungen. Ein Muss für alle, die die Steuerung fortschrittlicher KI-Modelle besser verstehen wollen!Korbak et.al.: How to evaluate control measures for LLM agents? https://arxiv.org/pdf/2504.05259v1📅 **Verpassen Sie nicht das Live-Event:** Mittwoch, 16. April, 18:30 Uhr im Club Stereo, Nürnberg. Feiern Sie mit uns die 200. Episode und knüpfen Sie spannende Kontakte!Support the show

Apr 13, 2025

37m
217

Episode 198 - Personal Context Management revolutioniert NLP

Send us Fan MailIn dieser Podcast-Folge stellen Sigurd Schacht und Carsten Lanquillon das Konzept eines "Personal Context Managers" vor, der die Arbeit mit verschiedenen KI-Sprachmodellen effizienter gestaltet. Die Idee besteht darin, persönliche Präferenzen, Projektziele und Wissensstände in einer strukturierten Datei zu speichern, die zu Beginn jeder KI-Konversation geteilt werden kann. Sigurd berichtet von seiner positiven Erfahrung mit dieser Methode bei einem Forschungsprojekt, wobei das KI-Modell maßgeschneiderte Antworten mit Visualisierungen lieferte. Besonders wertvoll ist die Möglichkeit, das Kontext-File am Ende einer Sitzung durch das KI-Modell aktualisieren zu lassen, sodass es mit dem Wissensfortschritt mitwächst. Die Hosts sehen großes Potenzial für den Einsatz in der Bildung, wo Dozenten Kurs-Kontext-Files erstellen könnten, die Studierende mit ihren individuellen Präferenzen kombinieren würden. Die Idee stammt von dem Backend-Entwickler Mike Shevchenko und ist laut den Hosts überraschend einfach umzusetzen und dabei enorm wirksam.https://github.com/mikhashev/personal-context-manager/tree/mainSupport the show

Apr 5, 2025

31m
216

Episode 197 - Wie das Model-Context-Protokoll (MCP) die KI-Welt verändert

Send us Fan MailTauchen Sie ein in die spannende Welt des Model-Context-Protokolls (MCP)! In dieser Episode des Knowledge Science Podcasts erkunden wir, wie dieses neuartige Kommunikationsprotokoll die Interaktion zwischen KI-Modellen, Datenbanken und Tools revolutioniert. Sigurd Schacht und Carsten Lanquillon diskutieren die Grundlagen, Vorteile und das Potenzial eines einheitlichen Standards, der die Nutzung von KI in Unternehmen und darüber hinaus transformieren wird.Support the show

Mar 29, 2025

32m
215

Episode 196 - Wann kommt die Superintelligenz?

Send us Fan MailIn dieser spannenden Folge von Knowledge Science tauchen Sigurd Schacht und Carsten Lanquillon tief in die Welt der Benchmarks und Evaluierungsmethoden für KI ein. Wie weit sind wir noch von einer KI, die menschliche Aufgaben vollumfänglich ersetzen kann? Welche Faktoren beeinflussen die Messbarkeit von KI-Leistung? Und welche Rolle spielen Reasoning-Modelle in der Zukunft der künstlichen Intelligenz? Entdecken Sie faszinierende Erkenntnisse und diskutierte Prognosen über den aktuellen Stand und die zukünftige Entwicklung von KI.Paper in dieser Episode: https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/Support the show

Mar 23, 2025

32m
214

Episode 195 - Die Kunst des Reward Hackings: Wie KI-Systeme den leichtesten Weg finden.

Send us Fan MailIn dieser Episode von "Knowledge Science" diskutieren Sigurd Schacht und Carsten Lanquillon über das vielschichtige Thema des Reward Hacking in KI-Modellen. Anhand des aktuellen Papers von OpenAI tauchen wir tief in die Mechanismen ein, die künstliche Intelligenzen dazu bringen, den einfachsten Weg zur Zielerfüllung zu wählen – und warum das nicht immer gewünscht ist. Außerdem wird die Rolle von Multi-Agenten-Systemen und moralischen Erwägungen beleuchtet. Erfahren Sie, wie diese Dynamiken in realen Anwendungen reflektiert werden und welche spannenden Forschungsfragen sich daraus ergeben. Link zum Paper: https://openai.com/index/chain-of-thought-monitoring/Support the show

Mar 15, 2025

37m
213

Episode 194 - Haben LLMs ein moralisches Grundverständnis?

Send us Fan MailIn dieser Episode des Knowledge Science Podcasts berichten wir über unser aktuelles Paper, in dem wir der Frage nachgegangen sind, ob LLMs ein inneres Moralverständnis haben bzw. entwickeln. Könen wir spezielle Bereiche des Sprachmodells identifizieren, das für Moral zuständig ist und können wir diese Bereiche beeinflussen. Außerdem beleuchten wir die aufregende Bewegung hin zu Open Science und wie internationale Zusammenarbeit dabei eine wichtige Rolle spielt. Link zum Blog: https://www.coairesearch.org/research/mapping-moral-reasoningSupport the show

Feb 22, 2025

36m

View all 262 episodes →

Type above to search every episode's transcript for a word or phrase. Matches are scoped to this podcast.

Searching…

We're indexing this podcast's transcripts for the first time — this can take a minute or two. We'll show results as soon as they're ready.

No matches for "" in this podcast's transcripts.

Showing of matches

No topics indexed yet for this podcast.

Loading reviews...

Share your thoughts

ABOUT THIS SHOW

HOSTED BY

Sigurd Schacht, Carsten Lanquillon

Frequently Asked Questions

How many episodes does Knowledge Science - Alles über KI, ML und NLP have?

Knowledge Science - Alles über KI, ML und NLP currently has 50 episodes available on PodParley. New episodes are automatically indexed when they're published to the podcast feed.

What is Knowledge Science - Alles über KI, ML und NLP about?

How often does Knowledge Science - Alles über KI, ML und NLP release new episodes?

Knowledge Science - Alles über KI, ML und NLP has 50 episodes. Check the episode list to see recent publication dates and frequency.

Where can I listen to Knowledge Science - Alles über KI, ML und NLP?

You can listen to Knowledge Science - Alles über KI, ML und NLP on PodParley by clicking any episode. We provide an embedded audio player for direct listening, and you can also subscribe via your preferred podcast app using the RSS feed.

Who hosts Knowledge Science - Alles über KI, ML und NLP?

Knowledge Science - Alles über KI, ML und NLP is created and hosted by Sigurd Schacht, Carsten Lanquillon.

URL copied to clipboard!

Episode 234 - 25 Gedanken gleichzeitig – Wie Forscher das Arbeitsgedächtnis von LLMs entdeckten (J-Space)

Episode 233 - Zwischen Interpretierbarkeit und nationaler Sicherheit

Episode 232 - After Automation - Mehr Agenten, mehr Slop, mehr Experten?

Episode 231 - Vom Sparse Autoencoder zum Natural Language Autoencoder – Ein neuer Blick in die KI-Blackbox

Episode 230 - Wenn KI lügt, obwohl sie es besser weiß – der MASK-Benchmark und warum Ehrlichkeit ≠ Genauigkeit ist

Episode 228 - Project Glasswing: Antropics neues Frontier-Modell Claude Mythos Preview und das Ende der Sicherheit, wie wir sie kannten

Episode 227 - AI Harness, Coase und die Firma der Zukunft

Episode 226 - Wenn KI-Agenten sich absprechen – Kollusion in Multi-Agenten-Systemen

Episode 225 - Doc to LoRA – Wie Dokumente blitzschnell zum Modellwissen werden

Episode 224 - KI-Texte in der Wissenschaft: Segen oder Sünde?

Episode 223 - Spiele als KI-Labor: Wie wir agentisches Verhalten erforschen

Episode 222 - Recursive Language Models: Ein neues Paradigma?

Episode 221: „Delve into it" – Wie ChatGPT unsere Sprache verändert (und was 2025 sonst noch passiert ist)

Episode 220 - Das fehlende Layer zur Superintelligenz: Warum LLMs keine Sackgasse sind – aber auch nicht ausreichen

Episode 219 Nested Learning: Ist Deep Learning nur eine Illusion?

Episode 218 - Mechanistische Interpretierbarkeit - Warum wir verstehen müssen, wie Sprachmodelle wirklich ticken

Episode 217 - Circuit Lenses: Den KI-Kontext entschlüsseln - Teil 2

Episode 216 - Features verstehen ohne Datenhunger: Der Weight Lens-Ansatz

Episode 215: Wenn Rauschen zu Geschichten wird - Wie Transformer halluzinieren

Episode 214 - Die 10 Gebote der Agenten-Ökonomie: Wunschdenken oder Wegweiser?

Episode 213 - AI Transparency Days 2025: Von Boston nach Nürnberg - Brücken bauen zwischen KI-Forschung und Praxis

Episode 212 - Leonard Dung - AI Welfare: Wie wir das Wohlbefinden von Sprachmodellen messen

Episode 211 - GPT-5, GPT-OSS & die Ethik der KI-Agenten: Wenn Maschinen zu Freunden werden

Episode 210 - KI-Finanzminister im Test: 93% mehr soziale Wohlfahrt durch Sprachmodelle

Episode 209 - Die schleichende Entmachtung: Wie KI-Systeme bereits heute unseren Einfluss auf Wirtschaft, Kultur und Staat untergraben können.

Episode 208 - Theory of Mind für KI: Wenn Maschinen lernen, uns zu verstehen

Episode 207 - KI-Verifikation: Wie wir Antworten vertrauen können – Generation Gap & schwache Verifizierer

Episode 206 - Haben KI-Modelle eigene Werte? Emergente Wertesysteme in Sprachmodellen

Episode 205 - KI-Modelle unter Beobachtung: Verändern Evaluierungen das Verhalten?

Episode 204 - Claude Opus/Sonnet 4 zwischen Innovation und Ethik"

Episode 203 - TINA Reasoning: Kleine Modelle, große Wirkung mit LoRA

Episode 202 - KI im Schlafmodus: Wie Sleep-Time-Compute Sprachmodelle effizienter macht

Episode 201 - KI-Gehirnwäsche? Wie man Sprachmodelle umprogrammiert – Ethik vs. Innovation

AI Generated (E): KS Pulse - AI Alignment and Complex Problem Solving

KI generiert (D): KS Pulse - AI Alignment and Complex Problem Solving

AI Generated (E): KS Pulse - Long Chain-of-Thought and the Need for AI Safety in Complex Reasoning

KI generiert (D): KS Pulse - Long Chain-of-Thought and the Need for AI Safety in Complex Reasoning

AI Generated (E): KS Pulse - Automatic Prompt Optimization via Heuristic Search

KI generiert (D): KS Pulse - Automatic Prompt Optimization via Heuristic Search

AI Generated (E): KS Pulse - Scaling Smarter The Art of Deliberate Practice in AI

KI generiert (D): KS Pulse - Scaling Smarter The Art of Deliberate Practice in AI

AI Generated (E): KS Pulse - Math, Minds, and Machines How Small Models Think Deeply

KI generiert (D): KS Pulse - Math, Minds, and Machines How Small Models Think Deeply

Episode 200 - Live ! in der Podcast Brause - Rückblick und Ausblick zu Cypernetic Teammates

Episode 199 - AI Control: Kontrolle und Künstliche Intelligenz - Wege zur sicheren Superintelligenz

Episode 198 - Personal Context Management revolutioniert NLP

Episode 197 - Wie das Model-Context-Protokoll (MCP) die KI-Welt verändert

Episode 196 - Wann kommt die Superintelligenz?

Episode 195 - Die Kunst des Reward Hackings: Wie KI-Systeme den leichtesten Weg finden.

Episode 194 - Haben LLMs ein moralisches Grundverständnis?

Authentication Required