#125 - [Quickbite] GPT 5.4: Zum ersten Mal ist eine KI besser als du... bei normaler Büroarbeit episode artwork

EPISODE · Mar 13, 2026 · 25 MIN

#125 - [Quickbite] GPT 5.4: Zum ersten Mal ist eine KI besser als du... bei normaler Büroarbeit

from Das KI-Kochbuch: KI-Tools | Unternehmens-KI | Leadership · host Malcolm Werchota

Arbeitest du im Büro? Sitzt du am PC, klickst dich durch Programme, kopierst Daten in Excel, füllst Formulare aus? Dann gibt es eine schlechte Nachricht: Seit drei Tagen ist eine KI besser darin als du.GPT 5.4 hat im OS World Verified Benchmark — einem standardisierten Test für echte Desktop-Aufgaben — 75 Prozent erreicht. Der menschliche Durchschnitt liegt bei 72 Prozent. Das ist das erste Mal in der Geschichte, dass ein Allzweck-KI-Modell bei normalen Bürotätigkeiten über der menschlichen Performance liegt. Nicht bei Schach, nicht bei Go, nicht bei Proteinfaltung — bei Maus, Tastatur, Browser und Excel.Und der Sprung ist brutal: Das Vorgängermodell GPT 5.2 lag noch bei 50 Prozent. In drei Monaten auf 75. Gleichzeitig ist die Genauigkeit bei Finanzmodellen auf 87 Prozent gestiegen, die Halluzinationsrate um 30 Prozent gefallen, und das Context Window auf eine Million Tokens gewachsen — achtmal mehr als das, was hinter Microsoft Copilot steckt. Der Preis: 2,50 Dollar pro Million Input-Tokens. Absolut Peanuts.Malcolm erzählt, wie sein Team reagiert hat, als ihre Mitarbeiterin Purani abgesprungen ist. Statt Panik: Analyse. Was macht sie? Wie viele KI-Agenten brauche ich, um sie zu ersetzen? Das Ergebnis: 80 Prozent ihrer Aufgaben lassen sich mit Agenten abdecken — mit Cloud Code, OpenClaw und jetzt GPT 5.4 mit nativem Computer Use.Die Episode richtet sich direkt an den DACH-Mittelstand: Testet GPT 5.4 mit echten Workflows. Auditiert eure Spreadsheet-Abteilung. Rechnet die API-Kosten gegen die Gehälter. Und baut einen Transitionsplan — mit einer ehrlichen Liste: Wer orchestriert Agenten, wer wird zum Superstar, und wer ist der Onkel oder die Tante, die seit 30 Jahren dasselbe macht und KI nie nutzen wird?KEY TAKEAWAYSGPT 5.4 schlägt erstmals den menschlichen Durchschnitt bei normalen Desktop-Büroaufgaben (75 % vs. 72 %)OS World Score: Sprung von 50 % auf 75 % in nur drei MonatenGPT-Val Benchmark: 83 % über 44 Berufsgruppen — 13 Prozentpunkte besser als das VorgängermodellContext Window: 1 Million Tokens — achtmal mehr als das, was hinter Copilot stecktFinanzmodelle: 87 % Genauigkeit, 30 % weniger HalluzinationenPreis: 2,50 Dollar pro Million Input-Tokens — ein Bruchteil von Claude80 % der Aufgaben einer Mitarbeiterin lassen sich mit KI-Agenten abdecken60–70 % der Mitarbeiter in einer durchschnittlichen Firma werden KI nicht nutzen — ohne Transitionsplan wird das zum Problem🎙️ ÜBER DEN HOSTMalcolm Werchota leitet KI-Adoptionsprogramme für Unternehmen in ganz Europa. Nach über 15 Jahren bei Novartis und Schlumberger heute Fokus: KI ohne Bullshit. Dozent an ESADE & HSLU.🚀 RESSOURCEN FÜR FÜHRUNGSKRÄFTE📚 Chief AI Academy — KI für Entscheiderhttps://www.werchota.ai/chief-ai-academy👥 AI-Leadership-Communityhttps://chief.werchota.ai/getting-started💼 KONTAKTLinkedIn: https://linkedin.com/in/malcolmwerchotaE-Mail: [email protected]🔎 TAGS#KI #GPT54 #ChatGPT #TheAICookbook #Büroarbeit #ComputerUse #Mittelstand #KIAgenten #DigitalerMitarbeiter #Automatisierung #OSWorld #Enterprise

Arbeitest du im Büro? Sitzt du am PC, klickst dich durch Programme, kopierst Daten in Excel, füllst Formulare aus? Dann gibt es eine schlechte Nachricht: Seit drei Tagen ist eine KI besser darin als du.GPT 5.4 hat im OS World Verified Benchmark — einem standardisierten Test für echte Desktop-Aufgaben — 75 Prozent erreicht. Der menschliche Durchschnitt liegt bei 72 Prozent. Das ist das erste Mal in der Geschichte, dass ein Allzweck-KI-Modell bei normalen Bürotätigkeiten über der menschlichen Performance liegt. Nicht bei Schach, nicht bei Go, nicht bei Proteinfaltung — bei Maus, Tastatur, Browser und Excel.Und der Sprung ist brutal: Das Vorgängermodell GPT 5.2 lag noch bei 50 Prozent. In drei Monaten auf 75. Gleichzeitig ist die Genauigkeit bei Finanzmodellen auf 87 Prozent gestiegen, die Halluzinationsrate um 30 Prozent gefallen, und das Context Window auf eine Million Tokens gewachsen — achtmal mehr als das, was hinter Microsoft Copilot steckt. Der Preis: 2,50 Dollar pro Million Input-Tokens. Absolut Peanuts.Malcolm erzählt, wie sein Team reagiert hat, als ihre Mitarbeiterin Purani abgesprungen ist. Statt Panik: Analyse. Was macht sie? Wie viele KI-Agenten brauche ich, um sie zu ersetzen? Das Ergebnis: 80 Prozent ihrer Aufgaben lassen sich mit Agenten abdecken — mit Cloud Code, OpenClaw und jetzt GPT 5.4 mit nativem Computer Use.Die Episode richtet sich direkt an den DACH-Mittelstand: Testet GPT 5.4 mit echten Workflows. Auditiert eure Spreadsheet-Abteilung. Rechnet die API-Kosten gegen die Gehälter. Und baut einen Transitionsplan — mit einer ehrlichen Liste: Wer orchestriert Agenten, wer wird zum Superstar, und wer ist der Onkel oder die Tante, die seit 30 Jahren dasselbe macht und KI nie nutzen wird?KEY TAKEAWAYSGPT 5.4 schlägt erstmals den menschlichen Durchschnitt bei normalen Desktop-Büroaufgaben (75 % vs. 72 %)OS World Score: Sprung von 50 % auf 75 % in nur drei MonatenGPT-Val Benchmark: 83 % über 44 Berufsgruppen — 13 Prozentpunkte besser als das VorgängermodellContext Window: 1 Million Tokens — achtmal mehr als das, was hinter Copilot stecktFinanzmodelle: 87 % Genauigkeit, 30 % weniger HalluzinationenPreis: 2,50 Dollar pro Million Input-Tokens — ein Bruchteil von Claude80 % der Aufgaben einer Mitarbeiterin lassen sich mit KI-Agenten abdecken60–70 % der Mitarbeiter in einer durchschnittlichen Firma werden KI nicht nutzen — ohne Transitionsplan wird das zum Problem🎙️ ÜBER DEN HOSTMalcolm Werchota leitet KI-Adoptionsprogramme für Unternehmen in ganz Europa. Nach über 15 Jahren bei Novartis und Schlumberger heute Fokus: KI ohne Bullshit. Dozent an ESADE & HSLU.🚀 RESSOURCEN FÜR FÜHRUNGSKRÄFTE📚 Chief AI Academy — KI für Entscheiderhttps://www.werchota.ai/chief-ai-academy👥 AI-Leadership-Communityhttps://chief.werchota.ai/getting-started💼 KONTAKTLinkedIn: https://linkedin.com/in/malcolmwerchotaE-Mail: [email protected]🔎 TAGS#KI #GPT54 #ChatGPT #TheAICookbook #Büroarbeit #ComputerUse #Mittelstand #KIAgenten #DigitalerMitarbeiter #Automatisierung #OSWorld #Enterprise

NOW PLAYING

#125 - [Quickbite] GPT 5.4: Zum ersten Mal ist eine KI besser als du... bei normaler Büroarbeit

0:00 25:14

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

Flottengeflüster ALD Automotive Österreich | LeasePlan Beim Flottengeflüster powered by ALD Automotive | LeasePlan präsentieren Jörg Janik und Peter Gutenbrunner alle zwei Wochen spannende Informationen rund um das Thema nachhaltige Mobilität. Beide beschäftigen sich schon lange mit der Thematik und bringen umfangreiches Fachwissen mit. Sollten sie aber doch einmal nicht weiter wissen, werden unsere Expert*innen hinzugezogen, die ihnen gerne mit Rat und Tat zur Seite stehen. Wild WinsDay Wild WinsDay Pump the hump with WILD WINSday 🐪💪: Your 3-minute weekly video boost for leadership, sales, marketing, and business breakthroughs to WIN the day! Faith and Mental Wellness Podcast with Shakeeta Torres Shakeeta Torres, Speaker, Author, LCSW, Certified Life Coach & Coach Trainer ”Welcome to ”The Faith and Mental Wellness Podcast”—your safe place for a transformative journey toward breaking the barriers that hinder emotional, mental, and spiritual healing. Join us as we explore real-life stories and insightful interviews with Mental Wellness Professionals and individuals who’ve triumphed in restoring mental health by intertwining their faith with professional guidance. Through these candid conversations, we equip you with tools and resources to enhance your mental well-being. Tune in and embark on a journey of empowerment, healing, and renewed faith!” Leading From All Sides Abbie Mirata Discover the various styles of leadership, from leading at the forefront to steering from behind, rising to the top or empowering from the bottom. We'll explore horizontal and vertical leadership, leading through your brand, and even leading in your most intimate relationships. Join me in engaging conversations with special guests who are leaders in their careers, communities, and families. Gain insights, perspectives, and invaluable lessons that challenge traditional notions of what it means to lead.

Frequently Asked Questions

How long is this episode of Das KI-Kochbuch: KI-Tools | Unternehmens-KI | Leadership?

This episode is 25 minutes long.

When was this Das KI-Kochbuch: KI-Tools | Unternehmens-KI | Leadership episode published?

This episode was published on March 13, 2026.

What is this episode about?

Arbeitest du im Büro? Sitzt du am PC, klickst dich durch Programme, kopierst Daten in Excel, füllst Formulare aus? Dann gibt es eine schlechte Nachricht: Seit drei Tagen ist eine KI besser darin als du.GPT 5.4 hat im OS World Verified Benchmark —...

Is there a transcript available for this episode?

Yes, a full transcript is available for this episode. You can read the complete transcript on the episode page.

Can I download this Das KI-Kochbuch: KI-Tools | Unternehmens-KI | Leadership episode?

Yes, you can download this episode by clicking the download button on the episode player, or subscribe to the podcast in your preferred podcast app for automatic downloads.
URL copied to clipboard!