EPISODE · Mar 25, 2026 · 19 MIN
Mit Open Source zum Lakehouse-Cluster mit nativer Geo-Unterstützung (fossgis2026)
from Chaos Computer Club - recent audio-only feed · host Gabriel Musial
Der Vortrag vermittelt Motivation und Orientierung für den Aufbau eines eigenen Lakehouse-Clusters. Er erklärt kompakt Architektur und Kernbausteine eines Lakehouse-Systems – vom Katalog über Speicher und Compute bis zum Tabellenformat – und zeigt, wie man einen Plan für große Datenmengen entwickelt, wenn eine einzelne Maschine nicht mehr ausreicht. Mit der fortschreitenden Öffnung von Geodaten wachsen die Anforderungen an Speicherung und Berechnung. Klassische Einzel-Datenbanken lassen sich zwar skalieren, stoßen bei sehr großen, heterogenen Beständen jedoch an organisatorische und technische Grenzen. Der Vortrag entmystifiziert moderne Lakehouse-Architekturen und zeigt, wie S3-Speicher, Katalog, Compute (von DuckDB bis Spark) und Tabellenformat zusammenspielen. Im Fokus steht Apache Iceberg v3 mit nativer Geo-Unterstützung: räumliche Datentypen, Time-Travel und saubere Schema-Evolution. Ziel ist ein klarer Startpfad vom Laptop-PoC zum kleinen Cluster – inklusive typischer Fallstricke sowie Do’s & Don’ts. Licensed to the public under https://creativecommons.org/licenses/by/4.0/ about this event: https://pretalx.com/fossgis2026/talk/AWVX7F/
What this episode covers
Der Vortrag vermittelt Motivation und Orientierung für den Aufbau eines eigenen Lakehouse-Clusters. Er erklärt kompakt Architektur und Kernbausteine eines Lakehouse-Systems – vom Katalog über Speicher und Compute bis zum Tabellenformat – und zeigt, wie man einen Plan für große Datenmengen entwickelt, wenn eine einzelne Maschine nicht mehr ausreicht. Mit der fortschreitenden Öffnung von Geodaten wachsen die Anforderungen an Speicherung und Berechnung. Klassische Einzel-Datenbanken lassen sich zwar skalieren, stoßen bei sehr großen, heterogenen Beständen jedoch an organisatorische und technische Grenzen. Der Vortrag entmystifiziert moderne Lakehouse-Architekturen und zeigt, wie S3-Speicher, Katalog, Compute (von DuckDB bis Spark) und Tabellenformat zusammenspielen. Im Fokus steht Apache Iceberg v3 mit nativer Geo-Unterstützung: räumliche Datentypen, Time-Travel und saubere Schema-Evolution. Ziel ist ein klarer Startpfad vom Laptop-PoC zum kleinen Cluster – inklusive typischer Fallstricke sowie Do’s & Don’ts. Licensed to the public under https://creativecommons.org/licenses/by/4.0/ about this event: https://pretalx.com/fossgis2026/talk/AWVX7F/
NOW PLAYING
Mit Open Source zum Lakehouse-Cluster mit nativer Geo-Unterstützung (fossgis2026)
No transcript for this episode yet
Similar Episodes
Mar 26, 2026 ·1m
Feb 8, 2026 ·4m
Jan 30, 2026 ·6m
Jan 2, 2026 ·47m