Von der datensatz- zur modulbasierten Datenintegration mit der UDP Data Automation (fossgis2026) episode artwork

EPISODE · Mar 25, 2026 · 24 MIN

Von der datensatz- zur modulbasierten Datenintegration mit der UDP Data Automation (fossgis2026)

from Chaos Computer Club - recent events feed (high quality) · host Katharina Lupp, Sarah Spönemann

Die Urban Data Platform Hamburg veröffentlicht über 600 Datensätze aus unterschiedlichen Bereichen der Stadt. Um die Entwicklung und Pflege der datensatzbezogenen, auf proprietärer Software basierenden Datenintegrationsprozesse zu vereinfachen, wird ein modularer und dynamischer ETL-Prozess auf Basis von Open Source Technologien, wie Apache Airflow und Python, entwickelt. Mit der UDP Data Automation werden Datenintegrationsprozesse künftig effizienter, flexibler und nachhaltiger. Die Urban Data Platform Hamburg (UDP Hamburg) bildet die zentrale digitale Infrastruktur der Stadt, auf der vielfältige Daten aus den Bereichen Verkehr, Umwelt, Energie, Verwaltung und Infrastruktur zusammengeführt und bereitgestellt werden. Ziel der Plattform ist es, diese heterogenen Datenbestände für die Stadtentwicklung, Forschung, Verwaltung sowie die Öffentlichkeit nutzbar zu machen. Aktuell sind über 600 unterschiedliche Datensätze mit jeweils eigenständigen Strukturen in der UDP verfügbar, was die Anforderungen an die Datenintegration kontinuierlich erhöht. Bisher erfolgte die Integration der Fachdaten datensatzbezogen und unter Verwendung proprietärer, lizenzbasierter Software wie FME, was zwar etabliert ist, jedoch hinsichtlich Flexibilität, Skalierbarkeit und Kosten deutliche Einschränkungen mit sich bringt. Vor diesem Hintergrund wird im Projekt Data Automation ein neuer, modularer Ansatz zur Automatisierung der Datenintegrationsprozesse entwickelt, der auf modernen Open-Source-Technologien wie Apache Airflow und Python basiert. Ziel ist es, die Datenintegration zu beschleunigen, die Qualität zu verbessern und die Pflege durch modulare Komponenten zu vereinfachen. Apache Airflow ermöglicht die Automatisierung, Steuerung und Überwachung von Datenprozessen, während Python als vielseitige Programmiersprache die Entwicklung individueller Schnittstellen und Datenverarbeitungslogiken unterstützt. Dabei wird ein generischer ETL-Prozess (Extract, Transform, Load) umgesetzt, der nicht mehr für jeden Datensatz individuell programmiert werden muss, sondern auf einem standardisierten Workflow-Template basiert. In diesem DAG-Template (Directed Acyclic Graph) werden die einzelnen ETL-Schritte in Airflow abgebildet – von der Schemaerstellung über die Datenextraktion und das Attribut-Mapping bis hin zum Laden der Zieltabelle. Die modulare Architektur des ETL-Prozesses erlaubt eine flexible Anpassung an unterschiedliche Datenformate wie Excel, CSV oder SDE (MSSQL) und unterstützt eine asynchrone Verarbeitung der Daten. Airflow steuert dabei die Ausführung der einzelnen Tasks im Workflow. Ein zentrales Element der technischen Umsetzung ist der DAG-Generator, der die Konfigurationsinformationen aus dem UDP-Manager, einem bereits in der UDP etablierten Datensatz-Management-Tool mit REST-Schnittstelle, ausliest und daraus automatisch individuelle DAGs für jeden Datensatz generiert oder aktualisiert. Im Rahmen der Weiterentwicklung findet hierzu ein fachlicher Austausch mit der Stadt Toronto statt, die Apache Airflow bereits produktiv einsetzt, um von internationalen Erfahrungen und Best Practices zu profitieren. Licensed to the public under https://creativecommons.org/licenses/by/4.0/ about this event: https://pretalx.com/fossgis2026/talk/BB839D/

Die Urban Data Platform Hamburg veröffentlicht über 600 Datensätze aus unterschiedlichen Bereichen der Stadt. Um die Entwicklung und Pflege der datensatzbezogenen, auf proprietärer Software basierenden Datenintegrationsprozesse zu vereinfachen, wird ein modularer und dynamischer ETL-Prozess auf Basis von Open Source Technologien, wie Apache Airflow und Python, entwickelt. Mit der UDP Data Automation werden Datenintegrationsprozesse künftig effizienter, flexibler und nachhaltiger. Die Urban Data Platform Hamburg (UDP Hamburg) bildet die zentrale digitale Infrastruktur der Stadt, auf der vielfältige Daten aus den Bereichen Verkehr, Umwelt, Energie, Verwaltung und Infrastruktur zusammengeführt und bereitgestellt werden. Ziel der Plattform ist es, diese heterogenen Datenbestände für die Stadtentwicklung, Forschung, Verwaltung sowie die Öffentlichkeit nutzbar zu machen. Aktuell sind über 600 unterschiedliche Datensätze mit jeweils eigenständigen Strukturen in der UDP verfügbar, was die Anforderungen an die Datenintegration kontinuierlich erhöht. Bisher erfolgte die Integration der Fachdaten datensatzbezogen und unter Verwendung proprietärer, lizenzbasierter Software wie FME, was zwar etabliert ist, jedoch hinsichtlich Flexibilität, Skalierbarkeit und Kosten deutliche Einschränkungen mit sich bringt. Vor diesem Hintergrund wird im Projekt Data Automation ein neuer, modularer Ansatz zur Automatisierung der Datenintegrationsprozesse entwickelt, der auf modernen Open-Source-Technologien wie Apache Airflow und Python basiert. Ziel ist es, die Datenintegration zu beschleunigen, die Qualität zu verbessern und die Pflege durch modulare Komponenten zu vereinfachen. Apache Airflow ermöglicht die Automatisierung, Steuerung und Überwachung von Datenprozessen, während Python als vielseitige Programmiersprache die Entwicklung individueller Schnittstellen und Datenverarbeitungslogiken unterstützt. Dabei wird ein generischer ETL-Prozess (Extract, Transform, Load) umgesetzt, der nicht mehr für jeden Datensatz individuell programmiert werden muss, sondern auf einem standardisierten Workflow-Template basiert. In diesem DAG-Template (Directed Acyclic Graph) werden die einzelnen ETL-Schritte in Airflow abgebildet – von der Schemaerstellung über die Datenextraktion und das Attribut-Mapping bis hin zum Laden der Zieltabelle. Die modulare Architektur des ETL-Prozesses erlaubt eine flexible Anpassung an unterschiedliche Datenformate wie Excel, CSV oder SDE (MSSQL) und unterstützt eine asynchrone Verarbeitung der Daten. Airflow steuert dabei die Ausführung der einzelnen Tasks im Workflow. Ein zentrales Element der technischen Umsetzung ist der DAG-Generator, der die Konfigurationsinformationen aus dem UDP-Manager, einem bereits in der UDP etablierten Datensatz-Management-Tool mit REST-Schnittstelle, ausliest und daraus automatisch individuelle DAGs für jeden Datensatz generiert oder aktualisiert. Im Rahmen der Weiterentwicklung findet hierzu ein fachlicher Austausch mit der Stadt Toronto statt, die Apache Airflow bereits produktiv einsetzt, um von internationalen Erfahrungen und Best Practices zu profitieren. Licensed to the public under https://creativecommons.org/licenses/by/4.0/ about this event: https://pretalx.com/fossgis2026/talk/BB839D/

NOW PLAYING

Von der datensatz- zur modulbasierten Datenintegration mit der UDP Data Automation (fossgis2026)

0:00 24:41

No transcript for this episode yet

We transcribe on demand. Request one and we'll notify you when it's ready — usually under 10 minutes.

No similar episodes found.

LIGHTS, CAMERA, SMILE! Creatives Club Media Lights, Camera, Smile, is a podcast for anyone with a dream to share something with the world, out of the overflow of themselves - be it their mind, their heart, their personalities, and much more. Each of us are alive in this moment in time, with an innate ability to have ideas and create various things to benefit both ourselves and the people around us for a reason, and here, you will find the encouragement, the inspiration, and the motivation to do just that. Hosted by Cicily, founder of Creatives Club, she dives into various topics surrounding creativity and business. Exploring entrepreneurship for creatives in a corporate reality, sharing tips and tricks in a media centered company, answering questions regarding what a creative actually is are just a few of the things discussed on this podcast. Be encouraged to create for yourself as Cicily gets vulnerable by pivoting the camera to herself for the first time.To submit questions for Cicily to answer, or have her address certain t Chewing the Fat with WorkForge WorkForge Bite-Sized Conversations for Building a Stronger Workforce Welcome to Chewing the Fat, a podcast delving deep into the world of food manufacturing. Dive into real conversations around critical topics like staffing, retention, onboarding, and career development in this essential industry. Subscribe now to gain insights from your peers, subject matter experts and more on the biggest issues facing food manufacturers today: -Hiring and retaining employees -Addressing the challenges of the Silver Tsunami -Improving time to productivity of new employees -Engaging employees from hire to retire And more... Tune in to Chewing the Fat, a WorkForge podcast, and join the conversation on how to build and sustain a resilient, high-performing workforce in food manufacturing. Sermons | Countryside Bible Church Countryside Bible Church At Countryside Bible Church, we equip believers to joyfully live holy lives, to serve one another, and to share the gospel of Jesus Christ, all to the glory of God. We are committed to a high view of God, and a high view of Scripture. The PFN Cincinnati Bengals Podcast Pro Football Network The PFN Cincinnati Bengals Podcast is where you can stay up-to-date with the latest news and analysis on the Cincinnati Bengals! Our hosts, industry experts Jay Morrison and Dallas Robinson, provide weekly coverage of all the latest rumors and updates about the Bengals. Don’t forget to follow the show to receive new episodes directly in your podcast feed and leave a rating and review to let us know your thoughts.

Frequently Asked Questions

How long is this episode of Chaos Computer Club - recent events feed (high quality)?

This episode is 24 minutes long.

When was this Chaos Computer Club - recent events feed (high quality) episode published?

This episode was published on March 25, 2026.

What is this episode about?

Die Urban Data Platform Hamburg veröffentlicht über 600 Datensätze aus unterschiedlichen Bereichen der Stadt. Um die Entwicklung und Pflege der datensatzbezogenen, auf proprietärer Software basierenden Datenintegrationsprozesse zu vereinfachen, wird...

Can I download this Chaos Computer Club - recent events feed (high quality) episode?

Yes, you can download this episode by clicking the download button on the episode player, or subscribe to the podcast in your preferred podcast app for automatic downloads.
URL copied to clipboard!