Information Systems Engineering

TEADAL: Trustworthy, Energy-Aware Federated Data Lakes Along the Computing Continuum

Moderne Anwendungen basieren stark auf datengetriebenen Prozessen – so benötigt beispielsweise das autonome Fahren Unmengen an Sensor- und Videodaten, um Algorithmen zu trainieren. Ebenso benötigen Anwendungen im Bereich von intelligenten Produktionsstraßen einen konstanten und zeitnahen Fluss von Sensordaten, um Produktionsfehler schnell zu identifizieren. Jedoch sind diese Daten schon lange nicht mehr Teil einer einzigen Verarbeitungskette und werden oft durch unterschiedlichste, organisatorisch getrennte Partner erzeugt und verwaltet. Demensprechend ist das Teilen von Daten für datengetriebene Anwendungen von hoher Wichtigkeit. Beim Teilen derartiger Sensoren, Simulationen, Transaktionen und Stammdaten ergibt sich allerdings eine Vielzahl von unternehmerischen, technischen und organisatorischen Fragen, insbesondere hinsichtlich Performance, Privacy, Vertrauenswürdigkeit und Verfügbarkeit. Das sogenannte Cloud-Edge-Continuum, welches das nahtlose Nutzen und Verwalten von Daten sowohl nahe an den Sensoren als Datenquellen, aber auch in fernen Cloud-Data-Lakes im „Backend“ ermöglicht, liefert dabei erste Antworten, um insbesondere Verfügbarkeit und Performanceprobleme zu adressieren. Dennoch bleibt die Frage, wie Vertrauenswürdigkeit und Vertraulichkeit von geteilten Daten über den Organisationskontext hinaus durch Cloud-Edge-Continuum-Anwendungen sichergestellt werden können.

Das Fachgebiet Information Systems Engineering (ISE) möchte an dieser Stelle im Horizont Europa Projekt "TEADAL" (Trustworthy, Energy-Aware Federated Data Lakes Along the Computing Continuum) ansetzen und mit einer Reihe renommierter internationaler Partner ein neuartiges auf Cloud und Edge verteiltes Datenmanagementsystem entwickeln, das Datensätze nachvollziehbar und vertraulich teilt. Beispielsweise soll im Kontext von digitaler Landwirtschaft dafür gesorgt werden, dass Modelle zur Vorhersage und Bekämpfung von Pflanzenkrankheiten auf Basis von Beobachtung aus in Europa verteilten landwirtschaftlichen, teilweise konkurrierenden Betrieben, erstellt werden können, ohne dass vertrauliche Daten der Betriebe dabei sichtbar werden. Somit können alle Betriebe von der gemeinsamen Datenerhebung und Modellentwicklung profitieren, ohne Unternehmensgeheimnisse zu enthüllen. Gleichzeitig soll dieses neue System energieeffizient sein und den ökologischen Fußabdruck möglichst klein halten.


Eine große wissenschaftliche Herausforderung liegt dabei insbesondere in der Heterogenität der Datenquellen und „Dateneigentümer“. Ein System, das Vertrauenswürdigkeit und Vertraulichkeit sicherstellt, muss nachvollziehbar und transparent arbeiten, ohne gleichzeitig geheime Daten offenzulegen. Somit ist hier der zielgerichtete Einsatz von Software-basierten Lösungen zum verteilten vertraulichen Berechnen und dynamischen Verändern von Daten unabdinglich. Unser Fokus im Projekt liegt dabei unter anderem auf Ansätzen im Bereich Blockchain-basierter Systeme, Off-Chaining, Zero-Knowledge Proofs, Secure Multi-Party Computation, Trusted Execution Enviroments (TEEs), Rollups sowie Ansätzen für  (Laufzeit-) Observability, Energy-Tracing und Privacy-Engineering.


Basierend auf den grundlegenden Forschungsergebnissen der Universitätspartner TU Berlin, Politecnico Milano (Italien) und TU Wien (Österreich) sowie den Beiträgen der Industriepartner Ubiwhere (Portugal), Cybernetica (Estland), Cefriel (Italien), IBM Research Haifa (Israel), Marina Salud Sa (Spanien), UITP (Belgien), AMTS Catania (Italien), Almaviva (Italien), Martel GmbH (Schweiz), Terraview GmbH (Schweiz), Ert Têxtil (Portugal), I2cat (Spanien), Box2m Engineering (Rumänien) und Regione Toscana (Italien) werden verteilte Datenmanagementsysteme in den Bereichen Medizin, Industry 4.0, Finanzwesen, Telekommunikation, Digitale Landwirtschaft und Regionalplanung umgesetzt und erprobt. Das Projekt startet am 1.9.2022, hat eine Laufzeit von 3 Jahren und ein gesamtes Fördervolumen von 10 Millionen Euro.

Resourcen

TEADAL Webseite