Big Data Engineering

Forschungsprofil

Unser Ziel ist die Vereinfachung von Data Science durch die Bereitstellung geeigneter Abstraktionen und durch die Entwicklung von Systemen und Werkzeugen für die effiziente und skalierbare Ausführung von Data-Science-Aufgaben. Hierzu liegt der primäre Fokus unserer Forschung auf den Interna von ML-Systemen für den gesamten Data-Science-Lebenszyklus (von Datenintegration und Aufbereitung, über effizientes Modell-Training, bis hin zum Debugging und Serving), auf der großangelegten und verteilten Verwaltung und Analyse von Daten, sowie auf Infrastruktur und Benchmarks für Daten- und ML-Systeme.

Aktuelle Projekte: Apache SystemDS (ein quelloffenes ML-System für den gesamten Data-Science-Lebenszyklus) und DAPHNE (eine offene und erweiterbare System-Infrastruktur für integrierte Daten-Analyse-Pipelines, mit Know-Center, AVL, DLR, ETH Zurich, HPI Potsdam, ICCS, Infineon, Intel, ITU Copenhagen, KAI, TU Dresden, Uni Maribor, Uni Basel)

Abgeschlossene Projekte: ExDRa (06/2019-08/2022, explorative Data Science und föderiertes ML über Rohdaten, mit Siemens, DFKI, TU Berlin, and TU Graz)

Mitgliedschaft in PhD-Ausschüssen (abgeschlossen): Andreas Kunft (TU Berlin, 2019), Joseph Vinish D'Silva (McGill University, 2020), Shaoduo Gan (ETH Zurich, 2021), Gábor Gévay (TU Berlin, 2022), Clemens Lutz (TU Berlin, 2022), Alexander Renz-Wieland (TU Berlin, 2022), Gencer Sümbül (TU Berlin, 2023), Martino Ciaperoni (Alto University, 2023), Philipp Grulich (TU Berlin, 2023), Viktor Rosenfeld (TU Berlin, 2023), Lisa Raithel (TU Berlin, 2024)