Forscher*innen des Fachgebiets Datenbanksysteme und Informationsmanagement (DIMA) der TU Berlin haben auf der 20. Conference on Database Systems for Business, Technology and Web, die vom 6. bis 10. März in Dresden stattfand, ein Forschungspapier vorgestellt.
Das Forschungspapier mit dem Titel "Workload Prediction for IoT Data Management Systems" wurde von Xenofon Chatziliadis vorgestellt. Darin werden die Herausforderungen erörtert, denen sich Internet-of-Things-Datenmanagementsysteme (IoTDMS) bei der Erfassung und Analyse von Metriken zahlreicher Geräte in einem großen geografischen Gebiet gegenübersehen. Das Problem der erhöhten Latenz bei Datenverarbeitungsaufgaben aufgrund begrenzter Bandbreite und Rechenressourcen wird durch einen Ansatz angegangen, der die CPU-, Speicher- und Netzwerknutzung mithilfe von Modellen des maschinellen Lernens vorhersagt, insbesondere durch lineare Regression und neuronale Netze mit langem Kurzzeitgedächtnis (LSTM). Ziel dieser laufenden Forschung ist die Entwicklung eines Monitoringwerkzeugs für unser Datenverwaltungssystem NebulaStream.
Alexander Renz-Wieland hatte die Möglichkeit, seine Arbeit zum Thema "Adaptive Parameter Management for Efficient Distributed ML Training" zu präsentieren. Sein Vortrag behandelte die Herausforderungen des verteilten Trainings für große ML-Aufgaben, insbesondere die effiziente Synchronisation von Modellparametern zwischen Clusterknoten. Er konzentriert sich auf ML-Aufgaben mit spärlichem Parameterzugriff und zeigt, dass Standard-Parameter-Manager (PMs) für solche Aufgaben aufgrund des Kommunikations-Overheads ineffizient sind. Sie schlagen eine Reihe potenzieller Leistungsverbesserungen vor, um die PM-Effizienz zu erhöhen, indem sie sich besser an die zugrunde liegende ML-Aufgabe anpassen. Diese Verbesserungen machen die PM jedoch auch komplexer in der Anwendung. Um die Komplexität zu verringern, stellen die Autor*innen einen Mechanismus vor, der eine automatische Anpassung ermöglicht, genannt AdaPM, das sich automatisch an ML-Aufgaben anpasst, basierend auf den von der Anwendung bereitgestellten Informationen. AdaPM bietet nahezu lineare Geschwindigkeitssteigerungen gegenüber effizienten Einzelknoten-Implementierungen und macht PMs für spärliche ML-Aufgaben mit begrenztem Zusatzaufwand für Anwendungsentwickler effizient.
Das Konferenzprogramm in Dresden bot den Teilnehmenden ein vielfältiges Angebot an fesselnden Vorträgen, Workshops und Podiumsdiskussionen, die es ihnen ermöglichten, sich mit Expert*innen und Fachleuten aus der Datenbanksystem-Community auszutauschen und sich über die neuesten Entwicklungen auf diesem Gebiet zu informieren. Neben Vorträgen und Podiumsdiskussionen bot die Konferenz in Dresden auch interessante Workshops zu aktuellen Themen aus dem Bereich der Datenbanken. Dazu gehörten Workshops über moderne Hardware und ihre Auswirkungen auf Datenbanksysteme sowie über maschinelles Lernen für Systeme und Systeme für maschinelles Lernen. Diese Workshops boten den Teilnehmenden die einmalige Gelegenheit, diese rasch entwickelnden Bereiche zu vertiefen und praktische Einblicke von führenden Expert*innen aus Forschung und Industrie zu gewinnen.
Um die Veröffentlichung herunterzuladen, klicken Sie auf den unten stehenden Link:
Burrell, D., Chatziliadis, X., Zacharatou, E. T., Zeuch, S. & Markl, V., (2023). Workload Prediction for IoT Data Management Systems. In: König-Ries, B., Scherzinger, S., Lehner, W. & Vossen, G. (Hrsg.), BTW 2023. Gesellschaft für Informatik e.V.. DOI: 10.18420/BTW2023-64

DIMA-Forscher auf der BTW 2023 in Dresden, Deutschland