Datenbanken und Informationssysteme

News

Alle News

DIMA-Forschungsarbeit zur Veröffentlichung auf der EDBT 2024 angenommen

Wir freuen uns, Ihnen mitteilen zu können, dass das Forschungspapier ,,Benchmarking Stream Join Algorithms on GPUs: A Framework and its Application to the State of the Art", verfasst von Dwi Prasetyo Adi Nugroho, Philipp M. Grulich, Steffen Zeuch, Clemens Lutz, Stefano Bortoli, und Volker Markl wurde zur Veröffentlichung auf der EDBT 2024 [1], der 27th International Conference on Extending Database Technology, die vom 25. bis 28. März 2024 in Paestum, Italien, stattfinden wird.

Titel:
Benchmarking Stream Join Algorithms on GPUs: A Framework and its Application to the State of the Art

Autoren:
Dwi P. A. Nugroho, Philipp M. Grulich, Steffen Zeuch, Clemens Lutz, Stefano Bortoli, Volker Markl
 

Zusammenfassung:
Der Stream-Join ist ein wesentlicher und ressourcenintensiver Prozess in Stream Processing Engines (SPEs). Aktuelle Studien haben gezeigt, dass die Auslagerung der Stream-Join-Verarbeitung auf Hardware-Beschleuniger, einschließlich GPUs, erhebliche Leistungsvorteile mit sich bringt. Infolgedessen ist eine Vielzahl von GPU-beschleunigten Stream-Join-Algorithmen (SJAs) entstanden. Die bestehenden Studien bewerten die vorgeschlagenen GPU-beschleunigten SJAs jedoch nur isoliert, auf unterschiedlicher Hardware und nicht unter Verwendung einer gemeinsamen Arbeitslast. Deshalb ist es schwierig, verschiedene SJAs zu vergleichen und die für eine bestimmte Situation am besten geeignete SJA auszuwählen.

In diesem Artikel untersuchen wir die Leistungsmerkmale von GPU-beschleunigten SJAs. Zu diesem Zweck evaluieren wir verschiedene Konfigurationsparameter von SJAs und untersuchen die Auswirkungen der einzelnen Parameter. Wir bewerten die Leistung bekannter SJAs unter verschiedenen Konfigurationen des zugrunde liegenden Join-Algorithmus, der Parallelisierungsstrategie, der Progressivität des Algorithmus und des GPU-Typs. Unsere Ergebnisse zeigen, dass jede SJA-Variante ihre Stärken und Schwächen hat und dass ungeeignete Konfigurationen von Parametern zu Unterschieden im Durchsatz von bis zu zwei Größenordnungen führen. Auf der Grundlage der Ergebnisse haben wir einen Leitfaden für die Auswahl von SJA-Varianten für verschiedene Umstände entwickelt.

 

[1] EDBT 2024, https://dastlab.github.io/edbticdt2024/