Datenbanken und Informationssysteme

Verbreitung von Forschungsergebnissen

Die folgenden Open-Source-Projekte sind aus der DIMA-Gruppe der TU Berlin hervorgegangen.

Emma

Emma ist eine angebotsbasierte Scala-DSL, die ganzheitliche Optimierungen von Datenflussprogrammen zur skalierbaren Datenanalyse auf Apache Flink und Spark ermöglicht.

Flink / Stratosphere

Apache Flink ist ein Stream-Processing-Framework für verteilte, leistungsstarke, immer verfügbare und genaue Daten-Streaming-Anwendungen, welches aus dem von der Deutschen Forschungsgemeinschaft (DFG) geförderten Verbundforschungsprojekt Stratosphere hervorgegangen. Nach einer erfolgreichen Inkubatorphase stieg Flink zu einem Top-Level-Projekt der Apache Foundation auf und wurde zu einem der wichtigsten und vielversprechendsten Projekte innerhalb des Apache Big Data Stack. Flink hat eine große und lebendige Community, zahlreiche bekannte Nutzer wie Zalando, Alibaba und Netflix und bietet seine eigene jährliche Konferenz FlinkForward, die in Berlin und San Francisco stattfindet.

Peel

Peel ist ein Framework, das seinen Nutzern hilft, Experimente für verteilte Systeme und Algorithmen zu definieren, auszuführen, zu analysieren und zu teilen. Ein Peel-Paket bündelt die Konfigurationsdaten, Datensätze und Workload-Anwendungen, die für die Ausführung einer bestimmten Sammlung von Experimenten erforderlich sind. Peel-Bundles können weitgehend von der zugrunde liegenden Betriebsumgebung entkoppelt und einfach in neue Umgebungen migriert und reproduziert werden.