Datenbanken und Informationssysteme

DOPA - Data Supply Chains for Pools, Services and Analytics in Economics and Finance

Im heutigen Wettbewerbsumfeld ist jedes Unternehmen entscheidend auf zeitnahe und genaue Informationen über Märkte, Trends, Wettbewerber, Produkte, Verbrauchermeinungen und dergleichen angewiesen.

Die heutigen Business-Intelligence-Praktiken erweitern die Nutzung unternehmensinterner Daten zunehmend um die Fülle von Informationen, die durch menschliche und geschäftliche Aktivitäten im Internet und auf sozialen Plattformen generiert werden.

DOPA möchte europäische Wirtschaftsakteure und Forscher in die Lage versetzen, sich an dieser Entwicklung zu beteiligen, indem Durchbrüche in folgenden Bereichen erzielt werden:

  1.  Umfangreiche, qualitativ hochwertige Informationsbeschaffung (Automatisierung der Datensatzerkennung und des Kurations-Workflows)
  2. Automatisierte und skalierbare Informationsverarbeitung durch Datenlieferketten auf einer verteilten Plattform 
  3. Automatisierte Entitätsverknüpfung, um zusammengehörige Daten aus unterschiedlichen Quellen zusammenzuführen
  4. Visualisierungstools um diese Datenfülle zu verstehen

Der Datenfluss wird durch Data Supply Chains, eine Definition und skalierbare Implementierung eines domänenspezifischen Datenflusses, beschrieben. Eine Datenlieferkette kann auf eine Vielzahl von Informationsdiensten zugreifen und Daten unterschiedlicher Art aus unterschiedlichen Quellen verknüpfen.

In der Wirtschafts- und Finanzanalyse können statistische Daten oft wertvoll mit Informationen aus dem Internet verknüpft werden. Letzteres umfasst polystrukturierte Daten (z.B. Audio, Video, Bilder, Freitext, Tabellen und XML-Dateien), die wertvolle Informationen enthalten. Diese Informationen werden durch innovative Informationsextraktionstechniken (z.B. unüberwachtes Lernen) immer besser maschinenlesbar, obwohl sich solche Techniken noch in der intensiven Entwicklung befinden. Daher besteht ein Bedarf an einem Framework, das diese Extraktionstechniken in großem Umfang unterstützt und gleichzeitig die Struktur und die Standards bereitstellt, um einen geordneten Datenaustausch zwischen verschiedenen Informationsdiensten zu erreichen.

DOPA zielt darauf ab, diesen Rahmen zu schaffen und bestehende Datenpools anzupassen um eine Quellen- und Nutzungsplattform für Wirtschafts- und Finanzinformationen in Europa zu schaffen. Das Endergebnis wird den Wirtschaftsakteuren einen direkten Mehrwert bieten und Forschern im Datenbereich neue Möglichkeiten zur Durchführung groß angelegter Experimente eröffnen.

Weitere Informationen finden Sie auf der Projektwebsite: www.dopa-project.eu

Projektlaufzeit: 05/2012 - 04/2014