Service-centric Networking

Actuator

Ziel dieses Forschungsprojekts ist die Konzeption und Entwicklung eines ganzheitlichen KI-Tools zur automatisierten Inhaltserstellung und Wissensextraktion für technische und wissenschaftliche Texte wie wissenschaftliche und medizinische Zeitschriftenartikel. Da es sich bei den Dokumenten, die in diesem Projekt verwendet werden, um Publikationen handelt, sind keine Datenschutzfragen zu klären. Aufgrund der ungewöhnlichen Struktur, der spezifischen Terminologie und der hohen Komplexität dieser Dokumente werden menschliche Experten in allen kritischen Phasen des Prozesses mitwirken und ihr Feedback geben. Auf diese Weise wird die Zuverlässigkeit und Genauigkeit der Ergebnisse verbessert.

Die derzeit auf dem Markt erhältlichen Lösungen:

  1. Black-box-Lösung: In diesem Fall weiß der Benutzer nicht, welche Methoden verwendet werden. Diese Intransparenz kann dazu führen, dass die Automatisierung bestehender Prozesse auf wenig Akzeptanz stößt. Außerdem ist die angebotene Lösung universell einsetzbar und funktioniert nicht in individuellen Anwendungsfällen, in denen individuellere Lösungen erforderlich sind.
  2. Datenquelle: Es kann nur eine sehr begrenzte Sammlung von Datenstrukturen verarbeitet werden. Darüber hinaus sind die verschiedenen Datenquellen nicht aggregiert und/oder nicht ausreichend für das System aufbereitet.
  3. Methodenauswahl: Die verwendeten Methoden sind auf einfachste Modelle beschränkt und berücksichtigen nicht die aktuellen Entwicklungen im Bereich des maschinellen Lernens. Daher sollten verschiedene Ansätze in Betracht gezogen werden, um für jeden Anwendungsfall den am besten geeigneten zu finden. Darüber hinaus können menschliche Experten ihr Feedback geben, um die Effizienz der einzelnen Methoden zu bewerten.

Das Ziel dieses Forschungsprojekts ist es, die oben genannten Probleme zu adressieren und einen konkreten Anwendungsfall im Bereich der Content-Produktion in Form eines transparenten, ganzheitlichen AIOps-Moduls unter wesentlicher Beteiligung menschlicher Experten zu lösen. Zu diesem Zweck werden innovative Methoden zur Aggregation verschiedener Datenquellen entworfen und eine Kombination von maschinellen Lernverfahren und statistischen Methoden mit und ohne gelabelte Daten evaluiert. Durch eine systemkompatible Vorverarbeitung der Daten (Dokumente) und die Auswahl komplementärer Methoden soll spezifisches Wissen aus den Daten (Dokumenten) automatisch extrahiert werden. Zum Beispiel die Textzusammenfassung von wissenschaftlichen Zeitschriftenartikeln oder die Extraktion von spezifischem Wissen wie Nebenwirkungen von bestimmten Medikamenten auf der Grundlage von Forschungsstudien, die in den wissenschaftlichen Zeitschriftenartikeln erwähnt werden. Menschliche Experten tragen dazu bei, die Daten zu beschriften und die Ergebnisse der automatischen Methoden zu bewerten, indem sie zwischen verschiedenen Methoden diejenige auswählen, die für die Daten am besten geeignet ist, oder indem sie dem System Feedback geben, um es zu verbessern.

Laufzeit:04/ 2021 - 12/ 2022 
Mitarbeitende:Maria Mora MartinezAikaterini Katsarou
Studierende:- 
Partner:Holtzbrinck Publication Group  
Förderung:Software Campus, Federal Ministry of Education practical and Research (BMBF)