Quality and Usability

Emonymous

Interaktive intelligente Sprachassistenten erobern den Heimbereich. Ziel des Projekts ist es, die Sprecheridentität vollständig zu anonymisieren ohne emotionalen und sprachinhaltliche Informationen zu verlieren.

Projektbeschreibung:

Das Vorhaben Emonymous (Langtitel:“ Sprecheranonymisierung unter Erhalt emotionaler Ausdruckswirkung“) beschäftigt sich mit der Erforschung und Entwicklung neuer Methoden, die die Identität der Sprecherin oder des Sprechers bei der Anwendung intelligenter Sprachassistenten vollständig anonymisieren sollen und dabei sprachliche sowie emotionale Informationen weitestgehend erhalten. Dies ermöglicht den Einsatz interaktiver und intelligenter Sprachassistenten auch in datenschutzrechtlich sensiblen Bereichen wie beispielsweise dem Gesundheitssektor oder der Lernunterstützung. Den Kern der interdisziplinären Arbeit stellt die Entwicklung eines neuartigen Sprachsynthesizers sowie eines perzeptiven Ähnlichkeitsmaßes dar. Der Sprachsynthesizer soll in der Lage sein, aus den original Sprachdaten, hochqualitative Sprachaufnahmen zu generieren, welche die wichtigen Sprachinformationen erhalten und Identität des Sprechenden verschleiern. Hierzu sollen im Rahmen des Projekts teilweise bereits vorhandene Module zur Instrumentenmodellierung (z.B. Differential Digital Signal Processing) angepasst und um weitere sprachspezifische Module ergänzt werden. Ein neu zu entwickelndes differenzierbares Ähnlichkeitsmaß, das den Unterschied zwischen Eingabe und Rekonstruktion der Sprachdaten misst, soll das Training der genannten KI-Methoden ermöglichen, welche die Anonymisierung des Sprechenden durchführen können und gleichzeitig prüfen, ob sowohl die Sprachinformation als auch die Emotionalität erhalten wurde.

Partner:

  • Otto-von-Guericke-Universität Magdeburg, Fachgebiet Mobile Dialogsysteme 39106 Magdeburg Deutschland
  • DFKI, Fachgebiet Speech and Language Technology 10559 Berlin Deutschland

Laufzeit:

01.08.2021 bis 31.07.2023