Motivation und Projektbeschreibung
Die richtige Stimme sorgt für Wiedererkennung und verleiht einer Marke Charakter. Deshalb beschäftigen große Unternehmen häufig einen festen Sprecher, durch dessen Stimme sie in Radio- und TV-Werbesports vertreten werden. Eine solche Markenstimme ist eine spezifische Sprechstimme, die konsequent und langfristig für die verbale Kommunikation eines Unternehmens eingesetzt wird. Diese für den Zuhörer bekannte Stimme wird intuitiv mit dem jeweiligen Unternehmen verknüpft. Zu solchen Stimmen liegen in den jeweiligen Unternehmen oft bereits größere Datenbanken mit aufgezeichneten Sprachdaten vor, allerdings lässt sich damit nicht jede gewünschte Äußerung erstellen. In diesem Projekt soll aus einer solchen Datenbank eine synthetische Stimme für beliebige Äußerungen erzeugt werden, welche flexibel und dynamisch eingesetzt werden kann.
Hierzu sind grundlegende Forschungsarbeiten notwendig. Durch den Einsatz neuer instrumenteller Qualitätsschätzer (ein Algorithmus, der die von einem Nutzer empfundene Qualität vorhersagt) für Gesamtqualität sowie relevante perzeptive Qualitätsdimensionen soll die Sprachsynthese während der Entwicklung nicht nur kontinuierlich verbessert werden, es werden zudem auch die Menge der anfallenden Hörversuche zur Qualitätsbestimmung der Synthese auf ein Minimum reduziert. Im Ergebnis wird eine evaluierte Sprachsynthese der Corporate Voice vorliegen, die beliebigen Text in Sprache umsetzen kann.
Fragestellungen
Die von diesem Forschungsvorhaben angestrebten Ziele sind wie folgt definiert:
Dauer: 03/2014 - 12/2015
Mitarbeiter: Florian Hinterleitner
Studenten: Iason Georgakopoulos
Partner: Software Campus
Förderung durch: Bundesministerium für Bildung und Forschung (BMBF) - 01IS12056
Veröffentlichungen: siehe Veröffentlichungsliste von Hinterleitner