Daten in der Bio- und Chemoinformatik lassen sich auf natürliche Weise durch Strukturen darstellen. Wir entwickeln Lernverfahren auf strukturierten Daten für Klassifikation, Regression und explorative Datenanalyse. Die Verfahren beruhen auf jüngsten Forschungsansätzen des maschinellen Lernen auf strukturierten Daten. Daten aus der Bio- und Chemoinformatik dienen auch zur Validierung der bereits von uns entwickelten Verfahren (vgl. "Lernen auf strukturierten Daten"). Gegenwärtige Anwendungen beinhalten die Klassifikation von DNA Mikroarrays, Analyse von Proteinsequenzen und QSAR-Analyse von chemischen Strukturen.
Danksagung: Dieses Projekt wurde von der Technischen Universität Berlin finanziert.