Robotics and Biology Laboratory

Adaptive Balancing of Exploitation With Exploration to Improve Protein Structure Prediction

Image

PhD board

Prof. Dr. Oliver Brock
Prof. Dr. Lila Gierasch
Prof. Dr. David Kulp
Prof. Dr. Ileana Streinu

TJ Brunette

Titel:
Adaptive Balancing of Exploitation With Exploration to Improve Protein Structure Prediction

Zusammenfassung:

Das größte Hindernis für die Vorhersage von Proteinstrukturen ist die Unzulänglichkeit der Konformationsraumsuche. Der Konformationsraum ist zu groß und die Energielandschaft zu zerklüftet, als dass die vorhandenen Suchmethoden durchgängig nahezu optimale Minima finden könnten. Methoden der Konformationsraumsuche müssen sich daher auf die Erforschung eines kleinen Teils des Suchraums konzentrieren. Die Fähigkeit, geeignete Regionen auszuwählen, d. h. Regionen, die mit hoher Wahrscheinlichkeit den nativen Zustand enthalten, hat einen entscheidenden Einfluss auf die Effektivität der Suche. Für die Entscheidung, wo gesucht werden soll, sind Informationen erforderlich, wobei Informationen höherer Qualität zu einer besseren Auswahl führen. Die meisten aktuellen Suchmethoden sind so konzipiert, dass sie in so vielen Bereichen wie möglich funktionieren, was zu weniger genauen Informationen führt, da sie allgemein gehalten sein müssen. Die meisten Bereiche bieten jedoch einzigartige und genaue Informationen. Um domänenspezifische Informationen optimal zu nutzen, muss die Suche für jede Domäne angepasst werden. Der erste Beitrag dieser Arbeit passt die Suche für die Proteinstrukturvorhersage an, was zu wesentlich genaueren Proteinstrukturvorhersagen führt.

Wenn die Informationen nicht perfekt sind, werden Fehler gemacht, und die Suche wird sich auf Regionen konzentrieren, die nicht den nativen Zustand enthalten. Die Art und Weise, wie sich die Suche von Fehlern erholt, ist entscheidend für ihre Effektivität. Um sich von Fehlern zu erholen, wird in dieser Arbeit das Konzept des adaptiven Ausgleichs von Ausbeutung und Erkundung eingeführt. Der adaptive Ausgleich zwischen Ausbeutung und Erkundung ermöglicht es der Suche, Informationen nur in dem Maße zu nutzen, in dem sie die Erkundung in Richtung des nativen Zustands lenken. Bestehende Methoden der Proteinstrukturvorhersage stützen sich auf Informationen von bekannten Proteinen. Derzeit stammen diese Informationen entweder von Proteinen in voller Länge, die ähnliche Sequenzen und damit ähnliche Strukturen aufweisen (Homologe), oder von kurzen Proteinfragmenten. Homologe und Fragmente stellen zwei Extreme auf dem Spektrum der Informationen aus bekannten Proteinen dar. Zwischen diesen beiden Extremen können erhebliche zusätzliche Informationen gefunden werden. Die derzeitigen Methoden zur Vorhersage von Proteinstrukturen sind jedoch nicht in der Lage, Informationen zwischen Fragmenten und Homologen zu nutzen, da es schwierig ist, die richtigen Informationen aus der enormen Menge an falschen Informationen herauszufiltern. Diese Arbeit macht es möglich, Informationen zwischen Homologen und Fragmenten zu nutzen, indem sie adaptiv die Ausbeutung mit der Erforschung als Reaktion auf eine Schätzung der Qualität des Vorlagenproteins ausgleicht. Meine Ergebnisse zeigen, dass die Integration der Informationen zwischen Homologen und Fragmenten die Genauigkeit der Proteinstrukturvorhersage erheblich verbessert, was zu mehreren Proteinen führt, die mit einer RMSD-Auflösung von <1 Angström vorhergesagt werden.

Mai 2011