Robotics and Biology Laboratory

Using recurring spatially contiguous substructures in the Protein Database for protein structure prediction

Zusammenfassung

Seit wir wissen, dass die Sequenz eines Proteins seine Struktur kodiert, haben Forscher versucht, die Strukturen rechnerisch vorherzusagen. Angesichts der Weite des Konformationsraums haben die Forscher die Ähnlichkeiten in der Protein-Datenbank genutzt, um die Vorhersage zu unterstützen. In dieser Arbeit stellen wir einen neuen Ansatz für die Vorhersage von Proteinstrukturen vor, der eine neue Informationsquelle nutzt: Building Blocks. Dabei handelt es sich um sequenziell nicht zusammenhängende, aber strukturell zusammenhängende Strukturmotive, die anhand einer bestimmten Sequenz abgerufen werden.

Wir haben zwei Ansätze entwickelt, die Building Blocks zur Verbesserung der Vorhersage verwenden, und sie miteinander verglichen. Der erste, der Foldtree-Ansatz, konstruiert Strukturen durch Abtasten der Building Blocks während der gesamten Suche, während der zweite, der Constraint-Ansatz, die Energielandschaft verändert, um die Suche auf Strukturen zu lenken, die der räumlichen Anordnung der Building Blocks gehorchen. Die beiden Algorithmen konnten die Vorhersage im Vergleich zur uninformierten Methode erheblich verbessern. Der Constraint-Ansatz zeigte eine bessere Leistung als der Foldtree-Ansatz, obwohl er unter langen Laufzeiten litt und keine fehlerhaften Eingaben tolerierte.

Wir haben gezeigt, dass eine neue Informationsquelle erfolgreich für die ab initio Strukturvorhersage genutzt werden kann. Diese Arbeit legt die Grundlage für künftige Forschungen zur Nutzung dieser Informationen und leistet letztlich einen wichtigen Beitrag zur Lösung des Problems der Strukturvorhersage.