ЭВОЛЮЦИОННЫЕ АЛГОРИТМЫ ОПТИМИЗАЦИИ В ЗАДАЧЕ ПРЕДСКАЗАНИЯ ВТОРИЧНОЙ СТРУКТУРЫ БЕЛКА

1, 2

1 ГБОУ ВО МО «Университет «Дубна», Факультет естественных и инженерных наук, Дубна, Россия, *****@***com

2 Московский государственный университет имени , Факультет вычислительной математики и кибернетики, Москва, Россия, *****@***com

Предложена схема применения эволюционных алгоритмов оптимизации для предсказания вторичной структуры пептидов.

Ключевые слова: вторичная структура белка, конформационный поиск, эволюционные вычисления, глобальная оптимизация.

Введение

В работе рассматривается одна из основных задач структурной биоинформатики – предсказание трёхмерной структуры белка по аминокислотной последовательности. Белки являются макромолекулами состоящими из б-аминокислот, соединённых в цепочку пептидной связью, тем самым образуя полипептидную цепь. Предсказание структуры белка – предсказание по аминокислотной последовательности трёхмерной структуры белка, которая определяет нативное, т. е. функционально активное, состояние (выделяют вторичную, третичную и четвертичную). Короткие белки называют пептидами.  В настоящей работе рассматривается задача поиска двух основных регулярных вторичных структур: б-спирали и в-листа.

Наиболее широко принимаемая гипотеза, объясняющая процесс самоорганизации белковых молекул была сформулирована Анфинсеном [1]. Основные идеи предложенной им «термодинамической гипотезы» следующие: нативное состояние белка уникально; нативное состояние белка находится в глобальном минимуме свободной энергии. Таким образом, процесс сворачивания полипептидной цепи можно представить как процесс минимизации свободной энергии белка, тогда задача предсказывания структуры сводится к задаче глобальной оптимизации.

НЕ нашли? Не то? Что вы ищете?

Настоящая работа посвящена вопросу применимости стохастических эволюционных алгоритмов оптимизации к вышеописанной задаче и описанию подхода к изменению одного из параметров силового поля в процессе поиска оптимальной структуры пептида.

Численное исследование

В численных экспериментах использовалось силовое поле ROSETTA [2] в котором, при вычислении энергии пептида, сочетаются неявный растворитель, различные потенциалы и статистически полученные дынные.

В настоящей работе рассматривалось два модельных пептида длинной 10 аминокислотных остатков: A10 [3] (б-спираль), V4GGV4 [4] (в-лист). Задача поиска оптимальной структуры ставилась в непрерывном пространстве: торсионных углов главной цепи пептида (углы ц и ш, пространство поиска [-р, р]); торсионных углов главной цепи щ (стремится быть планарным, поэтому [р-д, р+д], где д = 0.2 рад.); основных торсионных углов для каждой боковой цепи ч1-4 (пространство поиска [-р, р]); длин ковалентных связей (д1 = 0.05 Е); валентных углов (д2 = 0.1 рад.) для каждого атома пептида; неосновных торсионных углов боковой цепи каждого атома (д3 = 0.1 рад.). Границы с д1-3 рассчитывались относительно идеализированных значений используемых в ROSETTA (аналогично методу CONCOORD [5]). Таким образом, размерность задач для б-спирали и в-листа составила 302 и 428 параметров соответственно.

Для поиска оптимальной структуры использовались два эволюционных алгоритма: адаптивная дифференциальная эволюция JADE [6] и эволюционная стратегия ESCH [7].

Численные эксперименты и результаты, представленные в [2], показывают, что наибольшее усложнение целевой функции порождает кулоновский (электростатический) потенциал. Поскольку данный потенциал (fa_elec) определяет нековалентные взаимодействия, было предложено использовать метод имитации отжига [8] для изменения соответствующего веса потенциала в процессе оптимизации. Такой подход был использован для рассматриваемых пептидов, результаты представлены на рис. 1-3. Все вычисления выполнены на кластере HybriLIT [9].

Рис. 1. Суперпозиция главных цепей пептидов, PEP-FOLD (чёрный) и JADE (серый)

Суперпозиции на рис. 1 и 2 получены с использованием 3DSS [10], оптимальные значения исследуемых структур получены с помощью сервера PEP-FOLD [11, 12], предсказывающим структуру пептида с использованием статистической информации (низкоэнергетических фрагментов). На рис. 1 и 2 показано среднеквадратичное отклонение координат атомов получаемых после оптимизации пептидов относительно найденной с помощью PEP-FOLD.

Рис. 2. Суперпозиция главных цепей пептидов, PEP-FOLD (чёрный) и JADE (серый)

Рис. 3. Функция изменения кулоновского потенциала и сходимость для б-спирали

Выводы

На основании проведённых исследований можно заключить, что с использованием предложенной схемы эволюционные алгоритмы оптимизации способны находить оптимальную структуру коротких модельных пептидов в полноатомном разрешении. Целью дальнейшей работы является расширение схемы разбиения весов силового поля, пополнение исследуемых пептидов реальными, а также применение эволюционных алгоритмов в задаче поиска оптимального положения пептида на белке.

Литература

1. Anfinsen C. Principles that Govern the Folding of Protein Chains // Science. – Vol. 181(4096). – Jul. 1973. – Pp. 330-331.

2. O'Meara M. J., Leaver-Fay A., Tyka M. D., Stein A., Houlihan K., DiMaio F., Bradley P., Kortemme T., Baker D., Snoeyink J., Kuhlman bined Covalent-Electrostatic Model of Hydrogen Bonding Improves Structure Prediction with Rosetta // Journal of Chemical Theory and Computation. – Vol. 11(2). – 2015. – Pp. 609-622.

ng S. S. Helix Folding Simulations with Various Initial Conformations // Biophysical Journal. – Vol. 66. – Jan. 1994. – Pp. 1796-1803.

ng S. S. Monte Carlo Simulations of в-Hairpin Folding at Constant Temperature // Biophysical Journal. – Vol. 76 – Jan. 1999. – Pp. 164-175.

5. de Groot B. L., van Aalten D. M., Scheek R. M., Amadei A., Vriend G., Berendsen H. J. Prediction of protein conformational freedom from distance constraints // Proteins. – Vol. 29(2). – Oct. 1997. – Pp. 240-251.

6. Zhang J., Sanderson A. JADE: Adaptive differential evolution with optional external archive // IEEE Transactions on Evolutionary Computation. – Vol. 13(5). – 2009. – Pp. 945-958.

7. Silva-Santos C. H., Goncalves M. S., Hernandez-Figueroa H. E. Designing Novel Photonic Devices by Bio-Inspired Computing // IEEE Photonics Technology Letters. – Vol. 22(10). – 2010. – Pp. 1177-1179.

8. Kirkpatrick S., Gelatt C. D., Vecchi M. P. Optimization by Simulated Annealing // Science. – Vol. 220(4598). – 1983 – Pp. 671-680.

9. Heterogeneous Computing Cluster HybriLIT, <http://hybrilit. jinr. ru/en/>, 2015.

mathi K., Ananthalakshmi P., Roshan M. N., Sekar K. 3dSS: 3D structural superposition // Nucleic Acids Research. – Vol. 34. – Jul. 2006. – Pp. 128-132.

11. Shen Y., Maupetit J., Derreumaux P., Tuffery P. Improved PEP-FOLD approach for peptide and miniprotein structure prediction // Journal of Chemical Theory and Computation. – Vol. 10. – 2014 – Pp. 4745-4758.

12. Thevenet P., Shen Y., Maupetit J., Guyon F., Derreumaux P., Tuffery P. PEP-FOLD: an updated de novo structure prediction server for both linear and disulfide bonded cyclic peptides // Nucleic Acids Research. – Vol. 40. – 2012. – Pp. 288-293.

EVOLUTIONARY OPTIMIZATION ALGORITHMS IN protein secondary structure prediction

Poluyan S. V.1, Ershov N. M.2

1 Dubna State University, Faculty of Natural and Engineering Science, Dubna, Russia, *****@***com

2 Lomonosov Moscow State University, Faculty of Computational Mathematics and Cybernetics, Moscow, Russia, *****@***com

This paper proposes a scheme for application of evolutionary algorithms for peptide secondary structure prediction.

Кеу words: protein secondary structure, conformational search, evolutionary computation, global optimization.