Multi-target deep-learning convolutional neural network based on correlation convolution of energies spectra of multiple docking: a new method of machine learning for searching biologically active substances

Cover Page

Cite item

Full Text

Abstract

Machine learning methods are widely used today in the search for biologically active substances. Moreover, chemical and biological data have a highly specific structure, and all medicinal substances act simultaneously on several biotargets. Given this, the development of new methods for constructing deep-learning convolutional neural networks to analyze the relationships between multi-target biological activity and the structure of chemical compounds is a relevant and scientifically important task. Purpose of the work: To create a methodology for building multi-target convolutional neural networks of deep learning based on the correlation convolution of multiple docking energies into relevant biotargets. Materials and methods: Ensemble multiple docking of 537 compounds with anxiolytic activity and 234 compounds with antimicrobial activity against S.aureus into 22 and 10 relevant biotargets respectively, and the subsequent generation of their multiple docking energy spectra were performed using the original MSite program and AutoDock Vina program. Using the original FCCorNet program, correlation convolution of the energy spectra of multiple docking was performed and the energies of fully-connected convolutional neural networks were calculated for the specified compounds. The original computer DeepNets program for constructing deep-learning neural networks was developed in Python using the PyTorch library. Multi-target convolutional neural networks of deep learning were trained on two datasets, including the levels of anxiolytic activity and antimicrobial activity against S. aureus of known compounds and the energies of fully-connected convolutional correlation neural networks, and their accuracy was estimated. Results and discussion: The accuracy of the constructed neural network model for anxiolytic activity was Acc = 68.3 %, with a statistical significance of p = 1.1 × 10-9. The accuracy of the constructed neural network model for antimicrobial activity against S. aureus was Acc = 90.5 %, with a statistical significance of p < 1 × 10-15. The accuracy of predicting antimicrobial activity for S. aureus exceeds that of predicting anxiolytic activity, possibly due to the more complex systemic multi-target mechanism underlying psychotropic effects, compared to the antibacterial action of chemical compounds. The results demonstrate the high validity of a new deep-learning convolutional neural network architecture for in silico searches for biologically active substances. Conclusions: A new multi-target deep-learning convolutional neural network architecture based on correlation convolution of energy spectra of multiple docking into a set of relevant biotargets has been developed. The developed methodology can be used for in silico searches for new high active compounds with various types of multi-target pharmacological activity.

Full Text

Разнообразные методы машинного обучения, в настоящее время называемые методами искусственного интеллекта, широко используются в поиске биологически активных веществ [1].

Сегодня под искусственным интеллектом, как правило, подразумевается применение для решения поставленных человеком задач искусственных нейронных сетей различной архитектуры [2].

В нейросетевом моделировании особая роль отводится нейронным сетям глубокого обучения, которые являются обязательным компонентом всех современных систем искусственного интеллекта [3]. Фундаментальной основой всех используемых в настоящее время архитектур нейронных сетей является теорема Колмогорова [4], которая определяет, что любая непрерывная функция может быть представлена в виде суперпозиции непрерывных функций одного или двух аргументов. Это означает, что любую самую сложную зависимость можно аппроксимировать с использованием двухслойной ней-ронной сети прямого распространения, если адекватно подобрать две функции активации и правильно рассчитать веса синапсов. Однако эта теорема допускает возможность использования и большего числа функций активации (например, трех), что при правильном их выборе может привести к повышению точности такой многослойной нейросети.

При распознавании изображений и текстов необходимо обрабатывать очень большое число входных нейронов (пикселов, токенов).

С целью сокращения размерности анализируемого пространства и выявления имеющихся в нем скрытых содержательных образов были разработаны различные операции свертки, преимущественно на основе использования матричных методов [5].

Химико-биологические данные, характеризующие лекарственные соединения, имеют очень специфическую структуру, что существенно отличает эти данные от данных, описывающих объекты другой природы. Кроме того, хорошо известно, что подавляющее большинство лекарственных веществ действуют одновременно на несколько биомишеней.

Таким образом, разработка новых методов построения сверточных нейронных сетей глубокого обучения, ориентированных на анализ зависимостей между биологической активностью и структурой химических соединений, учитывающих особый характер химико-биологической информации и взаимодействие веществ с несколькими биомишенями, является актуальной и научно востребованной задачей.

Разработанный нами метод множественного докинга [6] позволяет формировать высоко достоверное векторное описание аффинности химических соединений к релевантным биомишеням в виде спектров энергий докинга в 27 пространств, сформированных по всему объему каждого белка-мишени.

Полученный вектор энергий множественного докинга отражает интегральную аффинность лиганда к данной биомишени. Однако объединение в один массив спектров энергий множественного докинга, вычисленных для нескольких биомишеней, существенно увеличивает размерность предметной области.

Полносвязные нейронные сети отличаются от большинства других нейронных сетей тем, что наличие отдельного выходного слоя нейронов не является обязательным. Эта архитектура применяется для создания ассоциативной памяти [7] и позволяет формировать устойчивые эталоны объектов путем минимизации некоторого фунционала, называемого энергией сети.

Мы использовали архитектуру полносвязной нейронной сети в качестве нематричного метода свертки, для чего разработали процедуру корреляционной свертки спектров энергий множественного докинга [8].

ЦЕЛЬ РАБОТЫ

Разработка нового метода машинного обучения для поиска in silico биологически активных соединений – мультитаргетной сверточной ней-ронной сети глубокого обучения на основе корреляционной свертки спектров энергий множественного докинга в релевантные биомишени.

МЕТОДИКА ИССЛЕДОВАНИЯ

Для достижения цели исследования необходимо было решить следующие задачи: 1) выполнение ансамблевого множественного докинга известных соединений с модельными биологическими активностями в релевантные биомишени и формирование спектров энергий их множественного докинга; 2) проведение корреляционной свертки спектров энергий множественного докинга и вычисление для указанных соединений энергий полносвязных сверточных корреляционных нейронных сетей; 3) разработка компьютерной программы построения нейронных сетей глубокого обучения; 4) формирование входных наборов данных по уровням активности известных соединений с модельными биологическими активностями и значениям энергий полносвязных сверточных корреляционных нейросетей; 5) обучение для модельных видов биологической активности мультитаргетных сверточных нейронных сетей глубокого обучения на основе корреляционной свертки спектров энергий множественного докинга и оценка точности полученных нейросетей.

В проведенном исследовании в качестве модельных биологических активностей были выбраны анксиолитическая активность и антимикробная активность в отношении Staphylococcus aureus. В качестве материалов выступали: значения энергий множественного докинга в 22 релевантных белка-мишени 537 известных химических соединений, экспериментально изученных на анксиолитическую активность; значения энергий множественного докинга в 10 релевантных белков-мишеней 284 известных химических соединений, экспериментально изученных на антимикробную в отношении S.aureus активность и структурно сходных со скаффолдом хиназолинона.

Для последовательной обработки и анализа данных в настоящем исследовании использовались следующие компьютерные программы: 1) корреляционная свертка спектров энергий мно-жественного докинга и вычисление энергий полносвязной сверточной корреляционной нейросети – оригинальная программа FCCorNet; 2) написание программы построения нейронных сетей глубокого обучения – библиотека PyTorch [9]; 3) построение нейронных сетей глубокого обучения – оригинальная программа DeepNets. Расчеты выполняли с использованием суперкомпьютерной техники общей производительностью ~37 Тфлопс.

Множественный докинг соединений в релевантные биомишени и формирование спектров энергий множественного докинга

По методике, описанной в работах [6, 10], для каждой модельной биологической активности в каждой из M релевантных биомишеней с помощью оригинальной программы MSite были построены по 27 пространств для множественного докинга (пример приведен на рис. 1), с помощью программы AutoDock Vina [11] в каждое такое пространство был выполнен ансамблевый докинг N изучаемых соединений и для каждого соединения сформирован спектр из 5 × 27 = 135 значений энергий множественного докинга ΔE для каждой релевантной биомишени. В результате для каждого соединения был получен спектр из 135 × M значений ΔE, характеризующий интегральный мультитаргетный аффинитет этого соединения в отношении M релевантных биомишеней.

Корреляционная свертка спектров энергий множественного докинга и вычисление энергий полносвязных сверточных корреляционных нейросетей

Согласно методики, описанной в работе [8], в случае множественного докинга в одну биомишень рассчитанные энергии ΔE можно рассматривать как нейроны полносвязной нейронной сети с симметричной матрицей связей. Значения их весов могут быть вычислены как коэффициенты парных корреляций между значениями сигналов двух связанных нейронов. Таким образом, для соединения l и биомишени m энергия полносвязной сверточной корреляционной нейронной сети может быть представлена в виде

Wlm=12·127i,j=1ij27Rmij·ΔElmi·ΔElmj, (1)

где Rmij – коэффициент корреляции Пирсона между показателями энергий ΔElmi и ΔElmj, i ≠ j; ΔElmi – значение энергии для пространства i в биомишени m для соединения l, l = 1...N, m = 1...M; ΔElmj – значение энергии для пространства j в биомишени m для соединения l, l = 1...N, m = 1...M; N – число соединений; M – число биомишеней.

Формула (1) задает алгоритм корреляционной свертки спектров энергий множественного докинга для M биомишеней, который был реализован в виде оригинальной программы FCCorNet; архитектура соответствующей полносвязной нейронной сети приведена на рис. 1.

 

Рис. 1. Корреляционная свертка спектров энергий множественного докинга:

а – построение пространств для множественного докинга на 3D-модели 6D6T ГАМКA-рецептора;

б – архитектура полносвязной сверточной корреляционной нейронной сети для 27 энергий докинга

 

Разработка компьютерной программы построения нейронных сетей глубокого обучения

Предварительно была сформирована архитектура моделируемых нейросетей, которая включала два скрытых слоя с автоматическим перебором числа нейронов по принципу «узкого горла», когда число нейронов в скрытых слоях всегда меньше числа входных нейронов. Для скрытых слоев были определены функции активации Identity, Logistic, Tanh, Exponential, ReLU, LeakyReLu, перебор которых осуществлялся программой при обучении конкретного варианта сети. Для выходного слоя функцией активации всегда служила Softmax. В качестве функции потерь использовалась CrossEntropyLoss. Было предусмотрено применение двух оптимизаторов, Adam (обратное распространение ошибки) и BFGS (градиентный спуск), с возможностью настройки в ручном режиме скорости обучения и числа эпох.

В процессе обучения производилось автоматическое случайное разделение входного набора данных на обучающую, тестовую и валидационную подвыборки, объем которых задавался пользователем. В рамках этой архитектуры на языке Python с использованием специализированной библиотеки глубокого обучения PyTorch [9] была написана оригинальная программа DeepNets. Программа поддерживает выполнение расчетов как на CPU, так и на GPU, автоматически определяя доступные устройства.

Формирование входных наборов данных, обучение мультитаргетных корреляционных сверточных нейронных сетей глубокого обучения и оценка их точности

Структура входных наборов данных как для анксиолитической активности, так и для антимикробной S. aureus активности была одинаковой и включала для каждого из N соединений в качестве целевой переменной метки наличия/отсутствия выраженного уровня активности (hm/nhm), а в качестве входных переменных – вычисленные по формуле (1) значения корреляционных сверток спектров энергий множественного докинга W (энергий полносвязных корреляционных сетей) для M релевантных биомишеней.

В ходе обучения конкретного варианта сети входной набор данных случайным образом разделялся на три подвыборки: обучающую TrainSet, тестовую TestSet и валидационную ValidationSet, в соотношении 70, 15, 15 % соответственно. Пользователь в ручном режиме задавал для скрытых слоев числа нейронов и функции активации, выбирал вид оптимизатора и устанавливал скорость обучения и число эпох. Выбор лучшей модели осуществлялся на основе минимального значения функции потерь на ValidationSet.

Для лучшей отобранной модели на полном входном наборе данных рассчитаны общая точность классификации Acc, чувствительность Sens (точность прогноза активных соединений), специфичность Spec (точность прогноза неактивных соединений), выполнен ROC-анализ и рассчитана площадь под кривой AUC. Для всех полученных показателей точности была определена их статистическая достоверность p.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ

В случае анксиолитической активности рассматривались 22 релевантных биомишени, для 537 соединений было получено 135 × 22 × 537 = 1 594 890 первичных значений энергий ΔE и по формуле (1) рассчитано 22 × 537 = 11 814 значений корреляционных сверток W (энергий сети).

В случае антимикробной S. aureus активности рассматривались 10 релевантных биомишеней, для 284 соединений было получено 135 × 10 × 284 = 383 890 первичных значений ΔE и по формуле (1) рассчитано 10 × 284 = 2 840 значений корреляционных сверток W (энергий сети).

В результате обучения в программе DeepNets для выраженной анксиолитической активности химических соединений найдена лучшая мультитаргетная сверточная нейронная сеть глубокого обучения на основе корреляционной свертки спектров энергий множественного докинга в релевантные биомишени, с архитектурой MLP 22-3-4-2 (LeakyReLU, LeakyReLU, Softmax), имеющая общую точность прогноза Acc = 68,3 % при статистической достоверности p = 1,1 × 10-9.

В результате обучения в программе DeepNets для выраженной антимикробной S. aureus активности химических соединений найдена лучшая мультитаргетная сверточная нейронная сеть глубокого обучения на основе корреляционной свертки спектров энергий множественного докинга в релевантные биомишени, с архитектурой MLP 10-4-9-2 (ReLU, ReLU, Softmax), имеющая общую точность прогноза Acc = 90,5 % при статистической достоверности p < 1 × 10-16.

Архитектуры найденных лучших нейросетей приведены на рис. 2, а более детальные результаты оценки их точности иллюстрирует таблице.

 

Рис. 2. Архитектуры мультитаргетных сверточных нейронных сетей глубокого обучения на основе корреляционной свертки спектров энергий множественного докинга химических соединений в релевантные биомишени: а – анксиолитической активности; б – антимикробной S. aureus активности

 

Показатели точности моделей с архитектурой мультитаргетной сверточной нейронной сети на основе корреляционной свертки спектров энергий множественного докинга

Параметр

Анксиолитическая активность

Антимикробная S. aureus активность

Архитектура1

MLP 22-3-4-2 (LReLU, LReLU)

MLP 10-4-9-2 (ReLU, ReLU)

Acc, %2

68,3

90,5

Sens, %3

68,5

96,5

Spec, %4

68,2

64,2

AUCROC, %5

68,3

86,6

p6

1,1 × 10-9

<1 × 10-15

Примечание. 1 MLP – многослойный перцептрон, указано число входных, скрытых и выходных нейронов, в скобках указаны функции активации для скрытых слоев нейронов, для выходных слоев нейронов функция активации Softmax; 2 Acc – общая точность прогноза; 3 Sens – чувствительность: точность прогноза активных соединений; 4 Spec – специфичность: точность прогноза неактивных соединений; 5 AUCROC – площадь под кривой в ROC-анализе; 6 p – минимальная значимость нейросетевой модели по биномиальному критерию.

 

Полученные данные доказывают высокую статистическую достоверность применения новой архитектуры сверточной нейронной сети глубокого обучения для поиска in silico биологически активных веществ.

Следует отметить, что точность и достоверность прогноза антимикробной S. aureus активности превышает точность и достоверность прогноза анксиолитической активности. Вероятно, это связано с более сложным системным мультитаргетным механизмом реализации психотропных эффектов, в сравнении с антибактериальным действием химических соединений.

В случае анксиолитической активности точность прогноза активных и неактивных соединений примерно одинакова, в то время как в случае антимикробной S. aureus активности точность прогноза активных соединений существенно выше точности прогноза неактивных соединений. Следовательно, вторую модель более целесообразно использовать для поиска in silico именно активных соединений. Таким образом, на примере двух видов активности, анксиолитической и S. aureus антимикробной, показано, что предлагаемая мультитаргетная сверточная нейронная сеть глубокого обучения на основе корреляционной свертки спектров энергий множественного докинга в релевантные биомишени является высокоточным методом машинного обучения, который может быть рекомендован как новый метод искусственного интеллекта для поиска in silico биологически активных веществ.

ЗАКЛЮЧЕНИЕ

  1. Разработана новая архитектура мультитаргетной сверточной нейронной сети глубокого обучения на основе корреляционной свертки спектров энергий множественного докинга в совокупность релевантных биомишеней.
  2. На примере анксиолитической и антимикробной S. aureus активностей доказана высокая статистическая достоверность применения нового оригинального подхода для прогноза in silico биологической активности химических соединений.
  3. Новый метод искусственного интеллекта может быть рекомендован для создания моделей зависимостей различных видов мультитаргетной биологической активности от показателей интегральной аффинности химических соединений к совокупности релевантных биомишеней и поиска с применением этих моделей новых соединений с высокой активностью.
×

About the authors

Pavel M. Vasiliev

Volgograd State Medical University

Author for correspondence.
Email: pvassiliev@mail.ru
ORCID iD: 0000-0002-8188-5052

Doctor of Biological Sciences, Senior Researcher of HAC (Associate Professor), Head of the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Drugs, Scientific Center for Innovative Medicines, Professor of the Department of Pharmacology and Bioinformatics

Russian Federation, Volgograd

Maxim A. Perfiliev

Volgograd State Medical University

Email: maxim.firu@yandex.com
ORCID iD: 0000-0002-5326-3299

Candidate of Medical Sciences, Junior Researcher at the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Drugs, Scientific Center for Innovative Medicines, Assistant at the Department of Pharmacology and Bioinformatics

Russian Federation, Volgograd

Arina V. Golubeva

Volgograd State Medical University

Email: arina_arina_golubeva@mail.ru
ORCID iD: 0000-0001-8268-8811

Junior Researcher at the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Drugs, Scientific Center for Innovative Medicines, Assistant at the Department of Pharmacology and Bioinformatics

Russian Federation, Volgograd

Andrey N. Kochetkov

Volgograd State Medical University

Email: akocha@mail.ru
ORCID iD: 0000-0003-3077-1837

System administrator, Software Engineer at the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Drugs Scientific Center for Innovative Medicines

Russian Federation, Volgograd

References

  1. Dash D. K., Pattnaik S., Namdeo A. The role of artificial intelligence in drug development: enhancing pharmaceutical chemistry through machine learning and predictive modeling. Drug Development and Industrial Pharmacy. 2025;51(11):1430–1438. doi: 10.1080/03639045.2025.2548839.
  2. Leijnen S., Van Veen F. The Neural Network Zoo. Proceedings. 2020;47(4):9. doi: 10.3390/proceedings2020047009.
  3. Aggarwal C. C. Neural Networks and Deep Learning: A Textbook. 2nd Edition. Cham (Switzerland): Springer, 2023. 497 p.
  4. Kolmogorov A. N. On the representation of continuous functions of several variables as superpositions of continuous functions of one variable and addition. Doklady AN SSSR = Reports of the USSR Academy of Sciences. 1957;114(5):953–956. (In Russ.).
  5. Chen C., Isa N. A. M., Liu X. A review of convolutional neural network based methods for medical image classification. Computers in Biology and Medicine. 2025;185:109507. doi: 10.1016/j.compbiomed.2024.109507.
  6. Vassiliev P. M., Kochetkov A. N., Spasov A. A., Perfilev M. A. The energy spectrum of multiple docking as a multidimensional metric of the affinity of chemical compounds to pharmacologically relevant biotargets. Volgogradskiy nauchno-meditsinskiy zhurnal = Volgograd Scientific and Medical Journal. 2021;3:57–61. (In Russ.).
  7. Hoffmann H. Sparse associative memory. Neural computation. 2019;31(5):998–1014. doi: 10.1162/neco_a_01181.
  8. Vassiliev P. M., Golubeva A. V., Perfilev М. A., Kochetkov A. N. Fully-connected convolutional correlation neural network based on the energy spectrum of multiple docking: a new methodology for searching biological active substances. Vestnik Ural'skoy meditsinskoy akademicheskoy nauki = Bulletin of the Ural Medical Academic Science. 2025;22(3):279–293. doi: 10.22138/2500-0918-2025-22-3-279-293. (In Russ.).
  9. Paszke A., Gross S., Massa F., Lerer A., Bradbury J., Chanan G. et al. PyTorch: An Imperative Style, High-Performance Deep Learning Library. In: Advances in neural information processing systems 32 (NeurIPS 2019), Eds. H. Wallach, H. Larochelle, A. Beygelzimer at al. Vancouver (British Columbia, Canada) : NeurIPS, 2019. 12 p.
  10. Vassiliev P. M., Perfilev M. A., Golubeva A. V., Kochetkov A. N., Maltsev D. V. Multi-target neural network model of anxiolytic activity of chemical compounds using correlation convolution of multiple docking energy spectra. Biomeditsinskaya Khimiya. 2024;70(6):428–434. doi: 10.18097/PBMC20247006428.
  11. Trott O., Olson A. J. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading. Journal of Computational Chemistry. 2010;31(2):455–461. doi: 10.1002/jcc.21334.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Correlation convolution of multiple docking energy spectra: a – construction of multiple docking spaces on a 3D model of the 6D6T GABAA receptor; b – architecture of a fully connected convolutional correlation neural network for 27 docking energies

Download (87KB)
3. Fig. 2. Architectures of multi-target convolutional neural networks of deep learning based on correlation convolution of energy spectra of multiple docking of chemical compounds into relevant biotargets: a – anxiolytic activity; b – antimicrobial S. aureus activity

Download (43KB)

Copyright (c) 2025 Vasiliev P.M., Perfiliev M.A., Golubeva A.V., Kochetkov A.N.

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.