Публикация доступна для обсуждения в рамках функционирования постоянно
действующей интернет-конференции “Бутлеровские чтения”. http:///readings/
Поступила в редакцию 13 июля 2011 г. УДК 544.354.081.7:004.021.
Методы хемоинформатики в термодинамике равновесий.
Монокоронаты калия (18С6К+).
© Бондарев Сергей Николаевич,1 Зайцева Инна Сергеевна2
и Бондарев Николай Васильевич1*+
1 Харьковский национальный университет им. .
пл. Свободы, 4. г. Харьков, 61077. Украина. Е-mail: n_bondarev@ukr.net
2 Харьковская национальная академия городского хозяйства
Ул. Маршала Бажанова, 17. г. Харьков, 61002. Украина. Е-mail: inna.zaitseva123@yandex.ru
_______________________________________________
*Ведущий направление; +Поддерживающий переписку
Ключевые слова: хемоинформатика, искусственная нейронная сеть, множественная регрессия, массив данных, константа комплексообразования, 18-краун-6, энергия Гиббса, сольватация.
Аннотация
Множественная линейная регрессия и нейросетевое моделирование применены для анализа и прогнозирования энергии Гиббса (констант) устойчивости комплексов эфира 18-краун-6 с катионами калия в водно-органических растворителях. Проведено сопоставление результатов сольватационно-термодинамического и регрессионного анализа. Выявлены значимые факторы, влияющие на устойчи-вость короната калия. Построена нейросетевая модель (трехслойный персептрон) и показана перс-петивность применения нейронных сетей для прогнозирования констант устойчивости монокоронатов калия в водно-органических растворителях.
Введение
Краун-эфиры широко используются в научной практике как модели природных ионо-форов для исследования механизма транспорта катионов через биологические мембраны [1-3].
Принципиальным преимуществом синтетических ионофоров (краун-эфиров) является хорошо идентифицированная структура [3], характеризуемая наличием внутримолекулярной полости для включения катионов за счет электростатического ион-дипольного взаимодейст-вия, и возможность химической модификации с целью придания краун-эфирам физиологи-чески-активных свойств.
Важность разработки надежных теоретических подходов к анализу, обобщению и прогнозированию устойчивости краун-эфирных комплексов катионов, обусловлена с одной стороны наличием обширного экспериментального материала по термодинамике комплексо-образования, трактуемого разными авторами по-разному, а с другой – отсутствием обосно-ванных критериев выбора оптимального растворителя для управления процессом комплексо-образования.
Поэтому актуальным является совместное использование статистических, сольвата-ционно-термодинамических и нейросетевых подходов для анализа и прогнозирования термодинамики образования коронатов в водно-органических растворителях.
Целью данной работы является построение моделей множественной линейной регресс-сии (МЛР) и искусственных нейронных сетей (ИНС) для прогнозирования влияния водно-органических растворителей на свободную энергию Гиббса (константу) комплексо-образо-вания монокоронатов калия, а также сопоставление результатов статистического и термоди-намического анализа для выявления природы взаимодействий (электростатические, электро-нодонорные, электроноакцепторные, когезионные) в растворах.
Для анализа использованы экспериментальные данные по изменению свободной энер-гии Гиббса (
, кДж/моль) образования комплексов (LK+) краун-эфира 18К6 (L) с катио-ном калия в растворителях вода–метанол [4-8], вода–пропан-2-ол [4, 9], вода–ацетонитрил [4, 10, 11], вода–ацетон [12], вода–диоксан [13] при температуре 25 оС и стандартизованные в аквамоляльной концентрационной шкале [14].
В качестве свойств водно-органических растворителей при построении моделей исполь-зованы нормализованные дескрипторы [13]:
Ø диэлектрическая проницаемость (εN);
Ø дескрипторы электронодонорных и электроноакцепторных свойств, характеризующие способность растворителя выступать либо в качестве донора электронных пар – параметр Камлета-Тафта
, либо в качестве акцептора – параметр Димрота-Рай-хардта
;
Ø плотность энергии когезии – δ2N, характеризующая способность растворителя к образова-нию локальных разрежений (пустот), размеры которых достаточны для размещения ионов и молекул растворенного вещества.
Построение моделей множественной линейной регрессии осуществлено с помощью пакетов SPSS и Statistica, нейросетевой анализ данных проведен с помощью пакета Statistica Neural Networks, сольватационно-термодинамический анализ данных выполнен нами ранее [15-17].
Экспериментальная часть
1. Множественный линейный анализ
Для проведения анализа использованы данные по энергиям Гиббса образования комплексов LK+ вода–метанол, вода–пропан-2-ол, вода–ацетонитрил, вода–диоксан и вода–ацетон при 298.15 К с содержанием неводного компонента до 0.5 мол. доли (до области пересольватации [18], после которой изменяется состав сольватных оболочек реагентов и зависимость ΔGoLK+ от состава смешанных растворителей имеет явно выраженный нелинейный характер).
Множественная линейная модель связывает значения зависимой переменной Y (ΔGoLK+) со значениями независимых факторов Хk (1/eN, ETN, BKT, d2N) уравнением
, (1)
где е – случайная ошибка регрессии.
Для получения оценок bk коэффициентов Bk регрессии минимизировалась сумма квадратов оши-бок регрессии (МНК):
. (2)
Для отбора в регрессионное уравнение только значимых независимых переменных использован метод пошагового отбора (включения/исключения), суть которого заключается в следующем. На первом шаге вводится переменная, парная корреляция которой с зависимой переменной максимальна (табл. 1).
На каждом следующем шаге вводится переменная с самой сильной частной корреляцией. В то же время из модели удаляется наименее значимый предиктор.
В качестве критерия полезности переменных был выбран уровень значимости sig F ≤ 0.05 для включения и sig F ≥ 0.1 для исключения переменных из регрессионного уравнения. Значимость включения устанавливается меньше значимости исключения во избежание зацикливания процесса включения/исключения.
Значения коэффициентов парной корреляции указывают (табл. 1) на тесную связь свободной энергии Гиббса ΔGoLK+ с плотностью энергии когезии и умеренную связь ΔGoLK+ с остальными пре-дикторами.
Поэтому были проанализированы коэффициенты частной корреляции, которые дают более точную характеристику тесноты связи анализируемых признаков (табл. 2).
Коэффициенты частной (получастной) корреляции показывают, что наряду со значимым частным коэффициентом корреляции ΔGoLK+ с d2N (значение t-критерия 15, 8; sig F практически равно нулю) значимым является также частный (получастный) коэффициент корреляции ΔGoLK+ с 1/eN (значение t – критерия по модулю равно 2.1; sig F – значение меньше 5%). Толерантность (надеж-ность) дескрипторов ETN и BKT меньше 20%, что свидетельствует об их избыточности (наличии мультиколлинеарности).
Табл. 1. Корреляционная матрица [19]
n = 31 | ΔGoLK+ | 1/eN | ETN | BKT | d2N | |
Парные коэффициенты корреляции Пирсона | ΔGoLK+ | 1.000 | -0.730 | 0.835 | -0.720 | 0.967 |
1/eN | -0.730 | 1.000 | -0.786 | 0.572 | -0.607 | |
ETN | 0.835 | -0.786 | 1.000 | -0.900 | 0.751 | |
BKT | -0.720 | 0.572 | -0.900 | 1.000 | -0.680 | |
d2N | 0.967 | -0.607 | 0.751 | -0.680 | 1.000 |
Табл. 2. Частные коэффициенты корреляции и толерантность
Независимая переменная ΔGoLK+ | |||||||
Бета коэффициенты | Частная корреляция | Получастная корреляция | Толерантность | R2 | t(26) | sig F | |
1/eN | -0.12 | -0.376 | -0.067 | 0.28 | 0.716 | -2.1 | 0.049 |
ETN | 0.24 | 0.363 | 0.064 | 0.08 | 0.925 | 2.0 | 0.058 |
BKT | 0.09 | 0.203 | 0.034 | 0.14 | 0.858 | 1.0 | 0.299 |
d2N | 0.78 | 0.952 | 0.512 | 0.44 | 0.564 | 15.8 | 0.000 |
Примечание: Толерантность – (1 - R2) характеризует устойчивость регрессионного коэффициента (надежность); R – полный коэффициент парной корреляции; Бета коэффициенты – коэффициенты уравнения
, в котором
и
– стандартизованные переменные. Наблюдаемый коэффициент Стьюдента
.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 |


