Публикация доступна для обсуждения в рамках функционирования постоянно

действующей интернет-конференции “Бутлеровские чтения”. http:///readings/

Поступила в редакцию 13 июля 2011 г. УДК 544.354.081.7:004.021.

Методы хемоинформатики в термодинамике равновесий.

Монокоронаты калия (18С6К+).

© Бондарев Сергей Николаевич,1 Зайцева Инна Сергеевна2

и Бондарев Николай Васильевич1*+

1 Харьковский национальный университет им. .

пл. Свободы, 4. г. Харьков, 61077. Украина. Е-mail: n_bondarev@ukr.net

2 Харьковская национальная академия городского хозяйства

Ул. Маршала Бажанова, 17. г. Харьков, 61002. Украина. Е-mail: inna.zaitseva123@yandex.ru

_______________________________________________

*Ведущий направление; +Поддерживающий переписку

Ключевые слова: хемоинформатика, искусственная нейронная сеть, множественная регрессия, массив данных, константа комплексообразования, 18-краун-6, энергия Гиббса, сольватация.

Аннотация

Множественная линейная регрессия и нейросетевое моделирование применены для анализа и прогнозирования энергии Гиббса (констант) устойчивости комплексов эфира 18-краун-6 с катионами калия в водно-органических растворителях. Проведено сопоставление результатов сольватационно-термодинамического и регрессионного анализа. Выявлены значимые факторы, влияющие на устойчи-вость короната калия. Построена нейросетевая модель (трехслойный персептрон) и показана перс-петивность применения нейронных сетей для прогнозирования констант устойчивости монокоронатов калия в водно-органических растворителях.

НЕ нашли? Не то? Что вы ищете?

Введение

Краун-эфиры широко используются в научной практике как модели природных ионо-форов для исследования механизма транспорта катионов через биологические мембраны [1-3].

Принципиальным преимуществом синтетических ионофоров (краун-эфиров) является хорошо идентифицированная структура [3], характеризуемая наличием внутримолекулярной полости для включения катионов за счет электростатического ион-дипольного взаимодейст-вия, и возможность химической модификации с целью придания краун-эфирам физиологи-чески-активных свойств.

Важность разработки надежных теоретических подходов к анализу, обобщению и прогнозированию устойчивости краун-эфирных комплексов катионов, обусловлена с одной стороны наличием обширного экспериментального материала по термодинамике комплексо-образования, трактуемого разными авторами по-разному, а с другой – отсутствием обосно-ванных критериев выбора оптимального растворителя для управления процессом комплексо-образования.

Поэтому актуальным является совместное использование статистических, сольвата-ционно-термодинамических и нейросетевых подходов для анализа и прогнозиро­вания термодинамики образования коронатов в водно-органических растворителях.

Целью данной работы является построение моделей множественной линейной регресс-сии (МЛР) и искусственных нейронных сетей (ИНС) для прогнозирования влияния водно-органических растворителей на свободную энергию Гиббса (константу) комплексо-образо-вания монокоронатов калия, а также сопоставление результатов статистического и термоди-намического анализа для выявления природы взаимодействий (электростатические, электро-нодонорные, электроноакцепторные, когезионные) в растворах.

Для анализа использованы экспериментальные данные по изменению свободной энер-гии Гиббса (, кДж/моль) образования комплексов (LK+) краун-эфира 18К6 (L) с катио-ном калия в растворителях вода–метанол [4-8], вода–пропан-2-ол [4, 9], вода–ацетонитрил [4, 10, 11], вода–ацетон [12], вода–диоксан [13] при температуре 25 оС и стандартизованные в аквамоляльной концентрационной шкале [14].

В качестве свойств водно-органических растворителей при построении моделей исполь-зованы нормализованные дескрипторы [13]:

Ø  диэлектрическая проницаемость (εN);

Ø  дескрипторы электронодонорных и электроноакцепторных свойств, характеризующие способность растворителя выступать либо в качестве донора электронных пар – параметр Камлета-Тафта , либо в качестве акцептора – параметр Димрота-Рай-хардта ;

Ø  плотность энергии когезии – δ2N, характеризующая способность растворителя к образова-нию локальных разрежений (пустот), размеры которых достаточны для размещения ионов и молекул растворенного вещества.

Построение моделей множественной линейной регрессии осуществлено с помощью пакетов SPSS и Statistica, нейросетевой анализ данных проведен с помощью пакета Statistica Neural Networks, сольватационно-термодинамический анализ данных выполнен нами ранее [15-17].

Экспериментальная часть

1. Множественный линейный анализ

Для проведения анализа использованы данные по энергиям Гиббса образования комплексов LK+ вода–метанол, вода–пропан-2-ол, вода–ацетонитрил, вода–диоксан и вода–ацетон при 298.15 К с содержанием неводного компонента до 0.5 мол. доли (до области пересольватации [18], после которой изменяется состав сольватных оболочек реагентов и зависимость ΔGoLK+ от состава смешанных растворителей имеет явно выраженный нелинейный характер).

Множественная линейная модель связывает значения зависимой переменной YGoLK+) со значениями независимых факторов Хk (1/eN, ETN, BKT, d2N) уравнением

, (1)

где е – случайная ошибка регрессии.

Для получения оценок bk коэффициентов Bk регрессии минимизировалась сумма квадратов оши-бок регрессии (МНК):

. (2)

Для отбора в регрессионное уравнение только значимых независимых переменных использован метод пошагового отбора (включения/исключения), суть которого заключается в следующем. На первом шаге вводится переменная, парная корреляция которой с зависимой переменной максимальна (табл. 1).

На каждом следующем шаге вводится переменная с самой сильной частной корреляцией. В то же время из модели удаляется наименее значимый предиктор.

В качестве критерия полезности переменных был выбран уровень значимости sig F ≤ 0.05 для включения и sig F ≥ 0.1 для исключения переменных из регрессионного уравнения. Значимость включения устанавливается меньше значимости исключения во избежание зацикливания процесса включения/исключения.

Значения коэффициентов парной корреляции указывают (табл. 1) на тесную связь свободной энергии Гиббса ΔGoLK+ с плотностью энергии когезии и умеренную связь ΔGoLK+ с остальными пре-дикторами.

Поэтому были проанализированы коэффициенты частной корреляции, которые дают более точную характеристику тесноты связи анализируемых признаков (табл. 2).

Коэффициенты частной (получастной) корреляции показывают, что наряду со значимым частным коэффициентом корреляции ΔGoLK+ с d2N (значение t-критерия 15, 8; sig F практически равно нулю) значимым является также частный (получастный) коэффициент корреляции ΔGoLK+ с 1/eN (значение t – критерия по модулю равно 2.1; sig F – значение меньше 5%). Толерантность (надеж-ность) дескрипторов ETN и BKT меньше 20%, что свидетельствует об их избыточности (наличии мультиколлинеарности).

Табл. 1. Корреляционная матрица [19]

n = 31

ΔGoLK+

1/eN

ETN

BKT

d2N

Парные

коэффициенты

корреляции

Пирсона

ΔGoLK+

1.000

-0.730

0.835

-0.720

0.967

1/eN

-0.730

1.000

-0.786

0.572

-0.607

ETN

0.835

-0.786

1.000

-0.900

0.751

BKT

-0.720

0.572

-0.900

1.000

-0.680

d2N

0.967

-0.607

0.751

-0.680

1.000

Табл. 2. Частные коэффициенты корреляции и толерантность

Независимая переменная ΔGoLK+

Бета

коэффициенты

Частная

корреляция

Получастная

корреляция

Толерантность

R2

t(26)

sig F

1/eN

-0.12

-0.376

-0.067

0.28

0.716

-2.1

0.049

ETN

0.24

0.363

0.064

0.08

0.925

2.0

0.058

BKT

0.09

0.203

0.034

0.14

0.858

1.0

0.299

d2N

0.78

0.952

0.512

0.44

0.564

15.8

0.000

Примечание: Толерантность – (1 - R2) характеризует устойчивость регрессионного коэффициента (надежность); R – полный коэффициент парной корреляции; Бета коэффициенты – коэффициенты уравнения , в котором и – стандартизованные переменные. Наблюдаемый коэффициент Стьюдента .

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5