Количественные модели "структура-свойство" органических соединений тема автореферата и диссертации по химии, 02.00.03 ВАК РФ

Григорьев, Вениамин Юрьевич АВТОР
доктора химических наук УЧЕНАЯ СТЕПЕНЬ
Черноголовка МЕСТО ЗАЩИТЫ
2013 ГОД ЗАЩИТЫ
   
02.00.03 КОД ВАК РФ
Диссертация по химии на тему «Количественные модели "структура-свойство" органических соединений»
 
Автореферат диссертации на тему "Количественные модели "структура-свойство" органических соединений"

На правах рукописи

ГРИГОРЬЕВ Вениамин Юрьевич

КОЛИЧЕСТВЕННЫЕ МОДЕЛИ «СТРУКТУРА-СВОЙСТВО: ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ

02.00.03 - органическая химия 02.00.04 - физическая химия

Автореферат диссертации на соискание ученой степени доктора химических наук

31 ОКТ 2013

Черноголовка - 2013

005536335

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте физиологически активных веществ РАН

Официальные Балакин Константин Валерьевич, доктор

оппоненты: химических наук, Федеральное государственное

бюджетное образовательное учреждение высшего профессионального образования Московский физико-технический институт, г. Москва, заведующий кафедрой общей химии

Дьячков Павел Николаевич, доктор химических наук, профессор, Федеральное государственное бюджетное учреждение науки Институт общей и неорганической химии им. Н.С. Курнакова РАН, г. Москва, ведущий научный сотрудник лаборатории квантовой химии

Клюев Михаил Васильевич, доктор химических наук, профессор, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Ивановский государственный университет, г. Иваново, заведующий кафедрой органической и физической химии

Ведущая организация: Федеральное государственное бюджетное учреждение науки' Институт биохимическои физики им. Н.М. Эмануэля РАН, г. Москва

Защита состоится _декабЕЯ_ 2013 г. в 14:00 на заседании

диссертационного совета Д 002.102.01 при Институте физиологически

активных веществ РАН по адресу: 142432, Московская обл., г. Черноголовка,

Северный проезд, д. 1.

С диссертацией можно ознакомиться в библиотеке ИФАВ РАН.

Автореферат разослан «2Л_» 2013 г.

Ученый секретарь диссертационного совета,

кандидат химических наук

Афанасьева С.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Одной из фундаментальных задач химии является установление количественной связи между структурой вещества и его свойствами. К настоящему времени в мире синтезировано несколько десятков миллионов химических соединений, большинство из которых относится к органическим веществам. Эти соединения могут быть охарактеризованы большим количеством свойств, общее число которых, по некоторым оценкам, приближается к 10000.

Для многих соединений отсутствуют данные об их физико-химических и биологических свойствах, например, о способности к образованию водородной связи или об острой токсичности. Но распределение Н-донорных и Н-акцепторных центров и величины их активности нужны при конструировании новых биологически активных соединений, а знание количественных характеристик токсичности необходимо для оценки опасности промежуточных и конечных веществ при планировании и проведении многостадийного органического синтеза.

Ведущей задачей, которую решает органическая химия, является синтез соединений с полезными свойствами. Одним из рациональных путей достижения этой цели является компьютерный молекулярный дизайн на основе математических моделей «количественная связь структура - свойство» (С>8Р11)/«количественная связь структура - активность» (О^АК.). Компьютерное конструирование С^РК/С^АК. моделей требует гораздо меньше времени и материальных ресурсов, чем экспериментальные исследования, а созданные модели позволяют оценивать свойства неисследованных химических соединений и предсказывать новые структуры с заданными свойствами.

Работа выполнена в соответствии с планами научно-исследовательских работ Института физиологически активных веществ РАН «Компьютерный молекулярный дизайн, включая количественную связь структура-свойство (активность) и молекулярное моделирование взаимодействия лиганд-мишень

для структурной генерации соединений с заданными свойствами» (№ госрегистрации 0120.0 504023) при финансовой поддержке Российского фонда фундаментальных исследований: проект № 97-03-33068-а «Молекулярное моделирование связи структура-активность с учетом трехмерности структур и их способности к образованию водородных связей» и Международного научно-технического центра: проект № 888 «Компьютерное предсказание химической экотоксичности» и проект № 3777 «Развитие и применение КССА моделей токсичности химических соединений по отношению к грызунам».

Цель работы. Разработка количественных моделей «структура -свойство» и «структура - активность» с использованием дескрипторов водородной связи и других молекулярных дескрипторов для компьютерного дизайна органических соединений, включая прогнозирование физико-химических свойств и биологической активности неисследованных соединений и предсказание новых структур с заданными свойствами.

Научная новизна. На основе литературных и собственных экспериментальных данных разработана физико-химическая аддитивно-мультипликативная модель энтальпии и свободной энергии Н-комплексов, сконструирована единая энергетическая шкала водородной связи и создана компьютерная программа для молекулярного дизайна органических соединений с заданной величиной Н-донорной и Н-акцепторной активности.

Создана модель липофильности органических соединений, основанная на линейной комбинации двух физико-химических параметров: молекулярной поляризуемости и Н-акцепторного дескриптора водородной связи.

С использованием молекулярных дескрипторов, в том числе дескрипторов Н-связи, сконструированы оригинальные кластерные, классификационные и регрессионные модели «структура - активность» для компьютерного дизайна органических соединений, включая оценку острой токсичности, ретардантной активности и способности проникновения через гематоэнцефалический барьер неисследованных новых соединений и предсказание структур с заданным уровнем биологической активности.

Впервые разработана рекуррентная модель для описания связи «структура - активность» в гомологических рядах органических соединений, отличающаяся от известных моделей отсутствием дескрипторов.

Впервые предложен, разработан и применен новый ЗБ дескриптор для оценки фрактальных свойств молекулярных гистограмм межатомных расстояний.

Впервые предложена, разработана и применена линейная динамическая модель для компьютерного молекулярного дизайна ЗВ структур с заданными свойствами.

Практическая значимость работы. Значительная часть диссертационной работы была выполнена в рамках участия в разработке в ИФАВ РАН двух баз данных по Н-комплексообразованию органических соединений. При этом база данных по термодинамическим характеристикам Н-комплексов, насчитывающая свыше 13000 записей, нашла использование в качестве источника информации при проведении теоретических и практических исследований в области органической и физической химии. База данных по протонодонорным и протоноакцепторным дескрипторам Н-связи, содержащая свыше 50000 записей, а также компьютерная программа НУВОТ, созданная на ее основе, служат для количественной оценки способности органических соединений к образованию водородной связи и нашли применение при проведении С^РК/С^АЛ исследований. Разработанные в диссертации модели могут использоваться как для количественной оценки физико-химических свойств и биологической активности новых неизученных органических соединений, так и для предсказания структур с заданными свойствами.

Личный вклад автора. Все результаты диссертации получены лично автором или в соавторстве при его непосредственном участии. В работах, выполненных в соавторстве, вклад автора состоял в непосредственном участии во всех этапах работы, начиная от постановки задачи и завершая обсуждением результатов. Синтез, очистку и идентификацию новых физиологически активных соединений выполнили сотрудники ИФАВ РАН: Иванов А.Н.',

Соколов В.Б., Чепакова JI.A., Брель В.К., Додонов М.В., Прошин А.Н., Чистяков В.Г. Биологические испытания на ретардантную активность провел Кокурин A.B. (ВНИИСБ РАСХН). Вклад автора в программный комплекс HYBOT, разработанный совместно с Раевским O.A., Трепалиным С.В. и Раевской O.E. (ИФАВ РАН), заключался в создании термодинамической базы данных и базы дескрипторов Н-связи.

Автор выражает глубокую признательность доктору химических наук, профессору Раевскому O.A. за ценные научные консультации во время выполнения работы.

Апробация работы. Результаты исследования и основные положения работы были представлены на следующих конференциях, симпозиумах и конгрессах: ЕХ Всесоюзная конференция «Химическая информатика» (Черноголовка, 1992); 12 Международный симпозиум по медицинской химии (Базель, Швейцария, 1992); 9 Европейский симпозиум по количественным соотношениям структура-активность (Страсбург, Франция, 1992); IV Российский конгресс «Человек и лекарство» (Москва, 1997); VI Российский конгресс «Человек и лекарство» (Москва, 1999); 4 Международный симпозиум по компьютерным методам в токсикологии и фармакологии (Москва, 2007); XVII Российский конгресс «Человек и лекарство» (Москва, 2010); 18 Европейский симпозиум по количественным соотношениям структура-активность (Родес, Греция, 2010); XVIII Российский конгресс «Человек и лекарство» (Москва, 2011), XIX Российский конгресс «Человек и лекарство» (Москва, 2012).

Публикации. По теме диссертации опубликовано 40 печатных работ, включая 20 статей в рецензируемых российских и международных журналах, получено 3 свидетельства об официальной регистрации программ для ЭВМ.

Объем и структура диссертации. Работа изложена на 324 страницах машинописного текста, содержит 37 таблиц и 33 рисунка. Диссертация состоит из введения, шести глав, заключения, списка литературы из 427 наименований.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность работы, сформулированы цель и задачи исследования, показана научная новизна и практическая значимость полученных результатов.

Глава 1. Современное состояние в области создания количественных моделей «структура - свойство» и «структура - активность» (на примере острой токсичности органических соединений). Из анализа литературы следует, что во многих публикациях отмечается важная роль водородной связи при формировании биологической активности. Однако при этом способность соединений к образованию Н-связи в разработанных моделях выражается на полуколичественном уровне в виде числа доноров и акцепторов, без учета молекулярного окружения. Очевидно, что качество моделей «структура -активность» может быть улучшено при применении адекватных дескрипторов водородной связи.

Часто используемым дескриптором для конструирования моделей «структура - активность» органических соединений является липофильность в виде коэффициента распределения вещества в системе н-октанол-вода (К™). Однако физико-химическая природа этого дескриптора выявлена не в полной мере. Кроме того, он является экспериментально определяемой величиной, что создает трудности при моделировании свойств больших рядов соединений. Одним из путей для решения этой проблемы может служить замена К<,„ другими дескрипторами.

Число глобальных моделей «структура - активность», играющих важную роль при быстрой предварительной оценке биологической активности большого числа разнообразных органических соединений, мало по сравнению с большим числом локальных моделей. Необходимо качественное улучшение и количественное увеличение числа глобальных моделей.

Также можно сделать вывод о недостаточном числе исследований в области развития методологии (^РИД^АЯ. В первую очередь, это относится к

разработке новых дескрипторов и статистических моделей «структура -свойство».

Глава 2. Экспериментальная часть. Описаны физико-химические и биологические данные; расчет, преобразование и отбор дескрипторов; меры структурного сходства; статистические методы исследования и валидация моделей; методика проведения спектральных и калориметрических измерений. Глава 3. Количественные модели «структура - физико-химические свойства» органических соединений

3.1. Аддитивно-мультипликативная модель энтальпии и свободной энергии водородной связи. Монофункциональные соединения

Из литературы были отобраны данные, содержащие сведения о термодинамических характеристиках Н-комплексов и удовлетворяющие следующим условиям: 1) состав 1:1, с одним водородным мостиком; 2) растворитель СС14; 3) для каждого комплекса имеются значения АН (кДж/моль) и ДО (кДж/моль); 4) АН и AG рассчитаны на основе экспериментальных данных и соответствуют температуре 298 К. Общее число Н-комплексов, образованных с участием 163 Н-доноров (NH-, ОН-, SH-, СН-доноры) и 195 Н-акцепгоров (N-, О-, S-, я-акцепторы), составило 936. Для установления соотношения между термодинамическими характеристиками и дескрипторами Н-связи была использована аддитивно-мультипликативная модель:

(1)

ДН = k,EaEd + ко

(2)

AG = ki CaCd + ко

где ко, кь ко*, к,* - параметры; Еа - энтальпийный протоноакцепторный дескриптор; Ed - энтальпийный протонодонорный дескриптор; С* -свободноэнергетический протоноакцепторный дескриптор; Cd свободноэнергетический протонодонорный дескриптор. Для расчета параметров уравнений (1) и (2) необходима фиксация Е и С дескрипторов для одного (стандартного) Н-донора и одного (стандартного) Н-акцептора. Эти соединения должны удовлетворять двум требованиям: 1) для них должно быть известно достаточно большое количество Н-комплексов и 2) они должны быть

удобными при экспериментальном применении. В качестве стандартного Н-донора был выбран фенол (Еа=-2.50; Сй=-2.50), в качестве стандартного Н-акцептора- гексаметилфосфортриамид (ГМФТА) (Еа=2.50; С,=4.00). Величины дескрипторов для стандартных соединений были выбраны таким образом, чтобы сделать шкалу с интервалом изменения дескрипторов от 0.00 до (= -5.00) для Н-доноров и от 0.00 до (= 5.00) для Н-акцепторов.

Ввиду отсутствия в отобранном массиве данных Н-комплексов с положительной величиной ДН, коэффициент ко в уравнении (1) был положен равным 0. Учитывая, что нижняя граница надежного определения констант Н-комплексов (1:1) соответствует величине приблизительно равной 0.1 л/моль, коэффициент ко* (уравнение (2)) был зафиксирован на уровне 5.70 кДж/моль.

При известных величинах ДН и ДО для комплексов исследуемого соединения и стандарта с одним и тем же партнером из уравнений (1) и (2) можно рассчитать Н-донорные или Н-акцепторные дескрипторы соединения. Путем итеративного повторения этой процедуры удалось оценить величины дескрипторов для 347 соединений. При этом величины Ел менялись в пределах от -0.34 (С6НС15) до -3.93 (СС13СООН), С„ от -0.00 (С6НС15) до -4.78 (СС13СООН), Еа от 0.50 (С6Н6) до 5.21 ((С4Н9)2НН), Са от 0.43 (СС13СК) до 4.99 (1,4-диазобицикло[2,2,2]октан). Путем варьирования и минимизации были определены коэффициенты к] и к]* моделей (1) и (2):

АНРасч(кДж/моль) = 4.96 ЕаЕа (3)

ДСрасч(кДж/моль) = 2.43 СаС<| + 5.70 (4)

Адекватность полученных моделей была подтверждена путем сопоставления экспериментальных и рассчитанных величин ДН и Дв:

АНР>СЧ = -0.27(±0.45) + 1,00(±0.02) ДНЖСП ^

п=936; г=0.954; 8=2.70; Р=9553

Дбрасч = -0.07(±0.12) + 1.00(±0.01) ДОэксп (6)

п=936; г=0.984; 8=1.11; Р=28556

Статистические характеристики уравнений (5) и (6) свидетельствуют о том, что аддитивно-мультипликативная модель дает возможность реальной

оценки ДН и Дв и позволяет надежно рассчитать дескрипторы водородной связи. Величины дескрипторов Ичвязи органических соединений являются базой для создания единой энергетической шкалы водородной связи (рис.1). Потная количественная оценка способности органического соединения к образованию Н-связи может был. выполнена на основе четырех дескрипторов: Е,, Е„, С., С* Из представленных данных ясно, что молекулярное окружение оказывает существенное влияние на величины дескрипторов активных центров. Также можио констатировать, что разные по природе химические соединения могут иметь одинаковую способность к образованию водородной связи.

Рис. 1. Единая энергетическая шкала водородной связи

В литературе, кроме данных по Н-комплексам в ССЦ, приводятся величины АН н Дв в других неполярных растворителях. С этими данными была проведена работа аналогичная рассмотренной выше. Из анализа полученных результатов можно сделать вывод о том. что дескрипторы Н-связи сохраняют приблизительно одинаковое значение в разных растворителях, при этом происходит только изменение коэффициентов к. и к,* в уравнениях (I) и (2). 3.2. Аддитивно-мультипликативная модель энтальпии и свободной энергии водородной сети. Полифункционвльные соединения

Для проверки работоспособности аддитивно-мультипликативной модели Н-связи в случае сложных органических соединений были проведены

экспериментальные исследования с использованием ИК-спектрофотометрии, калориметрии и математического моделирования. Они включали в себя установление стехиометрии, определение взаимодействующих атомов и групп, расчет величин ДН, ДО для Н-комплексов и оценку величины дескрипторов Н-связи. В исследовании принимали участие 22 фосфорилированных и тиофосфорилированных оксима общей формулы: (К1)(к2)Р(Х)ОНС(Яз)(114) (где Я,=Ме, МеО, ЕЮ, РгО, ВиО; Н2=МеО, ЕЮ, РгО, ьРЮ, ВиО, АшО; Т13=Мс, Е1, Рг, СН2С1; К4^Ме, Е1, Рг, С1; Х=0, Б), которые можно рассматривать в качестве аналогов инсектицида «валексон» (ЕЮ)2Р(8)ОКС(СбН5)СКт и 10 дифторнитроацетанилидов общей формулы: (4-К5)(3-К<)С6НзКНС(0)Ср2К02 (где Я5=Н, СНз, ОСНз, Р, С1, М02; Н«=Н, СН3, С¥3, Р, Ж>2), которые можно рассматривать в качестве аналогов гербицида «пропанид» 3,4-С12-С6Н3КНС(0)С2Н5.

Вначале были установлены величины АН и ДО при образовании Н-комплексов между фосфорилированными оксимами и фенолом, а также между дифторнитроацетанилидами и ГМФТА. Это позволило рассчитать дескрипторы Н-связи соответствующих соединений.

Следующим шагом стало изучение комплексов с участием этих соединений. При этом фосфорилированные оксимы выступали в качестве Н-акцепторов, а дифторнитроацетанилиды - в качестве Н-доноров (табл. 1). При сравнении экспериментальных и рассчитанных на основе аддитивно-мультипликативной модели термодинамических величин можно установить, что в случае ДН минимальное отклонение (по абсолютной величине) составляет 0.2 кДж/моль, максимальное 1.3 кДж/моль и среднее 0.6 кДж/моль, а для ДО 0.1 кДж/моль, 1.1 кДж/моль и 0.8 кДж/моль соответственно. Таким образом, можно констатировать вполне удовлетворительное совпадение экспериментальных и рассчитанных термодинамических характеристик Н-комплексов.

Таблица 1. Экспериментальные и рассчитанные термодинамические характеристики Н-комплексов фосфорилированных оксимов с дифторнитроацетанилидами (бензол; 298 К; 1:1) и дескрипторы Н-связи (Еа, Са, ЕЙ, Са)

_Н-акцептор_Н-донор_-АН, кДж/моль -ДО, кДж/моль

№ Е,_С, № -Еа_-Сл Эксп. Расч.* Эксп. Расч.*

П 1 71±0.09 3.08±0.11 V 2.71 ±0.06 2.41±0.07 18.9±1.0 20.2±1.5 10.5±0.6 10.4±1.0 II 1.71±0.09 3.08±0.11 V 2.71±0.06 2.41±0.07 18.9±1.0 20.2±1.5 10.5±0.6 10.4±1.0 II 1.71±0.09 3.08±0.11 VI 2.48±0.02 3.01±0.06 18.9±1.0 18.5±1.1 13.8±0.б 14.4±1.1 1П 1.73±0.09 2.84±0.11 V 2.71±0.06 2.41±0.07 19.4±1.0 20.4±1.5 9.98±0.6 9.24±1.0 Ш 1.73±0.09 2.84±0.11 VI 2.48±0.02 3.01±0.06 18.9±1.0 18.7±1.1 13.5±0.6 12.4±1.1 IV 1.75±0.09 3.04±0.11 V 2.71±0.06 2.41±0.07 19.8±1.0 20.6±1.5 П.0±0.6 10.3±1.0 ГУ 1.75±0.09 3.04±0.11 VI 2.48±0.02 3.01±0.0б 19.6±1.0 18.9±1.1 15.3+0.6 14.2±1.1 Примечание: 'АН = 4.35 Е^; ДО = 5.70 + 2.17 СаСа; (Мс)(Ви0)Р(0)0МС(Ме)(С1) (II); (Ме)(Ви0)Р(0)0ЫС(Е1)(С1) (П1); (Ме)(Ви0)Р(0)(ЖС(Рг)(С1) (1У);4-СНз-СбН4ШС(0)СР2М02 (V); 4^02-С<|Н4ННС(0)Ср2К02 (VI).

3.3. Модель липофильности органических соединений

Для количественного описания липофильности было отобрано 71 простое органическое соединение, содержащее по одной Н-акцепторной группе. В состав этих групп входили атомы О, N. 8, V, С1, Вг, С. В качестве независимых переменных были использованы молекулярная поляризуемость (а) и свободноэнергетические Н-акцепторные дескрипторы (Са). Интервал изменения этих величин составлял 3.25-4-21.44 А3 и 0.20^-3.12 соответственно. Величины к^К™ менялись в пределах от -0.97 до 4.75. В результате была получена следующая модель:

1<^Ко„ = 0.266(±0.006) а - 1,00(±0.05) С, (7)

п=71; г2=0.982; 5=0.18; Р=3829; я2=0.981

Статистические критерии уравнения (7) свидетельствуют о возможности количественной оценки значений 1ояКоЖ на основе рассчитанных величин а и С„. Внешняя валидация модели была проведена путем расчета аналогичной модели с использованием другого ряда из 98 соединений, содержащих Н-акцепторные атомы О, N. С1, Вг, I, С. Интервал изменения величин составлял -1.01-^5.15, 2.25-28.77 А3, 0.00-^2.96 для к^К™, а, Са соответственно. Параметры полученной модели (8) оказались близки к параметрам модели (7):

= 0.276(±0.008) а- 1.01(±0.07) Са (8)

п=98; 1^=0.961; э=0.29; 191; я2=0.959 Преобразование уравнения (7) к следующему виду:

С, = 0.266 а - 1с^К<„„ ^

дает возможность рассчитать дескрипторы Са* соединений, с использованием величин а и ^Ко„.

Имеется много опубликованных данных по экспериментальным величинам ^К,,,, как простых, так и сложных органических соединений. Это дает возможность на основе уравнения (9) оценить Н-акцепторную способность тех атомов и функциональных групп, которые не могли быть определены в рамках шкалы, основанной на термодинамических параметрах (табл. 2). Таблица 2. Свободноэнергетические Н-акцепторные дескрипторы, полученные на основе липофильности (Са*), свободной энергии (Са) и их разность (ДСа) для органических соединений с несколькими гетероатомами

№ Соединение с.' Са ДСа

1 м-Нитробензойная кислота 0.62 0.47 0.15

2 Бензойная кислота 1.03 0.76 0.27

3 Этилтрихлорацетат 1.21 1.11 0.10

4 Уксусная кислота 1.47 1.10 0.37

5 Метилацетат 1.60 1.40 0.20

6 Бутиролактон 2.71 2.05 0.66

7 М,М-Диметилацетамид 3.02 2.76 0.26

8 Мочевина 3.06 2.50 0.56

9 М-Метилацетамид 3.15 2.70 0.45

10 2-Пилеридон 3.34 2.95 0.39

Представленные данные свидетельствуют о том, что в случае сложных органических соединений величина Са* превышает значение дескриптора для наиболее сильного Н-акцептора (Са) и, вероятно, соответствует сумме свободноэнергетических Н-акцепторных дескрипторов в молекуле, в то время как их разность (ДСа) характеризует потенциальную возможность к образованию Н-связи слабых Н-акцепторных центров в молекуле. Это открывает широкие возможности для существенного увеличения числа соединений с количественно охарактеризованной Н-акцепторной способностью.

3.4. Компьютерный программный комплекс НУВОТ

Комплекс НУВОТ предназначен для расчета дескрипторов Н-связи и молекулярного дизайна новых органических соединений с заданной величиной Н-донорной или Н-акцепторной активности. Он состоит из трех главных компонентов. Во-первых, это база данных (БД) по термодинамике водородной связи, которая содержит экспериментальные величины ДН и ДБ Н-комплексов в различных средах. В настоящее время эта БД насчитывает 13688 записей (т.е. сведений об одной паре реакций Н-донор/Н-акцептор).

Другой составной частью НУВОТ является БД дескрипторов, содержащая Н-донорные и Н-акцепторные дескрипторы органических соединений, рассчитанных в рамках общей шкалы водородной связи. Эта БД содержит 4 библиотеки дескрипторов: Еа (1025 дескрипторов), Еа (2060 дескрипторов), СЛ (2835 дескрипторов), Са (46372 дескриптора).

Третьей составной частью НУВОТ является программа, которая рассчитывает дескрипторы органических соединений на основе их 2П структуры с использованием баз данных, содержащих термодинамические характеристики Н-комплексов и дескрипторы Н-связи.

Известно, что водородная связь играет важную роль для проявления многих видов физико-химических свойств и биологической активности, поэтому ее учет при проектировании соединений для целевого органического синтеза является необходимой и важной задачей. Дизайн новых органических соединений с использованием НУВОТ может быть проведен как путем решения прямой задачи (расчет дескрипторов Н-связи для известных структур), так и путем решения обратной задачи (генерация структур/подструктур с известной величиной Н-дескриптора). Пример расчета молекулы диклофенака в рамках прямой задачи приведен на рис. 2. Из представленных данных, в частности, следует, что максимальные величины дескрипторов Са, Еа, О,, Еа составляют 1.50, 2.00, -2.50, -2.90 соответственно. При этом произведена полная идентификация Н-активных центров (атомов) в молекуле. Так выделенный атом кислорода является Н-акцепторным центром и характеризуется величинами Са=1.42 и Еа=1.50.

Рис. 2. Н-дсскрниторы ;иш молекулы диклофенака

В рамках решения обратной юлами рассмотрим а1учай. когда для органическою сшпси необходимо иметь набор подструктур с жданной величиной Н-акценторной активности С,=2.00. С помощью НУВОТ было найдено 375 соответствующих структур. Некоторые ич них приведены ниже.

Из представленных данных очевидно, что одинаковую величину Н-акиепторной акт внос ти М01уг иметь различные по природе атомы, с различным типом гибридизации и молекулярным окружением, входящие в состав ациклических, циклических и ароматических структур.

Глава 4. Количественные локальные модели «структура - биологическая активность» органических соединений

4.1. Классификационные и регрессионные модели неполярного наркоза

В работе были использованы величины острой токсичности (LC5o, ммоль/л, 96 час., лит. данные) 118 органических соединений с типом токсического действия (MOA, mode of action) неполярный наркоз по отношению к рыбам Poecilia reticulata (Pr), Pimephales prometas (Pp) и Oncorhynchus mykiss (От). Молекулярные дескрипторы соединений рассчитывали с использованием программ HYBOT, DNESTR и SYBYL. Фрагментные дескрипторы рассчитывали с помощью программы MOLDIVS. Классификация выполнена на основе линейного дискриминантного анализа (LDA) с применением ряда из 4-х HYBOT дескрипторов а, Хя, £Ca, £Cd (LDA4D), ряда из 10-12 главных компонент (LDA PC), и метода структурного сходства (SS) (аналог метода к-ого ближайшего соседа) с использованием фрагментных дескрипторов и метрики в виде коэффициентов Танимото.

Отдельные результаты классификации представлены в табл. 3. Высокая эффективность дискриминации была достигнута при использовании метода SS: общая степень правильного распознавания составляла 0.932 в обучающей выборке и 0.914 в тестовой выборке.

Таблица 3. Чувствительность (Sn), специфичность (Sp) и точность (Асс) при

бинарной классификации химических соединений с MOA неполярный наркоз

(класс 1) и другие MOA (класс 2) по отношению к P. reticulata (Pr) с

использованием методов линейного дискриминантного анализа (LDA) и

структурного сходства (SS)

Обучающая выборка Тестовая выборка

№ Объект Метод -- - ; " I 7

щ/п2 Sn Sp Асс ni/n2 Sn Sp Асс

1 Pr LDA4D 72/163 0.472 0.859 0.740 18/40 0.333 0.850 0.690

2 Pr LDA_PC 72/163 0.639 0.834 0.774 18/40 0.556 0.825 0.741

3 Pr SS_3 72/163 0.986 0.908 0.932 18/40 0.944 0.900 0.914 Примечание: nt - число соединений в первом классе, п2 - число соединений во втором классе.

Учитывая высокую степень межвидовой корреляции значений токсичности для трех рыб (гЧ).94+0.99), возможно построение общей регрессионной модели токсичности:

1с^(1/ЬС50) = -1.75(±0.05) + 0.89(±0.03) (10)

п=150; г2=0.936; 8=0.36; р=2171

1оё(1Л.С50) = -1.96(±0.09) + 0.258(±0.006) а - 0.88(±0.03) £Са (11}

п=150; 1^=0.943; 8=0.34; р=1211

Область применимости (ОП) модели (11): химический класс: хлоралканы, хлорбензолы, эфиры, кетоны, спирты; интервал 1ое(1/ЬС50): -2.96+3.15; а: 3.25+23.43 А3; 1Са: 0.18+5.77; ХСа: -4.16+0.00.

Главное преимущество модели (11) по сравнению с традиционной моделью (10) состоит в использовании не экспериментальных, а рассчитанных дескрипторов. Кроме того, уравнение (11) дает возможность количественной оценки вкладов с противоположными эффектами: молекулярной поляризуемости, которая увеличивает токсичность, и Н-акцепторной способности, которая уменьшает ее.

4.2. Классификационные и регрессионные модели полярного наркоза

Для исследования была использована выборка, содержащая сведения по острой токсичности (ЬС50, ммоль/л, 96 час., лит. данные) 134 соединений с МОА полярный наркоз по отношению к трем рыбам Рг, Рр и От.

Использование метода Ы)А_4Б привело к получению удовлетворительной дискриминации между соединениями (табл. 4). Так степень общего правильного распознавания для Рг составила 0.855 и 0.860 в обучающей и тестовой выборках соответственно. Однако метод 88 обеспечивал получение более хороших результатов: в обучающей выборке Асс=0.906, а в тестовой Асс=0.947.

Высокий коэффициент корреляции межвидовой токсичности между Рг и Рр (1^=0.91) свидетельствует о возможности создания общей модели: 1оЕ(1/ЬСзо) = -0.78(±0.06) + 0.72(±0.02)1оВК<)ж (12)

п=169; 1^=0.860; 8=0.37; Р=1022; q2=0.857

1о8(1/ХС5о) = -1.02(±0.14) + 0.192(±0.007) а - 0.68(±0.04) £Са - 0.11 (±0.02 ) ^ (13)

п=169; г2=0.886; 5=0.34; р=427; ч2-=0.879

ОП модели (13): химический класс: нитробензолы, амины, анилины, фенолы; интервал log(l/LCS0): -1.54-3.58; а: 5.80+30.26 A3; ХСа: 0.48+4.18; XQ: -6.52+0.00.

Таблица 4. Чувствительность (Sn), специфичность (Sp) и точность (Асс) при

бинарной классификации химических соединений с МОА полярный наркоз

(класс 1) и другие МОА (класс 2) по отношению к P. reticulata (Рг) с

использованием методов линейного дискриминантного анализа (LDA) и

структурного сходства (SS)

Обучающая выборка Тестовая выборка Метод ■

Щ/П2 Sn Sp Асс m/n2 Sn Sp Асе

LDA 4D 96/138 0.792 0.899 0.855 23/34 0.826 0.882 0.860

LDA PC 96/138 0.833 0.899 0.872 23/34 0.870 0.882 0.877

SS_1 96/138 0.896 0.913 0.906 23/34 0.957 0.941 0.947 Примечание: n, - число соединений в первом классе, п2 - число соединений во втором классе.

Необходимо отметить, что дескриптор logKow не дает информации о механизме действия, потому что он является композитным дескриптором, включающим в себя влияние нескольких факторов. А модели, использующие HYBOT дескрипторы для описания неполярного и полярного наркоза, позволяют заглянуть внутрь механизма неспецифической токсичности. 4.3. Линейный дискримииантно-регрессчонный подход

Известно, что в основе кластерного анализа лежит группировка молекул с применением математической модели связи между молекулами с использованием формальных алгоритмов. Как показывает наш опыт и данные других исследователей применение кластерного анализа для создания QSPR/QSAR моделей во многих случаях не приводит к получению значимых результатов. В разработанном нами дискриминантно-регрессионном подходе (ЛДРП) для кластеризации молекул используется неформальная модель связи между структурой и свойствами молекул. Целью ЛДРП является выделение молекулярных кластеров, соответствующих заданной регрессионной модели «структура - свойство». В работе был использован ряд из 293 соединений с известными величинами активности (LC50, ммоль/л, 96 час., лит. данные) и 4

16

1 Рг

2 Рг

3 Рг

типами МОЛ (мсполярный наркоз. полярный наркоз, реактивный, особый) по отношению к рыбе Рг. Интервал изменения величин составлял для ЬвПАС»): -2.94+5.74, -1.87+6.21, а: 3.25+39.10 А\ £С,: 0.00+8.05. Для реализации

ДДРП была создана компьютерная программа, в которой модель «структура свойство» представлена в виде к^О/ТХ«,) = а + Ь1овК,,„. где а, Ь - параметры. Основной задачей нрофаммы была генерация большого числа молекулярных кластеров путем выделения стартового кластера из двух молекул н циклического шипорения 2-х основных шагов: построения для кластера регресснонной модели «структура свойство» и добавления к этому кластеру ближайшей (по нормали) молекулы к линии регрессии

Д/1Я анализа полученных кластеров был разработан ряд критериев, которые определялись для каждого кластера в отдельности. Первый критерий (МСС корреляционный коэффициент Мпмоза) характеризует степень обособленное!и рассматриваемого кластера молекул от всех остальных молекул. В качестве классификатора в настоящей работе использовался 1Л)А Второй критерий (М) связан с размером определенного паттерна, выявляемою при анализе формы зависимости МСС от размера кластера N. Еще одним критерием служила величина коэффициента корреляции (Я), коюрая характеризовала степень линейности кластеров молекул.

Рис. 3. Зависимость линейного коэффициента корреляции и корреляционно! о коэффициента М л ьнпа от числа молекул в кластере

N

На рис. 3 представлена типичная картина, наблюдаемая при использовании ЛДРП. При увеличении числа молекул в кластере R2 плавно уменьшается от 1.000 (2 молекулы) до 0.560 (292 молекулы). МСС ведет себя более сложным образом. Минимальная величина для стартовой пары молекул, линейно неотделимых от остальных молекул, составляет 0.000, а при размере кластера 292 молекулы МСС=1.000. При этом при увеличении размера кластера наблюдается несколько кластерных пиков, размер которых и положение зависит от стартовой молекулярной пары. Для дальнейшего исследования полученных 293-292-291/2=12448398 молекулярных кластеров был проведен их отбор с использованием следующих граничных значений критериев: М>25, R2>0.9, МСС>0.9. В результате отбора было выявлено двенадцать кластеров. Минимальный размер кластера равен 105 молекулам, а максимальный - 123 молекулам. Относительно небольшой диапазон изменения размеров позволил выдвинуть предположение о близости составов полученных групп. Действительно, при анализе содержимого двенадцати кластеров была обнаружена большая группа молекул (N=80), которая входит в состав всех кластеров. В результате для выделенной группы из 80-ти молекул было установлено, что 53 молекулы относятся к группе с MOA неполярный наркоз, 19 - к полярному наркозу, 5 молекул являются реактивными и 3 - особыми. Т.е. основную массу молекул составляют молекулы с неспецифическим характером действия (неполярный наркоз + полярный наркоз). Их доля оказывается равной 100-(53+19)/80=90%. Учитывая это, мы сконструировали для этого кластера регрессионную модель зависимости токсичности от липофильности:

log(l/LC;o) = -1.81 (±0.06) + 0.88(±0.02) IogK^ (14)

п=80; г2=0.966; s=0.23; F=2199; q2=0.964

Параметры уравнения (14) очень хорошо соответствуют параметрам уравнения (15), построенного для ряда из 90 молекул с MOA неполярный наркоз: log(I/LC5o) = -1.79(±0.06) + 0.88(±0.02) logK™ (15)

n=90; r2=0.948; s=0.34; F=1596; q2=0.945

4.4. Ретардантная активность солей четвертичного аммония

Для исследования ретардантной активности был использован антигиббереллиновый тест (1С50, моль/л) для ряда из 12 производных холина и триэтилхолина: (Я,)3М+СН2СН2-Я2 А" где Я,=СНз, С2Н5; Я2=ОН, ОСН3, ОС2Н5, ОСН2С6Н5, Б, С1, Вг; А=Б, С1, Вг и 12 хлоридов ГЧ,Ы-диалкилпиперидиниев:

где Я,=СН3, С2Н5, С3Н7, С4Н9, СН2С6Н5; Я2=СН3, С4Н9, С6Н5, СН2СН2ОСН3, СН2СН2ОС2Н5, СН2СН2ОСН2С6Н5. В результате С^БАЯ моделирования для ряда диалкилпиперидиниев была получена следующая регрессионная модель: 1оё(1/1С50) = 14.93(±) .82) + 0.14(±0.04) а - 0.83(±0.19) С/'" +1.52(±0.30) Е, (16)

п=12; г2=0.895; 8=0.38; я2=0.788

ОП модели (16): химический класс: хлориды Ы,Ы-диалкилпнперидиния; интервал 1оё(1/1С50): 2.98-5.95; а: 14.58h-38.21 А3; СУгах: 0.00+1.49; -Е5: 7.09^-10.25.

Полученные данные свидетельствуют о том, что существенную роль в формировании антигиббереллиновой активности исследованных солей играют поляризуемость, Н-акцепторная способность молекул и стерический параметр. Определяющее влияние стерического фактора связано, по-видимому, с тем, что четвертичный атом азота встроен в пиперидиновое кольцо. Это ограничивает конформационные возможности молекулы при ее взаимодействии с активным центром рецептора и предъявляет повышенные требования к молекулярным свойствам, которые привносят фрагменты 1*1 и Я2.

Представленные в главе 4 локальные модели «структура - активность» могут быть использованы для предсказания биологической активности и для получения информации о структуре соединений с заданной величиной активности. Возьмем, например, модель (11). Оценка величины к^(1/ЕС50) для соединения с известной структурой не представляет сложности: достаточно рассчитать величины а и £Са и подставить их в соответствующее уравнение.

Например, для молекулы н-октанола (а=16.09 А3, ХСа=1.61) расчетная величина 1о£(1/ЬС5о)=0.77 (эксперимент: 0.87). Решение обратной задачи представляет известные трудности из-за ее некорректности (число неизвестных в модели превышает число уравнений). Один из вариантов ее решения может состоять в следующем. Предположим, нас интересуют структуры с величиной 1од(1/ЬС50)=1.00 и интервалом изменения а на уровне 20+22 А3. Подставим соответствующие значения в уравнение (11) и определим интервал для £Са: 2.50+3.09. Далее, используя программу НУВОТ (см. раздел 3.4), найдем структуры, соответствующие интервалам. В результате обнаружим 103 структуры, некоторые из которых приведены ниже.

Необходимо отметить, что модель (11) создана с использованием всего 150 соединений, при этом в интервал а 20+22 А3 попадает только восемь из этих соединений. Решение обратной задачи с применением программы HYBOT позволяет выйти из круга структур обучающей выборки и значительно расширяет возможности для синтеза соединений с заданной величиной активности.

Глава 5. Количественные глобальные модели «структура - биологическая активность» органических соединений 5.1. Модель АЛБТ

•Обычно классификационная QSPR7QSAR модель строится для обучающей выборки в целом. В разработанном нами методе АЛБТ для классификации молекул используется большое количество локальных моделей. В случае АЛБТ процесс классификации сводится к следующим основным шагам: 1) задать теоретическую модель связи «структура-активность» (т.е. определить активность, значимые дескрипторы и вид математической связи между ними);

я1.

/

2) сформировать кластеры молекул в пространстве дескрипторов; 3) для каждого кластера создать модель «структура - активность»; 4) на основе модели провести дискриминацию молекул.

Исследование было проведено на основе ряда из 9618 органических соединений с известной активностью (LD50, ммоль/кг, внутривенно, 24 час., мыши, лит. данные). В качестве модели «структура - активность» использовалось уравнение вида log(l/LD50) = а + Ь а + с £Са , где а, Ь, с -параметры. В качестве сравнительных методов классификации были использованы такие методы, как линейный дискриминантный анализ (LDA), к-ближайший сосед (KNN), структурное сходство (SS), опорные вектора (SVM), нейронная сеть (ANN).

Таблица 5. Чувствительность (Sn), специфичность (Sp) и точность (Асс) при

бинарной классификации химических соединений с MOA неполярный наркоз

(класс 1) и другие MOA (класс 2) по отношению к мышам с использованием

методов линейного дискриминантного анализа (LDA), k-ближайшего соседа

(KNN), структурного сходства (SS), опорных векторов (SVM), нейронных сетей

(ANN) и анализа локальной базовой токсичности (АЛБТ)

Обучающая выборка Тестовая выборка

№ Метод---------

_ni/n2_Sn Sp Асс п)/п2 Sn Sp Асс

1 LDA 2811/4884 0.291 0.881 0.666 757/1166 0.284 0.890 0.652

2 KNN_7 2811/4884 0.605 0.807 0.733 757/1166 0.594 0.813 0.727

3 SS_5 2811/4884 0.587 0.798 0.721 757/1166 0.568 0.810 0.715

4 SVM 2811/4884 0.855 0.947 0.913 757/1166 0.567 0.852 0.739

5 ANN 2811/4884 0.406 0.853 0.690 757/1166 0.394 0.846 0.668

6 АЛБТ 1959/5715 0.992 1.000 0.998 509/1405 0.650 0.887 0.824 Примечание: щ - число соединений в первом классе, п2 - число соединений во втором классе.

В табл. 5 представлены результаты бинарной классификации 9618

органических соединений с использованием различных методов в пространстве

из HYBOT дескрипторов (LDA, KNN, SVM, ANN), фрагментных дескрипторов

(SS), а и £Са дескрипторов (АЛБТ). Следует отметить, что среди

использованных методов самые худшие результаты показывает метод LDA, а

самые лучшие - АЛБТ. Так, в случае LDA, величина Асс, составляет 0.666

(обучающая выборка) и 0.652 (тестовая выборка). При использовании АЛБТ Асс достигает 0.998 и 0.824 соответственно. Подходы, основанные на анализе ближайшего соседа (KNN 7 и SS 5), показывают промежуточные результаты. ОП модели АЛБТ: химический класс: различные химические классы; интервал log(l/LD50): -2.23+6.73; а: 3.25+132 А3; £Са: 0.00+30.60. 5.2. Модель AMP

При создании глобальных QSPR/QSAR моделей обычной практикой является формирование молекулярных кластеров структурно родственных ближайших соседей на основе различных мер молекулярного сходства, например, коэффициентов Танимото (Тс) с дальнейшим использованием статистических методов для оценки активности соединений. В результате наших исследований был разработан AMP подход, в котором наряду с мерами структурного сходства используются меры физико-химического сходства, основанные на дескрипторах. Алгоритм модели AMP может быть описан в виде четырех шагов. 1. Для каждой анализируемой молекулы определялась величина структурного сходства с остальными молекулами. Величины Тс упорядочивались по убыванию. На основе задаваемого минимального граничного значения Тс формировались первичные кластеры ближайших структурных соседей. 2. Для всех молекул рассчитывался ряд дескрипторов. 3. С использованием дескрипторов и первичного структурного кластера для анализируемой молекулы рассчитывался вторичный кластер. Для этого из молекул первичного кластера выбирались такие пары ближайших соседей, которые имели значение дескриптора больше и меньше, чем у анализируемой молекулы. Размер вторичного кластера регулировался путем задания числа молекулярных пар (NP). 4. Активность анализируемой молекулы рассчитывалась как арифметическое среднее токсичностей молекулярных пар.

Для исследования был использован ряд из 10241 органического соединения с известной активностью (LD50, ммоль/кг, внутривенно, 24 час., мыши, лит. данные). Дескрипторы рассчитывали с использованием программы HYBOT. Наилучшие результаты были получены на основе дескриптора XQj/a.

Путем варьирования значений Тс (0.00+1.00) и NP (1+5) был проведен расчет величин log(l/LD50). Качество полученных моделей оценивалось путем сравнения экспериментальных и рассчитанных величин токсичности с использованием уравнения:

log( 1 /LD;o)3K„ = a0 + a, log( 1 /LD5o)pac4 (17)

Интервал изменения параметров и статистических характеристик полученных уравнений был следующим: а0: -0.02н-0.15; а,: 0.77-И. 10; п: 4914-10228; г2: 0.456+0.783; s: О.ЗЗн-О.52; F: 1567-9672; q2: 0.456-0.773. При возрастании границы структурного сходства и числа пар, свободный член уравнения (17) приближается к 0, а угловой коэффициент приближается к 1. В то же самое время, коэффициент линейной корреляции возрастает, а стандартное отклонение убывает. Однако, этот процесс сопровождается уменьшением числа соединений, вовлеченных в расчет.

Почти для всех химических соединений изучаемого ряда могут быть рассчитаны величины токсичности на основе модели AMP с использованием Тс>0.00 и NP-2. Только 14 соединений из 10241 не имеют двух пар соседей с большим и меньшим значением выбранного дескриптора (£Cad/a). Параметры уравнения (17) в этом случае удовлетворительные и стандартное отклонение сравнимо с ожидаемыми экспериментальными ошибками измерения токсичности. Однако результаты расчета могут быть улучшены на основе каскадного расчета активности, в котором AMP модели появляются последовательно.

На самом высоком уровне А (табл. 6) граница структурного сходства Тс>0.80 и число вовлеченных в расчет структурных пар NP=2. Этому уровню соответствует 491 соединение (4.79% от общего числа соединений). При этом токсичность этих соединений может быть оценена со стандартным отклонением s=0.33. Следующий уровень В включает в себя соединения с Тс>0.70 и NP=2, исключая соединения уровня А. Для таких 832 соединений (8.12% от общего числа соединений) стандартное отклонение равно 0.39. Подобным образом были получены модели для последующих уровней с исключением соединений предыдущего уровня.

Использование каскадной модели AMP (уровни А-Е) позволило оценить острую токсичность 7085 соединений (около 69% от анализируемого ряда данных) по отношению к мышам со стандартным отклонением, сравнимым с

экспериментальной ошибкой определения токсичности. Для оставшихся 3142 соединений (уровень F) стандартное отклонение равно 0.64, что эквивалентно приблизительно одной трети интервала токсичности для 97% изученных соединений.

Таблица 6. Модель AMP: параметры и статистические характеристики уравнения log(l/LD5o),Kcn = а0 + a, log(l/LD50)Pac4 при различных уровнях структурного сходства (Тс) и числе структурных пар NP=2 Уровень Тс a« a, n г2 s F q2

А >0.80 0.03(±0.02) 1.00(±0.03) 491 0.762 0.33 1567 0.756

В >0.70 0.04(±0.02) 0.96(±0.02) 832 0.673 0.39 1708 0.671

С >0.60 0.01 (±0.02) 0.97(±0.02) 1291 0.673 0.38 2654 0.671

D >0.50 0.04(±0.01) 0.94(±0.02) 2010 0.581 0.44 2785 0.580

Е >0.40 0.10(±0.01) 0.82(±0.02) 2461 0.442 0.48 1947 0.440

F >0.00 0.16(±0.01) 0.83(±0.02) 3142 0.337 0.64 1593 0.335

Статистические характеристики обучающего ряда (8193 соединений) и

тестового ряда (2048 соединений) близки к характеристикам общей модели. В

частности, величины s составили 0.26+0.35, 0.40, 0.37+0.40, 0.43+0.48,

0.46+0.52, 0.60+0.65 для уровней А, В, С, D Е, F соответственно.

ОП модели AMP: химический класс: различные химические классы; интервал log(l/LDS0): -3.14+4.35; Тс: 0.00+1.00; ICatS/a: 0.00+1.35.

5.3. Модель ЛРМПК

Модель локальных регрессионных моделей в перекрывающихся кластерах (ЛРМПК) стала результатом дальнейшего развития концепции дискретно-непрерывных QSAR моделей. Для ее тестирования был использован тот же ряд из 10241 соединения, дескрипторы и мера структурного сходства, что и в модели AMP. Алгоритм ЛРМПК может быть представлен следующим образом.

1. Для рассматриваемого (/-го) соединения из выборки, содержащей n соединений, рассчитываются меры структурного сходства (Тс) с остальными п-1 соединениями. Полученные величины ранжируются по убыванию. Процедура повторяется для каждого соединения. В результате получается n отдельных рядов соединений. 2. Фиксируется минимальный порог структурного сходства Тс, и в каждом из n рядов отбираются структурно-родственные соединения, имеющие Тс выше фиксированного уровня. Таким

24

образом, формируются п перекрывающихся кластеров. 3. Для всех анализируемых соединений рассчитываются дескрипторы. 4. Для каждого кластера производится отбор дескрипторов на основе парных коэффициентов линейной корреляции и генерируются отдельные локальные регрессионные QSAR модели с использованием полного перебора всех возможных комбинаций из одного (М=1), двух (М=2) или трех (М=3) дескрипторов. Выбирается лучшее уравнение на основе критерия Фишера (F). В работе использовались линейные регрессионные модели при наличии в кластере (5 M + 1) и более структурных соседей. Это обеспечивает наличие минимум 5 соединений на один дескриптор в процессе перекрестного контроля с исключением по одному. 5. Полученные QSAR уравнения используются для расчета активности рассматриваемых соединений.

Из данных табл. 7 следует, что при задании в качестве граничного значения Тс>0.3 и с учетом необходимого минимального числа структурных соседей, было получено 7759 кластеров, для которых было сконструировано 6425 однопараметровых, 1176 двухпараметровых и 158 трехпараметровых регрессионных уравнений для расчета токсичности выбранных соединений. Для оставшихся 2482 соединений не было обнаружено достаточного числа структурных соседей, необходимого для оценки токсичности с помощью описанного метода. В полученном уравнении свободный член и угловой коэффициент оказались близкими к идеальным (0.01 ±0.01 и 0.99±0.01 соответственно), а стандартное отклонение (0.51) - на уровне ошибки экспериментального измерения этого свойства для мышей разного возраста, пола с учетом условий их содержания и методики измерений. Таблица 7. Модель ЛРМПК: параметры, статистические характеристики уравнения log(!/LD50)-,hCn = а0 + a, log(l/LD5o)paC4 при различных уровнях структурного сходства (Тс) и распределение числа моделей при использовании одного (М=1), двух (М=2) и трех (М=3) дескрипторов

№ Тс а0 а, п г2 s F q2 M=I M=2 M=3

~ >0.3 0.01(±0.01) 0.99(±0.0I) 7759 0.434 0.51 5958 0.434 6425 1176 158~

2 >0.4 0.06(±0.01) 0.91 (±0.01 ) 5011 0.530 0.46 5646 0.529 4074 810 127

3 >0.5 0.06(±0.01) 0.90(±0.01) 3157 0.621 0.40 5170 0.620 2514 540 103

4 >0.6 0.09(±0.01) 0.87(±0.02) 1748 0.621 0.40 2862 0.618 1457 260 31

5 >0.7 0.15(±0.02) 0.76(±0.02) 924 0.618 0.38 1490 0.613 814 99 11

6 >0.8 0.10(±0.03) 0.88(±0.03) 346 0.659 0.37 666 0.643 272 74 0

Рис. 4. Зависимость значений коэффициента корреляции (г2) и стандартного отклонения (s) моделей ЛРМПК от величины порога структурного сходства (Тс) при использовании HYBOT и DRAGON дескрипторов

Для сравнения были проведены расчеты токсичности на основе дескрипторов, полученных с помощью компьютерной программы DRAGON. Очевидно, что порог структурного сходства имеет существенное влияние на точность расчетов (рис. 4). Статистические критерии уравнений становятся лучше при большем значении данного порога. Но одновременно количество получаемых уравнений, а, следовательно, и число соединений с рассчитанным значением токсичности уменьшается. Это явно демонстрирует эффективность использования концепции структурного сходства для оценки свойств/активности соединений. Также очевидно, что лучшие результаты расчетов получаются при использовании дескрипторов программы HYBOT.

Валидация модели ЛРМПК выполнена с использованием обучающей и тестовой выборок (см. модель AMP). При этом были получены близкие статистические характеристики, что свидетельствует об устойчивости анализируемой модели.

ОП модели ЛРМПК: химический класс: различные химические классы; интервал log(l/LD50): -3.14+4.35; Тс: 0.00-1.00.

5.4. Проницаемость ФАВ через гематоэнцефалический барьер

Важным механизмом, обеспечивающим транспорт ФАВ через ГЭБ, является пассивная диффузия. Для количественного моделирования этого механизма была использована модель AMP (см. раздел 5.2). В качестве меры биологической активности были использованы литературные данные о [ogBB (десятичный логарифм отношения концентраций вещества в мозге и крови при пассивной диффузии через ГЭБ) для 298 соединений. Этот ряд разбивался на обучающую (239 соединений) и тестовую (59 соединений) выборки. В качестве внешней тестовой выборки использовались также данные по logBB для пяти дополнительных соединений, не включенных в общую выборку. Для описания структуры ФАВ использовали дескрипторы, рассчитанные на основе программы HYBOT, а также молекулярные фрагменты и меры структурного сходства, рассчитанные с помощью программы MOLDIVS.

В результате компьютерного моделирования было выделено 3 лучших модели на основе одиночных дескрипторов JC.Ja, и JE^. При

использовании обучающей выборки из 298 соединений для вышеперечисленных моделей были получены величины г2 и s равные 0.594 и 0.41, 0.588 и 0.41, 0.577 и 0.42 соответственно. На финальной стадии работы была получена согласованная модель с использованием в качестве конечного результата среднего арифметического рассчитанных значений из 3-х моделей по отдельным дескрипторам. Применение такого подхода привело к получению модели со следующими статистическими характеристиками: ^=0.641 и s=0.38. Последняя цифра близка к значению s равному 0.37, полученному при корреляции экспериментальных значений logBB одних тех же соединений, взятых из разных источников. Эта величина хорошо согласуется с литературными данными, согласно которым граница вариабельности величин logBB, полученных из разных источников, составляет 0.3+0.5 логарифмических единиц. Это свидетельствует о том, что полученная финальная модель имеет стандартное отклонение на уровне экспериментальной ошибки logBB.

На заключительном этапе для тестирования модели AMP были привлечены данные по проницаемости пяти соединений, которые не вошли в обучающую выборку (табл. 8). Это три вещества с пассивным механизмом транспорта (лоперамид, хлорпромазин, клонидин) и два вещества с активным механизмом транспорта (терфенадин, ранитидин). Из представленных данных следует, что не только соединения с пассивным механизмом транспорта, но и соединения, имеющие существенный вклад активного транспорта, хорошо описываются моделью AMP. Это позволяет предположить, что разработанный метод расчета может быть применен к химическим соединениям, проникающим через ГЭБ с помощью различных механизмов. Таблица 8. Экспериментальные (logBB,Kcn) и рассчитанные (logBBpac4) величины проницаемости ФАВ через ГЭБ на основе AMP моделей с дескрипторами: £Ead - сумма энтальпийных Н-акцепторных и Н-донорных дескрипторов, XCad - сумма свободноэнергетических Н- акцепторных и Н-донорных дескрипторов, а — молекулярная поляризуемость (А3).

logBBpac,

№ ФАВ logBB,Kcn ---—_- -ve LVr 4-Vr /г.

IEad SQd ICad/a IEad+XCad+LCad/a

1 Лоперамид 0/77 0.45 0.45 0.94 <Ш

2 Хлорпромазин 0.84 0.70 1.02 1.02 0.91

3 Клонидин 0.19 -0.14 0.25 0.25 0.12

4 Терфенадин 0.64 0.45 0.45 0.70 0.53

5 Ранитидин -1.23 -1.27 -1.03 -1.03 -1.11_

ОП модели AMP: химический класс: различные химические классы, полифункциональные соединения; интервал IogBB: -2.00-1.44; Тс: 0.00-1.00; £Ead: 0.00-25.80; ICad: 0.00-28.85; £Cad/a: 0.00-1.13.

На основе глобальных моделей «структура - активность», представленных в главе 5, может проводиться компьютерный дизайн органических соединений путем решения прямой и обратной задачи. Пример успешного решения прямой задачи на основе модели AMP представлен в табл. 8. Обратная задача (предсказание структур с заданными свойствами) из-за своей некорректности может быть решена путем введения дополнительных

условий. Введем, например, следующие ограничения: к^ВВ: 1.0-И.5, Тс>0.5; NP=1; дескриптор: в результате в обучающей выборке найдем 2

соответствующих соединения, для которых проведем анализ молекулярных фрагментов. В результате был установлен набор из 30 молекулярных фрагментов, 19 из которых являются общими. Некоторые из этих фрагментов изображены ниже:

При изменении ограничений модели AMP набор общих молекулярных фрагментов также меняется.

Глава 6. Перспективные разработки в области создания количественных моделей «структура - свойство» и «структура - активность» 6.1. Рекуррентная модель

Для анализа количественных соотношений «структура - активность» были использованы рекуррентные уравнения вида:

T„ = A + BT„.i (18)

где Тп - активность текущего n-го члена гомологического ряда, T„.i -активность предшествующего члена гомологического ряда, А и В - параметры. В качестве меры активности использовались литературные данные по LC50 и LD50 85 органических соединений из 7 гомологических рядов по отношению к 6 организмам: бактерии Vibrio fisheri, инфузории Tetrahymena piriformis, рыбам Poecilia reticulata и Pimephales promelas, мышам и крысам. Полученные уравнения характеризуются высокими статистическими показателями. Например, в большинстве случаев, г2>0.9. Часть представленных зависимостей

имеет предельное значение активности (В<1), другая часть не имеет предела (В>1). При этом коэффициент А варьирует от 0.13 до 0.67.

Полезность математических моделей для описания активности можно связать с качеством экстраполяции данных. С этой целью мы сопоставили три модели: рекуррентную, линейную и параболическую. В двух последних моделях в качестве независимой переменной фигурировало число метиленовых групп в гомологическом ряду. Для сравнения были выбраны данные по активности с учетом количества молекул в ряду и с максимальным представлением всех использованных типов химических соединений и биологических объектов. В результате было отобрано 5 комбинаций гомологический ряд/биообъект. Устойчивость и предсказательная способность моделей была оценена с помощью кросс-валидации и расчетом стандартных отклонений е. При этом было установлено, что рекуррентная модель имела минимальную величину бЮ.ЗЗ.

Рис. 5. Параметры рекуррентных уравнений на плоскости А-В с учетом типа гомологического ряда (а) и вида биологического объекта (б)

Рекуррентные модели могут быть выражены в виде точек на плоскости А-В с учетом типа гомологического ряда и вида биологического объекта. На рис. 5а отчетливо видны три кластера. В первый кластер входят спирты, кетоны и сложные эфиры (MOA: неполярный наркоз). Во второй кластер - амины и

фенолы (МОА: полярный наркоз). Третий кластер состоит из альдегидов и кислот (другие МОА). Таким образом, представленный метод графического анализа позволяет различать гомологические ряды между собой, относя их к различным типам действия.

Расстояние между точками (рис. 56) было использовано для анализа близости биообъектов между собой. Обращает на себя внимание уникальность данных для бактерии V. fisheri ввиду отсутствия в ближайших окрестностях аналогичных моделей активности. Следует отметить близость параметров рекуррентных уравнений, описывающих активность химических соединений по отношению к рыбам P. reticulata и P. promelas. Из представленных данных также следует сходство моделей активности для водных организмов Т. pyriformis и P. reticulata, а также Т. pyriformis и P. promelas. ОП рекуррентной модели: химический класс: спирты, кетоны, эфиры, амины, фенолы, альдегиды, кислоты; интервал log(l/LC5o): -2.96+3.69; log(l/LD50): -2.17+1.09.

6.2. Фрактальный дескриптор

Для описания геометрической структуры соединений были использованы гистограммы (дискретные функции распределения) межатомных расстояний, которые представлялись в виде плоских диаграмм, состоящих из набора закрашенных прямоугольников (баров). Ось абсцисс разбивалась с определенным шагом (разрешением) AR на интервалы, количество которых зависело от значений межатомных расстояний R, меняющихся от минимального значения Rmin до максимального значения Rmax. На оси ординат откладывалась частота f, т.е. количество межатомных расстояний, попадающих в заданный интервал, и варьирующая в виде целых чисел от 0 до fmM. Эта ось также разбивалась на интервалы с определенным шагом Д£ Полученные гистограммы оцифровывались путем их представления в виде квадратных бинарных матриц, где значение 1 соответствовало закрашенным участкам гистограммы, а 0 - всему остальному.

Фрактальная размерность определялась «клеточным» методом с помощью компьютерной программы, путем покрытия оцифрованного изображения клетками переменной величины и подсчетом числа клеток, которые пересекают закрашенные области гистограмм. Локальная фрактальная размерность рассчитывалась по уравнению:

log N(L) = log С — D log L (19)

где: N(L) - минимальное число клеток со стороной L, необходимых для

покрытия фрактала; D - «клеточная» фрактальная размерность (со знаком -); С

- константа. Пример расчета представлен на рис. 6. Подобным образом были

проведены расчеты для 73 органических молекул, относящихся к 6 различным

классам: алканы, спирты, эфиры, кетоны, амины, ароматические соединения.

При этом число атомов Na меняется от 5 до 50, а максимальная длина

межатомных расстояний RnMX варьирует в пределах от 1.82 А до 20.57 А.

Минимальная величина фрактальной размерности D составляет 1.00 (метан), а

максимальная - 1.58 (1,2:5,6-дибензантрацен).

Рис. 6. Зависимость числа клеток (Ы) от их размера (Ь) (уравнение (19)) для

молекулы метанола

Анализ полученных данных свидетельствует о существовании тенденции между ростом числа атомов в молекуле и фрактальной размерностью. Однако, наблюдающиеся значительные отклонения от тренда, говорят о том, что число

атомов не является единственным фактором. Например, четыре изомерных спирта с общей брутто-формулой С4НшО: 1-бутанол(1), 2-метил-1-пропанол(И), 2-бутанол(Ш) и 2-метил-2-пропанол(1У) имеют по 15 атомов, но различаются по фрактальной размерности: D при этом меняется от 1.20 до 1.38. Наблюдающееся явление может быть объяснено, если принять во внимание точечные группы симметрии молекул. Действительно, соединения (I) и (IV) относятся к группе Cs и имеют D=1.25 и 1.20 соответственно. Напротив, соединения (И) и (III) принадлежат к группе Ci и их фрактальные размерности равны 1.33 и 1.38 соответственно. Количественной мерой, отражающей количество атомов в молекуле и принадлежность молекул к той или иной точечной группе симметрии, в первом приближении, может являться число баров в гистограммах межатомных расстояний Nb. С учетом этого для соединений с различными точечными группами симметрии были сконструированы следующие модели:

С2,: D = 0.97(±0.03) + 0.81 (±0.06) log(Nb/Na) (20)

п=14; г2-0.935; s=0.04; F=172; q2=0.889

Cs: D = 0.91(±fl.03) + 0.70(±0.06)log(Nb/Na) (2i)

n=23; r2=0.851; s=0.04; F=120; q2=0.810

C,: D " 0.91 (±0.06) + 0.63(±0.08) !og(N|/Na) (22)

n=18; r2=0.785; s=0.03; F=58.5; q2=0.682

Уравнения (20)-(22) свидетельствуют о существовании корреляционной связи между фрактальной размерностью и нормированным числом баров. Эта связь становится понятной, если проанализировать физический смысл величины Nb/Na. По сути, она представляет собой число баров, которое приходится на один атом, т.е. характеризует плотность заполнения пространства гистограммы. Поэтому фрактальная размерность, являясь количественной мерой степени изрезанности или сложности пространственной структуры молекул (в пределе, крайняя изрезанность - это полностью заполненное пространство), оказывается в статистической связи с величиной Nb/Na.

Полезность нового предлагаемого дескриптора может быть продемонстрирована на примере установления количественных соотношений

между фрактальной размерностью и плотностью для гомологического ряда алканов (пентан, гексан,...эйкозан, пентакозан, триаконтан), которые при нормальных условиях представляют собой жидкости или твердые тела:

а,20 (г/см3) = -0.21(±0.05) + 0.70(±0.03) О (23> п=18; г2=0.965; 5=0.01; ¥=442- ц2=0.956

Полученное регрессионное уравнение свидетельствует о существовании тесной корреляционной связи между соответствующими микро- и макромолекулярными характеристиками. В изученном ряду соединений возрастание сложности молекулярной структуры сопровождается увеличением плотности вещества.

б.3. Линейная динамическая модель

Для описания структуры химических соединений была использована предложенная в литературе функция радиального распределения в приближении жесткой модели молекулы (отсутствие внутримолекулярных колебаний):

¡"(Я) = ( * о

здесь ^Я) - функция радиального распределения, Я - межатомное расстояние, М(я) - функция молекулярного рассеяния, 5 - угловой параметр. В качестве моделируемого свойства выступала обратная функция давления насыщенного пара от температуры 1И(Р). Количественную связь между исследуемыми кривыми устанавливали на основе линейной динамической модели с одним входом, одним выходом и импульсной переходной функцией. Эта модель описана в литературе и предназначена для анализа случайных стационарных процессов. Непосредственно для расчетов использовалось уравнение:

У(0 = Н(0 Х(0 (25)

здесь Х(0 и У(0 - преобразования Фурье для входной и выходной кривой

соответственно, а Н({) - частотная характеристика. Частотную характеристику

вычисляли путем усреднения по всем кривым на основе соотношения для

взаимного спектра входного и выходного процессов:

34

8,У(9 = Н(0 8„(9 (26)

здесь - взаимная двусторонняя спектральная плотность, 8ХХ(Т) -

двусторонняя спектральная плотность входной кривой.

Качество исследуемой модели оценивали с помощью функции когерентности, изменяющейся в пределах от 0 до 1 и вычисляемой по формуле:

где ¡Зууф - двусторонняя спектральная плотность выходной кривой. В дальнейшем для сравнения различных моделей использовали среднее значение у2, полученное путем усреднения функции когерентности по всем частотам. Расчеты выполняли с использованием модифицированной компьютерной программы на основе быстрого преобразования Фурье. В качестве входных и/или выходных процессов выступали Я^Я) и обратная функция давления насыщенного пара от температуры Т=А[Р). Оцифровку зависимостей проводили путем дискретизации независимых переменных с использованием 16, 32, 64, 128, 256 точек (уровни дискретизации ш) и вычислением соответствующих значений функций.

Учитывая разный физический смысл входных и выходных кривых, для получения статистически значимых корреляционных зависимостей использовали модификацию линейной динамической модели. Для этого на вход системы подавали участки кривых различной длины. При решении прямой задачи (модель «структура-активность») проводили варьирование в

качестве входной кривой путем разделения интервала Я (0 - 16 А) на 160 частей и парной комбинации полученных значений К„и„ и 11макс. При этом длина выходной кривой Т=Я;Р) оставалась неизменной и была максимальной (Рми„=10 мм Щ, Рмакс=1500 мм Н8). Аналогичный подход использовали для входной кривой Т=А[Р) при решении обратной задачи (модель «активность-структура»), В этом случае интервал Р (10 - 1500 мм Н§) делили на 50 частей и комбинировали величины Р„„н и Рмакс. Длина кривой А[Д) была постоянной

(Км„„=0 А, 11«

акс

16 А). Полученные модели сортировали по величине 35

стандартного отклонения и отбирали те из них, которые имели минимальное значение. Для исследования был использован ряд из 10 н-алканов (пропан, бутан,... додекан).

В табл. 9 приведены характеристики лучших моделей типа «структура -активность», полученных путем перебора 12880 реализаций различной длины на каждом уровне дискретизации. Учитывая, что модель 1 имеет минимальную величину 8=5.0 и максимальное значение у2=0.988, она была выбрана в качестве финальной модели типа «структура-активность». С использованием этой модели были рассчитаны функции Т=Й[Р) для 10 исследуемых соединений: Трк, = -3.5(±1.7) + 1.01(±0.01) Тзксп (28)

п=160; г2=0.997; 8=5.0; ц2=0.996

Уравнение (28) свидетельствует об адекватности модели 1.

Таблица 9. Порядковый номер модели (№), уровни дискретизации (т), минимальная (КМЙН) и максимальная (Я^с) величина межатомного расстояния, стандартное отклонение (з) и среднее значение функции когерентности (у2) для моделей «структура - активность»

№ га &чиН» А К-макс? ^ э т2

1 16 1.1 13.9 5.0 0.988

2 32 0.8 12.7 5.4 0.944

3 64 1.4 15.3 5.2 0.976

4 128 0.0 15.5 6.6 0.956

5 256 0.0 15.6 6.6 0.933

«обратная» задача ОЗРИ/ОБАК, т.е. предсказание структур с заданными свойствами. С этой целью была сконструирована специальная модель «активность - структура», где в качестве входа используется зависимость Т=С(Р) переменной длины, а в качестве выхода - полноразмерная Г(И). Учитывая, что точность описания функции радиального распределения по оси ординат (интенсивность) на уровне величины 0.06 представляется приемлемой, а максимальное разрешение по оси абсцисс (межатомное расстояние) достигается при т=256 и составляет 0.06 А, в качестве рабочей модели «активность - структура» была использована модель 10 (табл. 10).

Таблица 10. Порядковый номер модели (№). уровни дискретизации (т), минимальная (Рмня) и максимальная (Риме) величина давления насыщенного пера, стандартное отклонение ($) и среднее значение функции когерентности (у2) для моделей «активность - структура»

м т Ни«, мм Р.«*. мм НК ! т2

6 16 1470.2 1500.0 0.018 0.992

7 32 10.0 39.8 0.047 0.893

8 64 1470.2 1500.0 0.072 0.919

9 128 1470.2 1500.0 0.059 0.943

10 256 1470.2 1500.0 0.061 0.940

С использованием этой модели было получено следующее уравнение:

ПК)^» - -0.001(±0.001)+ |.00<^0.01) ЦЯ)»™ (29)

11=2560; г*=0.971; »-0.061; ц2-0.966

Параметры и коэффициенты регрессионного уравнения (29) свидетельствуют о высоком качестве модели 10. Это демонстрирует и сопоставление рассчитанных и экспериментальных значений функции радиального распределения для молекулы гс1гтана (рис. 7) с хорошим соответствием как по абсциссе, так и по ординате. Таким образом, задача предсказания структур с заданными свойствами может быть решена путем конструирования специальной модели «активность - структура», расчета на се основе ((Я) для молекулы с заданными свойствами и сравнения с ПЮ модельного соединения с известной 30 структурой.

Л

Рис. 7. Экспериментальные и рассчитанные по модели 10 значения функции радиального распределения и их разность (Д) для молекулы гептана при уровне дискретизации т=»256

выводы

1. Разработана аддитивно-мультипликативная модель для описания энтальпии и свободной энергии Н-комплексов. На основе этой модели создана единая энергетическая шкала водородной связи и рассчитаны дескрипторы, количественно характеризующие способность соединений к образованию Н-связи.

2. Разработана количественная физико-химическая модель для описания липофильности органических соединений с использованием поляризуемости и протоноакцепторных дескрипторов Н-связи.

3. На основе стандартных и оригинальных подходов с применением дескрипторов водородной связи сконструированы и протестированы модели «структура-активность» для компьютерного дизайна органических соединений, включая оценку острой токсичности, ретардантной активности и способности проникновения через гематоэнцефалический барьер неисследованных новых соединений и предсказание структур с заданным уровнем активности.

4. Разработана рекуррентная модель активности в гомологических рядах соединений. Выявлено, что с помощью этой модели может быть установлен тип действия ряда и близость биообъектов между собой.

5. Для описания структуры химических соединений создан и применен новый дескриптор: фрактальная размерность. Установлено, что предлагаемый дескриптор зависит от числа атомов и точечной группы симметрии молекул и может быть использован при исследовании связи «структура - свойство (активность)».

6. Разработан новый подход для установления количественной связи между структурой и свойствами (активностью) химических соединений на основе линейной динамической модели, который может быть использован в качестве рабочего инструмента при проведении С^АК/С^РК исследований.

7. На основе теоретических разработок получен ряд практических результатов: создана БД по термодинамическим характеристикам Н-комплексов; сформирована БД дескрипторов Н-связи.

Основные публикации по теме диссертации

Статьи в отечественных и зарубежных журналах

1. Раевский О.А., Григорьев В.Ю., Соловьев В.П. Моделирование связи структура - активность. II. Оценка электронодонорных и акцепторных функций активных центров в молекулах физиологически активных веществ // Хим.-фармац. журн. 1989. Т. 23. № 11. С. 1294-1300.

2. Григорьев В.Ю., Соловьев В.П., Додонов М.В., Брель В.К., Мартынов И.В., Раевский О. А. Электронодонорные и акцепторные функции физиологически активных и модельных соединений. XIV. Электроноакцепторная способность группы N-H дифторнитроацетанилидов // Журн. общ. химии. 1989. Т. 59. №4. С. 846-851.

3. Григорьев В.Ю., Соловьев В.П., Раевский О.А., Иванов А.Н., Соколов В.Б., Мартынов И.В. Электронодонорные и акцепторные функции физиологически активных и модельных соединений. XV. Использование мультипликативного правила факторов для оценки термодинамических характеристик водородной связи дифторнитроацетанилидов с фосфорилированными оксимами // Журн. общ. химии. 1990. Т. 60. № 3. С. 527-530.

4. Гафуров Р.Г., Чистяков В.Г., Кокурин А.В., Григорьев В.Ю., Прошин А.Н., Раевский О.А., Муромцев Г.С., Мартынов И.В. Связь химической структуры и активности регуляторов роста растений. Сообщение 1. Влияние стерического параметра катиона на антигиббереллиновую активность хлоридов диалкилпиперидиниев // Агрохимия. 1991. № 12. С. 81-85.

5. Raevsky О.А., Grigor'ev V.Yu., Kireev D.B., Zefirov N.S. Corrélation Analysis and H-bond Ability in Framework of QSAR // J. Chim. Phys. Phys.-Chim. Biol. 1992. Vol. 89. № 7-8. P. 1747-1753.

6. Raevsky O.A., Grigor'ev V.Yu., Kireev D.B., Zefirov N.S. Complété Thermodynamic Description of H-Bonding in the Framework of Multiplicative Approach // Quant. Struct.-Act. Relat. 1992. Vol. 11. № 1. P. 49-63.

7. Раевский О.А., Григорьев В.Ю. Количественное описание липофильности органических соединений на основе поляризуемости и акцепторной способности к образованию водородной связи // Хим.-фармац. журн. 1999. Т. 33. №5. С. 46-49.

8. Гафуров Р.Г., Григорьев В.Ю., Прошин А.Н., Чистяков В.Г., Мартынов И.В., Зефиров Н.С. Роль молекулярных параметров солей четвертичного аммония в формировании их антигиббереллиновой (ретардантной) активности // Докл. РАН. 2004. Т. 394. № 5. С. 710-714.

9. Gafurov R.G., Grigor'ev V.Yu., Proshin A.N., Chistyakov V.G., Martynov I.V., Zefirov N.S. The Importance of Molecular Parameters of Quaternary Ammonium Salts in Their Antigibberelin (Retardant) Activity // Russ. J. Bioorg. Chem. 2004. Vol. 30. № 6. P. 592-598.

10.Raevsky O.A., Grigor'ev V.Yu., Raevskaja O.E., Schaper K.-J. Physicochemical Properties,'Descriptors Governing the Solubility and Partitioning of Chemicals in Water-Solvent-Gas systems. Part.l. Partitioning between Octanol and Air // SAR QSAREnviron. Res. 2006. Vol. 17. № 3. P. 285-297.

11.Raevsky O.A., Grigor'ev V.Yu., Weber E.E., Dearden J.C. Classification and Quantification of the Toxicity of Chemicals to Guppy, Fathead Minnow and Rainbow Trout. Part 1. Nonpolar Narcosis Mode of Action // QSAR Comb. Sci. 2008. Vol. 27. № 11-12. P. 1274- 1281.

12.Raevsky O.A., Grigor'ev V.Yu., Dearden J.C., Weber E.E. Classification and Quantification of the Toxicity of Chemicals to Guppy, Fathead Minnow, and Rainbow Trout. Part 2. Polar Narcosis Mode of Action // QSAR Comb. Sci. 2009. Vol. 28. №2. P. 163-174.

13.Раевский O.A., Григорьев В.Ю., Тихонова O.B. Развитие моделей взаимосвязи структуры и токсического действия химических соединений по отношению к Guppy // Хим.-фармац. журн. 2009. Т. 43. № 3. С. 3-7.

14.Raevsky О.А., Grigor'ev V.Yu., Modina E.A., Worth A.P. Prediction of Acute Toxicity to Mice by the Arithmetic Mean Toxicity (AMT) Modelling Approach // SAR QSAR Environ. Res. 2010. Vol. 21. № 3-4. P. 265-275.

15.Raevsky O.A., Grigor'ev V.Y., Liplavskaya E.A., Worth A.P. Prediction of Acute Rodent Toxicity on the Basis of Chemical Structure and Physicochemical Similarity // Mol. Inf. 2011. Vol. 30. № 2-3. P. 267-275.

16.Григорьев В.Ю., Раевский O.A. Фрактальная размерность гистограмм межатомных расстояний - новый 3D дескриптор молекулярной структуры // Журн. общ. химии. 2011. Т. 81. № з. с. 353-359.

П.Григорьев В.Ю., Раевский O.A. Рекуррентная модель острой токсичности в гомологических рядах органических соединений // Хим.-фармац. журн. 2011. Т. 45. № 7. с. 28-33.

18.Раевский O.A., Григорьев В.Ю., Липлавская Е.А., Вортс А.П. Расчет острой токсичности химических соединений при их внутривенном введении мышам на основе локальных регрессионных моделей в перекрывающихся кластерах (ЛРМПК) // Биомед. химия. 2012. Т. 58. № 5. С. 489-500.

19.Григорьев В.Ю., Раевский O.A. Исследование количественной связи между функцией радиального распределения и кривой давления насыщенного пара в ряду н-алканов на основе модифицированной линейной динамической модели // Журн. физ. химии. 2012. Т. 86. № 3. С. 417-422.

20.Григорьев В.Ю., Раздольский А.Н., Раевский O.A. Исследование острой токсичности химических соединений по отношению к Guppy с использованием линейного дискриминантно - регрессионного подхода // Хим.-фармац. журн. 2012. Т. 46. №8. С. 7-11.

Другие публикации

21.Raevsky O.A., Grigor'ev V.Yu., Solov'ev V.P., Kireev D.B., Sapegin A.M., Zefírov N.S. Drug Design H-bonding Scale // In: QSAR: Rational Approaches to the Design of Bioactive Compounds / Silipo C., A. Vittoria A., Eds. Amsterdam: Elsevier Science Publishers, 1991. P. 135-138.

22.Григорьев В.Ю., Раевская O.E., Раевский O.A. База данных «Термодинамика водородной связи» // Тезисы IX Всесоюзной конференции «Химическая информатика». Черноголовка, МО. 1992. С. 33.

23.Raevsky O.A., Grigor'ev V.Yu., Kireev D.B., Lukoyanov N.V., Glinka R., Brzezinska E. QSAR Models of p - Adrenergic Activity of Some Substituted Phenethylamines // Proceedings of the 12-th International Symposium on

Medicinal Chemistry. Basel. 1992. P. P-037A.

24.Raevsky O.A., Grigor'ev V.Yu., Mednikova E. QSAR H-Bonding Descriptors // Proceedings of the 9-th European Symposium on Structure-Activity Relationships: QSAR and Molecular Modelling. Strasbourg. 1992. P. 0-22.

25.Raevsky O., Dolmatova L„ Grigor'ev V., Lisyansky I., Bondarev S. Molecular Recognition Descriptors in QSAR // In: QSAR and Molecular Modelling: Concepts, Computional Tools and Biological Applications / Sanz F„ Giraldo J., Eds. Barselona: Prous Science Publ., 1995. P. 241-245.

26 Раевский O.A., Григорьев В.Ю., Трепалин C.B., Шапер К. Расчет гидрофобное™ на основе поляризуемости и водородной связи // Тезисы IV Российского конгресса «Человек и лекарство». Москва. 1997. С. 288.

27.Раевский О.А., Григорьев В.Ю., Трепалин С.В., Герасименко В.А., Раздольский А.Н., Шапер К. Оптимизация компьютерного конструирования лекарств на основе физико-химических параметров // Тезисы VI Российского конгресса «Человек и лекарство». Москва. 1999. С. 463.

28.Раевский О.А., Григорьев В.Ю., Трепалин С.В. Свидетельство об официальной регистрации программы для ЭВМ HYBOT (Hydrogen Bond Thermodynamics) № 990090 от 26 февраля 1999 г., Москва, Федеральная служба по интеллектуальной собственности, патентам и товарным знакам.

29.Григорьев В.Ю. Расчет вклада водородной связи в энтальпию испарения и нормальную точку кипения органических соединений // Рукопись деп.

ВИНИТИ 04.06.99. № 1820-В99. 22 с.

30.Григорьев В.Ю. Комплексный метод оценки протонодонорной способности фенолов // Рукопись деп. ВИНИТИ 19.07.2000. № 2012-В00. 13 с.

31.Раевский О.А., Скворцов B.C., Григорьев В.Ю., Трепалин С.В. Свидетельство об официальной регистрации программы для ЭВМ Программный комплекс HYBOT (HYdrogen BOnd Thermodynamics) in UNIX

№ 2002610496 от 4 апреля 2002 г., Москва, Федеральная служба по интеллектуальной собственности, патентам и товарным знакам.

32.Grigor'ev V.Yu., Weber Е.Е., Raevsky O.A. Classification SAR Models of Chemicals Toxicity to Guppy, Fathead Minnow and Rainbow Trout on the Basis of Structure Similarity // Fourth International Symposium on Computational Methods in Toxicology and Pharmacology Integrating Internet Resources. Moscow. 2007. P. 99.

33.Tikhonova O.V., Skvortsov V.S., Grigor'ev V.Yu., Raevsky O.A. 3D-QSAR Models of Irreversible and Reversible Inhibitors of Acetylcholinesterase // Fourth International Symposium on Computational Methods in Toxicology and Pharmacology Integrating Internet Resources. Moscow. 2007. P. 162.

34.Raevsky O.A., Grigor'ev V.Yu., Modina E.A., Raevskaya O.E., Liplavsky Ja.V. Classification- and Regression-Based QSAR of Chemical Toxicity on the Basis of Structural and Physicochemical Similarity // Workshop on "Satisfying REACH Requirements in Predictive Toxicology". Rome. 2009. P. 12-13.

35.Григорьев В.Ю., Раевский O.A. Рекуррентная модель острой токсичности гомологического ряда нормальных спиртов // Материалы XVII Российского национального конгресса «Человек и лекарство». Москва. 2010. С. 600.

36.Раевский О.А., Григорьев В.Ю., Модина Е.А. Компьютерные модели взаимосвязи структуры органических соединений и их острой токсичности // Материалы XVII Российского национального конгресса «Человек и лекарство». Москва. 2010. С. 708-709.

37.Raevsky О.А., Grigor'ev V.Yu., Modina E.A., Worth A.P. Classification- and Regression-Based QSAR of Acute Chemical Rodent Toxicity // Proceedings of the 18-th European Symposium on Quantitative Structure-Activity Relationships. Rhodes. 2010. P. 77-78.

38.Григорьев В.Ю., Раевский O.A. Гистограмма межатомных расстояний -новый 3D дескриптор молекулярной структуры // Материалы XVIII Российского национального конгресса «Человек и лекарство». Москва. 2011. С. 552.

39.Липлавская Е.А., Григорьев В.Ю., Раевский ОА. Предсказание острой токсичности органических соединений по отношению к грызунам на основе структурного и физико-химического сходства // Материалы XVIII Российского национального конгресса «Человек и лекарство». Москва. 2011. С. 612.

40.Раевский O.A., Трепалин C.B., Григорьев В.Ю., Солодова С.Л., Ярков A.B., Раевская O.E. Свидетельство о государственной регистрации программы для ЭВМ Программный комплекс для оценки и предсказания проницаемости физиологически активных веществ через гематоэнцефалический барьер № 2012614339 от 16.05.2012, Москва, Федеральная служба по интеллектуальной собственности.

Сдано в печать 19.08.13. Подписано в печать 20.08.13. Формат 60x90 1/16 Объем 2,75 п. л. Заказ 134. Тираж 100

Отпечатано в типографии ИПХФ РАН 142432 Московская обл., г. Черноголовка, пр-т ак. Семенова, 5 Тел.: 8(49652)2-19-38

 
Текст научной работы диссертации и автореферата по химии, доктора химических наук, Григорьев, Вениамин Юрьевич, Черноголовка

ИНСТИТУТ ФИЗИОЛОГИЧЕСКИ АКТИВНЫХ ВЕЩЕСТВ РОССИЙСКАЯ АКАДЕМИЯ НАУК

На правах рукописи

05201450017 Григорьев Вениамин Юрьевич

КОЛИЧЕСТВЕННЫЕ МОДЕЛИ «СТРУКТУРА - СВОЙСТВО» ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ

02.00.03 - органическая химия 02.00.04 - физическая химия

Диссертация

на соискание ученой степени доктора химических наук

Черноголовка 2013

Условные обозначения и сокращения

а - молекулярная поляризуемость

AG - свободная энергия Гиббса образования комплекса с водородной связью АН - энтальпия образования комплекса с водородной связью АСС (accuracy) - точность, характеристика бинарной классификации AChE - ацетилхолинэстераза AD - область применимости

ADME - адсорбция, распределение, метаболизм, выделение AFP - адаптивное нечеткое распределение ANN - искусственная нейронная сеть

Са - свободноэнергетический протоноакцепторный дескриптор водородной связи

Сс - косинусный коэффициент

Cd - свободноэнергетический протонодонорный дескриптор водородной связи

cov - ковариация

Cv - коэффициент вариации

d - плотность вещества

D - фрактальная размерность

DA - дискриминантный анализ

DT - дерево решений

Еа - энтальпийный протоноакцепторный дескриптор водородной связи Ес - Эвклидов коэффициент

ЕС50 - среднеэффективная концентрация вещества

Ed - энтальпийный протонодонорный дескриптор водородной связи

Еномо - энергия высшей занятой молекулярной орбитали

Elumo ~ энергия низшей свободной молекулярной орбитали

Es - стерический параметр

F - критерий Фишера

FATS - синдром острой токсичности у рыб

GA - генетический алгоритм

GEP - программирование экспрессии генов

НСА - иерархический кластерный анализ

I - степень ингибирования биосинтеза гиббереллина

IC50 - концентрация вещества, вызывающая 50% ингибирование

ILP - индуктивное логическое программирование

Kaw - коэффициент распределения вещества в системе воздух - вода

KNN - метод к-ого ближайшего соседа

Kow - коэффициент распределения вещества в системе н-октанол - вода

LC50 - среднесмертельная концентрация вещества

LD5o - среднесмертельная доза вещества

LDA - линейный дискриминантный анализ

LNO - кросс-валидация с выбором по N

logBB - десятичный логарифм отношения концентраций вещества в мозге и

крови при пассивной диффузии через ГЭБ

LOO - кросс-валидация с выбором по одному

LR - логистическая регрессия

МСС - коэффициент корреляции Мэтьюза

MlogP - десятичный логарифм расчетного коэффициента распределения

вещества в системе н-октанол - вода

MLR - множественный регрессионный анализ

MOA (mode of action) - тип токсического действия

п - число наблюдений

Nnacc - число Н-акцепторов

NHdon - число Н-доноров

OECD - организация экономического сотрудничества и развития Р - давление насыщенного пара РСА - анализ главных компонент

рКа - отрицательный десятичный логарифм константы диссоциации кислоты PLS - проекции на скрытые структуры

q - коэффициент линейной корреляции при кросс-валидации с выбором по одному

QSAR - количественная связь «структура - активность» QSPR - количественная связь «структура - свойство» г - коэффициент линейной корреляции RF - метод случайного леса s - стандартное отклонение

scv - стандартное отклонение при кросс-валидации с выбором по одному SN (sensitivity) - чувствительность, характеристика бинарной классификации SP (specificity)- специфичность, характеристика бинарной классификации SS - метод структурного сходства

SVILP - индуктивное программирование на опорных векторах SVM - метод опорных векторов Т - температура t - время

Тс - коэффициент Танимото АЛБТ - анализ локальной базовой токсичности AMP - арифметическое среднее свойство БД - база данных

ГМФТА - гексаметилфосфортриамид ГЭБ - гематоэнцефалический барьер

ЛДРП - линейный дискриминантно-регрессионный подход

ЛРМПК - локальные регрессионные модели в перекрывающихся кластерах

ФАВ - физиологически активные вещества

Оглавление

Условные обозначения и сокращения ................................................2

Введение .......................................................................................7

Глава 1. Современное состояние в области создания количественных моделей «структура - свойство» и «структура - активность»

(на примере острой токсичности органических соединений) .....................13

1.1. Общая схема С^РИ/С^АЯ моделирования ....................................13

1.2. Объекты исследования и источники данных ..................................15

1.3. Дескрипторы ..........................................................................19

1.4. Кластеризация молекул. Предобработка данных ............................22

1.5. Отбор дескрипторов ................................................................26

1.6. Статистические методы моделирования ..................................28

1.7. Валидация моделей ..................................................................33

1.8. Модели ...............................................................................39

1.9. Экспертные системы ...............................................................73

Выводы по главе ...........................................................................76

Глава 2. Экспериментальная часть ......................................................78

2.1. Физико-химические данные .....................................................78

2.2. Биологические данные .............................................................78

2.3. Расчет, преобразование и отбор дескрипторов ...............................79

2.4. Меры сходства химических соединений .......................................81

2.5. Статистические методы исследования ..........................................82

2.6. Валидация С^РК/С^АЯ моделей ................................................84

2.7. Методика проведения спектральных и калориметрических измерений .87

2.8. Планирование эксперимента и оценка термодинамических параметров водородной связи по данным экспериментальных измерений ..................88

2.9. Исходные вещества, реактивы и их квалификация ...........................90

Глава 3. Количественные модели «структура - физико-химические свойства» органических соединений .................................................................92

3.1. Аддитивно-мультипликативная модель энтальпии и свободной энергии

водородной связи. Монофункциональные соединения ............................91

3.2. Аддитивно-мультипликативная модель энтальпии и свободной энергии водородной связи. Полифункциональные соединения ...........................116

3.3. Модель липофильности органических соединений ........................122

3.4. Компьютерный программный комплекс HYBOT .............................134

Выводы по главе ...........................................................................140

Глава 4. Количественные локальные модели «структура - биологическая активность» органических соединений ...............................................142

4.1. Классификационные и регрессионные модели неполярного наркоза ... 142

4.2. Классификационные и регрессионные модели полярного наркоза ......157

4.3. Линейный дискриминантно - регрессионный подход ......................182

4.4. Ретардантная активность солей четвертичного аммония .................191

Выводы по главе ..........................................................................195

Глава 5. Количественные глобальные модели «структура - биологическая активность» органических соединений ...............................................197

5.1. Модель АЛБТ .......................................................................197

5.2. Модель AMP ........................................................................213

5.3. Модель ЛРМПК ....................................................................225

5.4. Проницаемость ФАВ через гематоэнцефалический барьер .............233

Выводы по главе ..........................................................................238

Глава 6. Перспективные разработки в области создания количественных моделей «структура - свойство» и «структура - активность» ...................240

6.1. Рекуррентная модель .............................................................240

6.2. Фрактальный дескриптор ..........................................................251

6.3. Линейная динамическая модель ...............................................265

Выводы по главе ........................................................................277

Заключение .................................................................................278

Список литературы .......................................................................280

Введение

Одной из фундаментальных задач химии является установление связи между структурой вещества и проявляемыми им свойствами. К настоящему времени в мире синтезировано несколько десятков миллионов химических соединений, большинство из которых относится к органическим веществам. Эти соединения могут быть охарактеризованы большим количеством свойств, общее число которых, по некоторым оценкам, приближается к 10000.

В сферу интересов человека вовлечено около 60 тысяч органических соединений, которые широко применяются в быту, медицине, на производстве и в сельском хозяйстве. Этот список ежегодно увеличивается примерно на 1000 наименований [1]. Для многих соединений отсутствуют данные об их физико-химических и биологических свойствах, например, о способности к образованию водородной связи или об острой токсичности. Но распределение Н-донорных и Н-акцепторных центров и величины их активности нужны при конструировании новых биологически активных соединений, а знание количественных характеристик токсичности необходимо для оценки опасности промежуточных и конечных веществ при планировании и проведении многостадийного органического синтеза.

Для экспериментального определения числовых характеристик свойств соединений необходимы большие материальные и временные затраты. Однако полученные к настоящему времени экспериментальные данные могут служить базой для разработки и дальнейшего использования математических моделей тех или иных свойств, созданных на основе, например, междисциплинарного подхода «количественная связь структура - свойство» (С)8РК)/«количественная связь структура - активность» (С)8А11). Компьютерное конструирование таких моделей требует гораздо меньше времени и материальных ресурсов, чем экспериментальные исследования, а созданные модели позволяют оценивать свойства неисследованных химических соединений и предсказывать новые структуры с заданными свойствами.

Работа выполнена в соответствии с планами научно-исследовательских работ Института физиологически активных веществ РАН «Компьютерный молекулярный дизайн, включая количественную связь структура-свойство (активность) и молекулярное моделирование взаимодействия лиганд-мишень для структурной генерации соединений с заданными свойствами» (№ госрегистрации 0120.0 504023) при финансовой поддержке Российского фонда фундаментальных исследований: проект № 97-03-33068-а «Молекулярное моделирование связи структура-активность с учетом трехмерности структур и их способности к образованию водородных связей» и Международного научно-технического центра: проект № 888 «Компьютерное предсказание химической экотоксичности» и проект № 3777 «Развитие и применение КССА моделей токсичности химических соединений по отношению к грызунам».

Цель исследования

Разработка количественных моделей «структура - свойство» и «структура - активность» с использованием дескрипторов водородной связи и других молекулярных дескрипторов для компьютерного дизайна органических соединений, включая прогнозирование физико-химических свойств и биологической активности неисследованных соединений и предсказание новых структур с заданными свойствами.

Задачи исследования

1. Разработка модели для количественной оценки энтальпии и свободной энергии Н-комплексов, создание единой энергетической шкалы Н-связи и расчет дескрипторов водородной связи.

2. Создание базы данных по термодинамическим характеристикам Н-комплексов и базы данных по Н-донорным и Н-акцепторным дескрипторам.

3. Разработка модели липофильности органических соединений.

4. Конструирование локальных и глобальных моделей «структура -активность» органических соединений.

5. Разработка рекуррентной модели, фрактального дескриптора и линейной динамической модели для установления количественной связи «структура -свойство» и «структура - активность».

Научная новизна

На основе литературных и собственных экспериментальных данных разработана физико-химическая аддитивно-мультипликативная модель энтальпии и свободной энергии Н-комплексов, сконструирована единая энергетическая шкала водородной связи и создана компьютерная программа для молекулярного дизайна органических соединений с заданной величиной Н-донорной и Н-акцепторной активности.

Создана модель липофильности органических соединений, основанная на линейной комбинации двух физико-химических параметров: молекулярной поляризуемости и Н-акцепторного дескриптора водородной связи.

С использованием молекулярных дескрипторов, в том числе дескрипторов Н-связи, сконструированы оригинальные кластерные, классификационные и регрессионные модели «структура - активность», предназначенные для компьютерного дизайна органических соединений, включая оценку острой токсичности, ретардантной активности и способности проникновения через гематоэнцефалический барьер неисследованных новых соединений и генерацию ряда структур с заданным уровнем биологической активности.

Впервые разработана рекуррентная модель для описания связи «структура - активность» в гомологических рядах органических соединений, отличающаяся от известных моделей отсутствием дескрипторов.

Впервые предложен, разработан и применен новый ЗЭ дескриптор для оценки фрактальных свойств молекулярных гистограмм межатомных расстояний.

Впервые предложена, разработана и применена линейная динамическая

модель для компьютерного молекулярного дизайна ЗЭ структур с заданными

свойствами.

Научно-практическая значимость

1. База данных по термодинамическим характеристикам образования Н-комплексов, насчитывающая свыше 13000 записей, может быть использована в качестве источника информации при проведении теоретических и практических исследований в области органической и физической химии.

2. База данных по протонодонорным и протоноакцепторным дескрипторам Н-связи, содержащая свыше 50000 записей, и компьютерная программа НУВОТ, созданная на ее основе, могут служить для количественной оценки способности органических соединений к образованию водородной связи.

3. На основе сконструированных С^РЯ/С^АЯ моделей может проводиться оценка физико-химических свойств и биологической активности новых неизученных органических соединений.

Основные положения, выносимые на защиту

1. Аддитивно-мультипликативная модель энтальпии и свободной энергии Гиббса Н-комплексов позволяет количественно оценить протонодонорную и протоноакцепторную способность органических соединений.

2. С^РЯ модель липофильности дает возможность значительно расширить круг органических соединений, для которых могут быть рассчитаны дескрипторы Н-связи.

3. Модели неполярного и полярного наркоза на базе молекулярной поляризуемости и дескрипторов Н- связи, позволяющие оценить величины токсичности и вклады неспецифических и специфических взаимодействий.

4. Алгоритмы кластеризации/классификации на основе регрессионных моделей наркоза, предоставляющие возможность провести

кластеризацию/классификацию соединений без использования априорной информации о типе токсического действия каждого соединения.

5. Рекуррентная модель острой токсичности гомологических рядов органических соединений позволяет проводить корректную интерполяцию и экстраполяцию значений токсичности, а также оценивать токсикологическую близость живых организмов или химических соединений.

6. Глобальные модели «структура - активность», основанные на молекулярном сходстве, и физико-химических дескрипторах, дают возможность оценивать биологическую активность органических соединений с точностью, соответствующей точности исходных данных.

7. Фрактальный дескриптор гистограмм межатомных расстояний количественно оценивает сложность молекулярных структур в их геометрическом аспекте.

8. Линейная динамическая модель связи структуры и свойства, выраженных в виде двумерных кривых, позволяет не только рассчитать свойства по структуре, но также получить информацию о трехмерной структуре соединений с заданными свойствами.

Личный вклад автора

Все результаты диссертации получены лично автором или в соавторстве при его непосредственном участии. В работах, выполненных в соавторстве, вклад автора состоял в непосредственном участии во всех этапах работы, начиная от постановки задачи и завершая обсуждением результатов. Синтез, очистку и идентификацию новых физиологически активных соединений выполнили сотрудники ИФАВ РАН: Иванов А.Н., Соколов В.Б., Чепакова Л.А., Брель В.К., Додонов М.В., Прошин А.Н., Чистяков В.Г. Биологические испытания на ретардантную активность провел Кокурин A.B. (ВНИИСБ РАСХН). Вклад автора в программный комплекс HYBOT, разработанный совместно с Раевским O.A., Трепалиным C.B. и Раевской O.E. (ИФАВ РАН),

заключался в создании термодинамической базы данных и базы дескрипторов Н-связи.

Автор выражает глубокую признательность доктору химических наук, профессору Раевскому О.А. за ценные научные консультации во время выполнения работы.

Апробация работы

Результаты исследования и основные положения работы были представлены на на IX Всесоюзной конференции «Химическая информатика» (Черноголовка, 1992); на 12-ом Международном симпозиуме �