Метод поверхностных молекулярных потенциалов в расчетах связи "Структура-активность" органических соединений тема автореферата и диссертации по химии, 02.00.04 ВАК РФ

Зырянов, Иван Леонидович АВТОР
кандидата химических наук УЧЕНАЯ СТЕПЕНЬ
Тверь МЕСТО ЗАЩИТЫ
1995 ГОД ЗАЩИТЫ
   
02.00.04 КОД ВАК РФ
Автореферат по химии на тему «Метод поверхностных молекулярных потенциалов в расчетах связи "Структура-активность" органических соединений»
 
Автореферат диссертации на тему "Метод поверхностных молекулярных потенциалов в расчетах связи "Структура-активность" органических соединений"



s

s

4 ¡ f > < * * % *

i. У

, * * * >

' V-- v ^^r^î-'Vr'-^

> jhVs*''' ч W

* «'y . t, % ^ iwt ~ ^

»■ , , ' " -V. v 5 * 1 ^ <*

« &0 V"V- * ' »

» SSV" Jf , 4Í „ ! J*f

. -f. • Z • ч . y *

/ s Í 1 « »1 ¡r

' . ' » f 4 J X- » 4 ( "

f > t 4 » * i Л 1 ,4, ^ , V < ^ .1 1 ¿ „ '

" ^ V jb-w^ - W, „ * »" x

Ф к \ ' * í ♦ * * 1 ' Г

Полном» я <M«KKftöfcie».>ЦМ» A ¿Л Л ' 4 Обим itlfboMu, Ш ' ш, -s г.

Отпечатано ца ромярвт ИФРАН^оявди», М*

V ^ f. 1

Ь Л4 ^ ' - ^ ' '

^ i- ■

s i -

> > ^ fc. "s -, <« Ч ' ^

<Г »'if* f vt »'

<- Л? i

>' H «

-S» -

г

« f" * 4 я

■4Л ..f '

РОССИЙСКАЯ АКАДЕМИЯ НАУК

ИНСТИТУТ ОРГАНИЧЕСКОЙ ХИМИИ ИМ.Н.Д.ЗЕЛИНСКОГО

р 5 0 Д На правах рукописи

ЗЫРЯНОВ Иван Леонидович

I

МЕТОД ПОВЕРХНОСТНЫХ МОЛЕКУЛЯРНЫХ ПОТЕНЦИАЛОВ В РАСЧЕТАХ СВЯЗИ "СТРУКТУРА-АКТИВНОСТЬ" ОРГАНИЧЕСКИХ

СОЕДИНЕНИЙ

(Специальность 02.00.04 - физическая химия)

Автореферат диссертации на соискание ученой степени кандидата химических наук

Тверь 1995

Работа выполнена в Институте органической химии им НДЗелинского, РАН.

Научные руководители: кандидат химических наук, доцент И.В.Свитанько, кандидат физико-математических наук М.И.Кумсков

Официальные оппоненты: доктор химических наук, профессор ВАШляпочников, кандидат химических наук, доцент В.М.Смоляков

Ведущая организация -Институт высокопроизводительных вычислительных систем, РАН

Защита состоится *3* 1ээ5Г в_ час. на заседании

диссертационного совета Д 063.97.02 Тверского госдарственного университета по адресу: 170002, г.Тверь, Садовый переулок, 35, физического факультета ТвГУ.

С диссертацией можно ознакомиться в библиотеке Тверского государственного университета.

Автореферат разослан "1 " О^Г^^-^ 1995г.

Ученый секретарь диссертационного совета

кандидат химических наук, доцент Т.А.Щербакова

Актуальность работы. Центральной проблемой теоретической хтт

является нахождение зависимостей между структурой органических соединений I проявляемыми ими свойствами. В попытках ее решения широко используете вычислительная техника, оснащенная программным обеспечением, позволяющии находить количественные корреляции "структура-свойство" (ККСС). Для построена в ЭВМ ККСС-моделей используют методы описания молекул, включающие вычисление топологических индексов, теоретико-информационных индексов наборов структурных фрагментов различных типов и т.п. Важным аспект создаваемых ККСС-моделей является задача выбора оптимального набор; признаков (дескрипторов) молекул для расчета данного свойства, а также задач; содержательной интерпретации параметров получаемых ККСС-моделей.

В настоящее время при описании структур молекул принято использоват! наборы заранее заданных дескрипторов, индексов, структурных фрагментов формакофоров, , дескрипторных центров и т.п. Наборы признаков могу дополняться, если в ходе решения ККСС-задачи выясняется, что реализованный < программе набор признаков неадекватно описывает исследуемое свойство.

Как правило, набор признаков молекул, используемый для расчета одногс свойства, например, запаха, существенно отличается от набора, по котором; проводят вычисления другого свойства. Выбор признаков, адекватных данном; свойству, является одной из важных проблем, возникающих при решении ККСС

I

задач.

В настоящей работе предлагается новый подход к решению проблемь адекватного выбора признаков для создания математической модели конкретногс свойства молекул. При этом не используются заранее предопределенные списю признаков: дескрипторы молекул формируются автоматически по картинг електростатического поля, создаваемого молекулой, на основе рассчитанное квантовохимически реальной 3-мерной геометрии с учетом требований задаваемых экспертом. При этом картина создаваемого совершенно различным! молекулами электростатического поля может быть подобна и, соответственно появляется возможность объяснения схожих свойств молекул разных структурны: типов.

Целью работы является создание метода предсказания свойств органических соединений на основе автоматического формирования дескрипторов органических соединений, описывающих пространственную структуру, форму поверхности молекул и электростатическое поле на этой поверхности.

В соответствии с целью были поставлены следующие задачи:

1. Провести ' исследование различных вариантов формирования энумерационного представления пространственных структур и форм поверхности в виде набора признаков и обосновать методику выбора адекватного описания пространственных форм молекул и их электростатического поля для расчета данного вида биологической активности.

2. Разработать, отладить и оттестировать алгоритмы и программы, реализующие различные варианты предлагаемой методики.

3. Провести серию вычислительных экспериментов с целью установить оптимальные интервалы используемых в построении дескрипторов параметров, таких как: тип дискретизации представления поверхности и расстояния между точками дискретизации, заряды этих точек, поверхностные потенциалы и др.

4. Провести практическую проверку разработанных дескрипторов для построения ККСС-зависимостей различных видов биологической активности: мускусный запах, психотропная активность и других на обучающих выборках органических соединений разных классов, включая гетероциклические соединения.

Научная новизна работы:

1. Предложена и программно реализована новая методика полуавтоматического экспертного описания пространственных структур, форм поверхности молекул и - распределения молекулярного электростатического потенциала на этих поверхностях на основе перечисления всех пар 'особых точек" с учетом их взаимного расположения. Точки выбираются по результатам расчетов квантовой

химии и отражают структурные, химические и иные особенности строени: молекул.

2. Предлагаемое описание формы поверхности молекул и распределена электростатического потенциала не является связанным с конкретным! атомами или структурными фрагментами, что позволяет производит! анализ соединений, принадлежащих к различным структурным классам.

3. Показано, что с целью получения адекватного описания пространственны: структур и форм поверхности молекул необходимо дискретизпровап величины расстояний, потенциалов и зарядов. Сформулированы правил; дискретизации потенциалов, зарядов и расстояний.

4. Сформулированы правила выбора особых точек, исследованы различны« варианты учета точек в представлении пространственных структур и форл поверхности молекул. Правила прошли успешную экспериментальнук проверку.,

5. Методика была успешно апробирована на следующих видах биологически: свойств: мускусный запах, психотропная активность.

Практическая ценность работы состоит в том, что

1. Разработаны и успешно применены оригинальные алгоритмы и программы предназначенные для создания описания пространственных структур форм поверхности молекул и картины молекулярного электростатической потенциала, построенных по результатам квантовохимических расчетов Показаны высокие прогностические свойства получаемых дескрипторов.

2. На основе предложенного подхода построены ККСС-модели для расчет; таких различных видов биологической активности соединений ка1 мускусный запах, психотропная активность на обучающих выборка: органических соединений различных химических классов. Полученньк модели могут быть использованы для оценки указанных выше виден биологической активности еще не исследованных соединений.

Публикации: Результаты работы содержатся в 7-ми публикациях.

Апробация работы: Результаты работы докладывались на семинар» академика Н.С.Зефирова (МГУ, 1994), на семинаре академика Ю.И.Журавлева I И.Б.Гуревича (Институт высокопроизводительных вычислительных систем, РАН

Москва, 1994), на семинаре профессора Ю.Г.Папулова (Тверской государственный университет, 1994), во Всероссийском онкологическом центре (Институт .экспериментальной терапии и диагностики опухолей, 1995г), на 7-ой Всероссийской конференции "Математические методы распознавания образов* (Пущино, 1995г), на 1Х-ом Европейском симпозиуме по органической химии (Варшава, 1995г).

Объем работы: Работа состоит из введения, трех глав, заключения, списка литературы и приложений.

Основное содержание диссертации.

Во введении дается общая постановка проблемы поиска взаимосвязи между структурой соединения и его свойствами, отмечается важность и актуальность задачи поиска количественных корреляций структура-свойство для биологически активных молекул.

В первой главе проведен обзор методов описания формы и пространственной структуры молекул, сопоставления полученных описаний между собой, представление этих описаний в виде дескрипторов, используемых при остроении ККСА-зависимостей.

Во второй главе описан метод представления пространственнй структуры молекул, формы их поверхности и картины молекулярного электростатического потенциала на этой поверхности, построение набора дескрипторов и выделение общих закономерностей на основе анализа этого набора для всех молекул обучающей выборки.

Общая схема предлагаемого подхода такова:

1. Молекула рассматривается как пространственный объект, обладающий определенной структурой, задаваемой пространнственными координатами атомов и таблицей связи атомов.

2. На основе экспертных оценок, в соответствии с определенными правилами производится выделение в молекуле или ее окрестностях "особых точек" или "точек представления".

3. Каждая особая точка задается пространственными координатами и своим типом. Тип точки определяется на основании правил, устанавливаемых экспертом.

4. Для всех особых точек молекулы строится матрица расстояний 0={с)ц}, гд< с1и - евклидово расстояние между ¡-ой и .¡-ой точками. На основе экспертной оценю (или путем вычислительного эксперимента) выбирается разбиение расстояний н;

интервалы и строится "интервальная" матрица Р={ ри }, где ри - номер интервала, 1 который попало расстояние с!и.

5. Полученная интервальная матрица является основой для построена описания объекта путем полного перечисления всех признаков определенноп вида:

а)"Парное перечисление" особых точек - формируется список повторена всех пар точек в виде (Т1,Т2,Р)Х где: Т, и Т2 - типы (имена) особых точек, входящи: в пару, Р - номер интервала расстояния между ними, N - число повторена фрагмента (Т^Тг.Р) в объекте. При этом считается, что символьная запись (Т^Тг.Р есть имя признака.

б)"Перечиорение троек" особых точек - формируется список повторений все: троек особых точек в виде СП.Тг.Тз.Р^.Ргз)^ или (Т1 .Тг.Тз.Р^.Ргз.РзОХ где

T1.T2.T3 - типы (имена) особых точек, P12.P23.P31 - номера интервалов расстояни! между 1-ой и 2-ой, 2-ой и 3-ей, 3-ей и 1-ой точками соответственно. Символьна: запись (Т,,Т2,Тз,Р12,Р2з) или (Тт.Тг.Тз.Р^.Ргз.РзО является уникальным именег признака.

Признаки считаются равными, если совпадают их имена. Особые точки I

I

номера интервалов расстояний перичисляются в имени признака в возрастающег лексикографическом порядке.

6. Пары (или тройки) особых точек перечисляются в каждой молекул! обучающей выборки. Составляется общий список различных признаков, найденны в данной выборке, и на его основе формируется матрица описания "молекула признак" Х={ хц}, где хи - число повторений ]-ого признака в ¡-ой молекуле.

Далее в ККСС-системе ВЩЮОЫ проводится отбор значимых признаков строится семейство моделей, наиболее адекватно описывающих заданно1 свойство в терминах типов особых точек, предложенных экспертом. ККСА-модел строятся в виде (1;

э, = А0 + ]£ а , • У „. I = 1 . . . к . ] = 1 . . . N (1)

где ¡-номер признака в модели, |-номер молекулы в наборе, к-количество переменных в модели; У-отобранные значимые признаки, N - размер обучающей выборки.

7. На основе полученных ККСС-моделей и соответствующего набора признаков, входящих в модели, выявляется физическое содержание особенностей формы поверхности и пространственной структуры молекул, ответственных за проявление заданного свойства.

Во втором разделе данной главы описаны этапы обработки обучающей выборки при формировании дескрипторов.

Первым этапом применения данной методики является формирование представления молекулы в виде пространственного объекта, то есть определение координат атомов, их зарядов и распределения электронной плотности в пространстве. Начальное приближение геометрии молекул следует проводить методами молекулярной механики, а окончательную оптимизацию и вычисление необходимых параметров - методами квантовой химии.

Следующий, второй этап состоит в выборе особых точек и их классификации. В зависимости от предположений эксперта-химика о возможных механизмах проявления свойства, особые точки могут выбираться несколькими способами:

1) Центры атомов, классифицированные (помеченные) различными способами. В качестве метки может быть использовано имя атома, информация о его химическом окружении. Так же может быть использована информация, получаемая в результате молекулярно-механических и квантово-химических расчетов: заряды на атомах, электронная плотность и др. При выборе меток непрерывные величины должны быть приведены к дискретному виду путем разбиения диапазонов значений, принимаемых величинами, на интервалы и приписывания уникальных имен (меток) каждому интервалу.

2) Центры химических связей. В качестве особых точек могут быть использованы связи между атомами. При классификации связей и выборе их символьных имен можно использовать расчетные характеристики: длины и кратности связей, парциальные дипольные моменты и др. При определении меток непрерывные величины должны быть дискретизированы.

3) Точки, не связанные непосредственно с атомами и связями. Эти точ!' выбираются в окрестностях молекулы з соответствии с условиями эксперт. Особые точки могут быть расположены на молекулярных поверхностях различног вида, таких как поверхность Ван-дер-Ваальса, ковалентная поаерхность и др.. Н этих поверхностях (либо непосредственно в пространстве) вычисляется знамени некоторой "энергетической функции". Тогда экстремальные точки поверхности, н которых "энергетическая функция" имеет локальный максимум или минимуг, рассматриваются как особые точки. В качестве вариантов "энергетическс функции" естественно использование средневзвешенного потенциала ионизации молекулярного электростатического потенциала, применение которого был исследовано нами подробно. Выбор точек указанного вида имеет то преимуществ! что эти точки не связаны непосредственно с атомами, входящими в соста молекулы, или с молекулярными фрагментами. Это позволяет одновременно единообразно ирследовать наборы соединений, принадлежащих к разньн структурным классам, на проявление определенного вида биопогическо активности.

После выбора особых точек эксперт задает правила классификаци (определения типов) особых точек. Для этого эксперт анализирует экстремум! распределения особых точек, вычисленных на всех молекулах обучающе выборки. Каждый класс (тип) особых точек получает свое имя. При этом элемент!

I

имени, выбранные экспертом для построения полного имени особых точек могу быть трех видов:

а) Символьная строка - напрямую используется при построени идентификаторов, например: имя атома, имена пар атомов, соединенны химической связью.

б) Дискретная величина - принимает одно значение из заданного алфавит: При этом элементу описания присваивается символьное имя, используемое построении идентификатора признака, например: простая связь - 1.1, двойная - И ароматическая - М, и т.п.

в) Квантованная величина - элемент описания принимает произвольны значения внутри определенного диапазона. В этом случае эксперт должен разбит диапазон значений на интервалы. При выборе интервалов эксперт може

опираться на данные, о плотности распределения значений анализируемой величины. Каждому интервалу присваивается символьная метка, используемая для классификации особых точек. Например: (0.8-1.15) - 'К1" (1.15-1.35) - "К2", (1.351.65) - "КЗ", где в круглых скобках заданы границы интервала.

На основании полученных правил формирования символьных меток для каждой особой точки строится идентификатор (имя), путем присоединения меток в установленном порядке, например: "N"+"03" - для особой точки, представленной атомом азота, заряд которого попадает в интервал, помеченный именем "03".

Третий этап состоит в определении интервалов дискретизации расстояний между особыми точками. При этом эксперт опирается на анализ гистограмм расстояний, полученных в результате рассмотрения всех молекул обучающей выборки.

Таким образом, эксперт задает:

1) правила выбора особых точек;

2) правила классификации особых точек;

3) дискретизацию расстояний между особыми точками.

После этого весь дальнейший анализ структур обучающей выборки выполняется программой автоматически: она проводит построение списка признаков для каждой молекулы и общего списка по всей обучающей выборке, построение семейств классификационных уравнений.

В третьей главе описано применение разработанных дескрипторов к прогнозированию биологической активности соединений.

Рассмотренный в методологической части подход был применен для анализа активности соединений, обладающих мускусным запахом (раздел 3.1) и психотропной активностью (раздел 3.2); в разделе 3.3 описан анализ температур кипения.

В разделе 3.1 работы описаны этапы поиска взаимосвязи между структурой соединений и их мускусным запахом. Выбор данного вида активности был продиктован его важной ролью для парфюмерной промышленности и тем, что данный вид активности не является простым "аддитивным" свойством ("аддитивное" свойство - это свойство, величина которого, может быть с определенной погрешностью представлена в виде суммы "инкрементов" отдельных

структурных элементов; как следствие этого свойство изменяется на вполн конкретную величину при определенном изменении в структуре соединения).

Была использована обучающая выборка, содержащая 110 соединений, V которых 35 обладают ярко выраженным мускусным запахом, а остальные лишен: его. Базовые структуры показаны на Рис.1.

Рис.1. Базовые структуры. Вид активности - мускусный запах.

Для каждой молекулы выборки была произведена оптимизация геометрм Оптимизация выполнялась в два этапа: начальная оптимизация - методам молекулярной механики с использованием силового поля ММХ\ конечна оптимизация - методами квантовой химии с использованием гамильтониана АМ1.

Для построения дескрипторов были исследованы 6 типов особых точек, с каждым из которых производилась своя серия вычислений:

а) центры атомов молекулы с приписанными им именами (серия вычислений

0;

б) центры атомов молекулы с приписанными им величинами зарядов без использовния имен элементов. Использовались заряды атомных остовов и формальные заряды (т.е. такие условные заряды на атомах, на основании которых электростатическое поле, создаваемое молекулой, может быть аппроксимировано наилучшим образом) (серии вычислений II,IV);

в) центры атомов молекулы с приписанными им именами и величинами зарядов. Использовались заряды атомных остовов и формальные заряды (серии вычислений lll,V);

г) точки на "поверхности электростатического потенциала", в которых молекулярный электростатический потенциал (МЭП) имеет локальные экстремумы; каждой точке приписано значение МЭП (серия вычислений VI).

"Поверхность электростатического потенциала" была определена как покрывающая поверхность, с заданными на ней значениями МЭП. Покрывающая поверхность - это геометрическое место точек, созданных центром шарика-зонда при облегающем прокатывании его по поверхности Ван-дер-Ваальса. (Поверхность Ван-дер-Ваальса формируется в результате покрытия молекулы жесткими взаимопроникающими сферами, построенными на центрах атомов и имеющими радиусы Ван-дер-Ваальса для соответствующих атомов). Использование точек на "поверхности электростатического потенциала" позволяет не связывать биологическую активность молекул с конкретными типами атомов, входящих в состав молекулы.

Путем проведения ряда вычислительных экспериментов по построению ККСА-моделей было найдено, что оптимальное значение радиуса шарика-зонда лежит в пределах 1.4-1.6А. Это соответствует средней величине радиусов Ван-дер-Ваальса для наиболее часто встречающихся в органических соединениях атомов. Для формирования покрывающих молекулы поверхностей нами была использована величина радиуса 1.5А.

Диапазоны значений зарядов атомных остовов и формальных зарядов были разделены на интервалы в зависимости от частоты встречаемости этих величин в обучающей выборке. Путем ряда вычислительных экспериментов было установлено, что близкое к оптимальному разбиение должно включать в себя точки, соответствующие локальным минимумам и максимумам на гистограмме рапределения этих величин.

Диапазоны значений расстояний между особыми точками были разделены на интервалы со средним шагом 0.2А.

Для каждой молекулы в каждой серии вычислений, производимых со своим типом особых точек, был построен набор дескрипторов вида 0\,Т2,К),1Ч, где: "Г| и Т2 - типы точек входящих в пару, - номер интервала расстояния между ними, N -число повторений признака (Т1,Т2,Я) в молекуле.

Был построен список дескрипторов для всех молекул. Каждому дескриптору в списке был присвоен уникальный порядковый номер. Таким образом каждой

молекуле в соответствие был поставлен вектор признаков (Х1.....Хм), где X, -

встречаемость ¡-ого дескриптора в молекуле.

Построение ККСС-моделей, описывающих свойство молекулы, проводилось с использованием системы БИБИГОН. Модели оценки свойства Б имели вид (1).

При классификации полагалось, что вещество обладает запахом, если 3>0.5, в противном случае полагалось отсутсвие запаха. Для всех вышеуказанных типов особых точек (серии вычислений 1-\/1) были построены семейства математичских моделей. Прогностическая способность моделей в зависимости от типа используемых особых точек убывает в следующем порядке: модели VI серии, модели 1\/,11,111,\/ серий, модели 1-ой серии. Результаты сопоставления приведены на рисунке 2.

На рисунке 26. хорошо видно, что использование дескрипторов, построенных на точках, расположенных на "поверхности электростатического потенциала" (кривая VI) обеспечивает более высокое качество ККСС-моделей, чем в случае использования дескрипторов, построенных на центрах атомов молекулы (кривые I -V) даже при малом числе дескрипторов, равном 8.

' I -Ц

IV -V

■vi

I. 10. 12. 14. 16.

Число дескрипторов в модели

Рис.2а. Зависимость квадрата коэффициента корреляции от числа дескрипторов, входящих в модель, для серий вычислений I-VI

8. 10. 12. 14. 16. Число дескрипторов в модели

Рис.2б. Зависимость квадрата коэффициента корреляции от числа дескрипторов, входящих в модель, для серий вычислений I-VI. Кривые построены с использованием метода скользящего контроля.

То, что качество ККСС-моделей (кривая VI) почти не изменяется с увеличением числа дескрипторов, означает, что в данном виде биологической активности для получения адекватного описания молекулы вполне достаточно небольшого числа дескрипторов. То есть, в случае мускусных одорантов, использование дескрипторов, не связанных с конкретными атомами, но построенных на "поверхности электростатического потенциала", приводит к очень хорошим результатам.

На следующем рисунке сопоставлены по прогностической способности предлагаемая модель (серия VI, особые точки на поверхности электростатического потенциала) и ККСС-модель системы БИБИГОН, построенная на "пустых цепочках".

Число дескрипторе* в модели

-VI

-VI

-----в

Рис.3. Зависимость между количествам ошибок классификации и числом дескрипторов в модели. \/1-кривая построена для серии VI, В-кривая построенная для ККСС-моделей системы БИБИГОН. \/1+,В+ кривые для тех же моделей, но построены с использованием метода скользящего контроля.

Приведенные на рисунке данные показывают, что предлагаемые в настоящей работе модели (кривые VI и \/1+), построенные на дескрипторах, не связанных с атомами, но описывающих форму поверхности молекулы и распределение молекулярного электростатического потенциала на ней, обладают большей прогностической 1 способность, чем ККСС-модели системы БИБИГОН. Это указывает на то, что предлагаемые в работе способы описания молекул формируют достаточно адекватное описание для исследуемого вида активности.

На основании полученных ККСС-моделей были определены такие системы особых точек, которые присутствуют в структурах веществ, обладающих мускусным запахом и отсутствуют в структурах веществ, лишенных мускусного запаха. На рис.4, для примера приведены 5 структур и показано расположение найденных систем особых точек. Видно, что в структуразх веществ, не обладающих мускусным запахом, эти системы либо отсутствуют, либо сильно искажены.

Так же была найдена система особых точек, расположенных на поверхности электростатического потенциала, которая не встречается в молекулах, не обладающих запахом, но присутствует в тех структурах, которые им обладают. Эта система представляет собой треугольник с такими параметрами: а=(-510,-180)Дж/моль, Ь=(-690,-360)Дж/моль, с=(+220,+350)Дж/моль; (аЬ)=(3.85,5.90)А, (аЬ)=(6.2,7.4)А, (ас)=(7.0,8.0)А.

«г

««■«.53 (+0.М.+0/П) Ь-Л>.17 (-0.15,-0.23) С-+0.39 (+0.33.+0.48) ¿•М1.0 (-0.15.+ОЛ2) •*+0.05 (.0.15.+0.12) {.Ь)-5.78А (5-ЗА.5.8А) («))«2.50А

(«)»г50А (гзлл.бл)

(+0.44.+<Ш) (-0.15.-0.28) (+0.33.+0.+3)" (-0.15.+0.12) (-О.15.+0.12)** (•Ь)=5.78А (5.3А.5.8А) (с<1)-=2.50А

(«)-1»А (2.3АЛ.6А)

А«=1

Ь--0.17 с»+0.36 ¿-■0.09 »•«1.01

(+0.44.+0.99) (JJ.15.-0.28) (+0.33.+0.48) (Л.15.+0.12) (Л.15.+0.12) («ЬИ.78А (5.3А.5 8А) (кО>2.50А

(«)«2.50А (2.3А.2.6А)

Асг=1

«=+0.45 (+0.44,+0.99) ¡у-0.25 (-0.15.JJ.28) С-+0.34 (+0.33.+0.48) <М.10 (-0.15.+0.12) «■+0.08 (-0.15.+012) («Ь)=5.75А (5.3АЛ8А) М)-2.50А

(с«)-2.5С!А (2.3А.2.6А)

Асс=0 »-+0.51 Ь-

с+0.35 ¿=.<Ш •»+0.18 (»Ь)=

(с«1)=2.50А (м)»2.50А (2.3АЛ.6/

(+0.44.+С (-0.15^0-2.

(+азз.+(

(•0.15.+0.1 (-0.15,+0. (УЗАУ&

Рис.4. Расположение систем особых точек, отвечающих за наличие мускусного запаха. Ас1=1 вещество обладает запахом, Ас1=0 - вещество не обладает запахом; аДсДе - аособые точи расположенные на центрах атомов, и входящие в состав систем особы* точек, в качестве метк использован формальный заряд. (аЬ),(с£)),(се) - расстояния между особыми точками. В круглы скобках указаны допустимые пределы формального заряда и межточечных расстояний. ** показывает, что данный параметр сильно выходит за допустимые пределы.

В разделе 3.2 работы описаны этапы поиска взаимосвязи между структурой соединений и их психотропной активностью.

К, Мс Ме К, К)

ф—ТХХ

(1Ь) о" (III)

к/ и

,он

■он

(VII)

V

он

<У11Ь)

А-/

^ >«*> Г'Г'Т

(К)

(XI)

Рис.5. Базовые структуры. Вид активности - психотропная активность

Была использована выборка, содержащая 47 соединений, из которых 9 обладают ярко выраженной активностью, 26 соединений неактивны, а оставшиеся 12 соединений обладают промежуточной активностью. Базовые структуры входящих в выборку соединений показаны на Рис.5.

Используемые соединения были разделены на три класса: класс "V -высокая активность, класс "О" - низкая активность, класс "Т - средняя активность.

Для каждой молекулы обучающей выборки была произведена оптимизация геометрии. Оптимизация выполнялась в два этапа: начальная оптимизация методами молекулярной механики с использованием силового поля ММХ; конечная оптимизация методами квантовой химии с использованием гамильтониана РМЗ.

Для формирования дескрипторов были использованы те же 6 типов особых точек, что и в случае мускусных одорантов. Все далнейшие шаги, необходимые для построения ККСА-моделей, были выполнены так же , как для выборки мускусных одорантов.

В системе БИБИГОН было проведено построения ККСС-моделей, описывающих свойство Б по формуле (1).

Путем минимизации числа. ошибок классификации определялись граничные значения Б. Было найдено, что при Э <0.25 соединение следует относить к классу "0", при Б >0.7 соединение должно быть отнесено к классу "1", при промежуточных же значениях соединение относится к классу "1°.

На рисунке 6 приведены зависимости квадрата коэффициента корреляции от размерности модели для серий вычислений 1Л/1. На рисунке хорошо видно, что качество ККСС-моделей, построенных на дескрипторах, описывающих "поверхность электростатического потенциала" (кривая VI), сравнимо с качеством некоторых ККСС-моделей, построенных на дескрипторах, связанных с конкретными атомавми, входящими в состав молекул (кривые IV,V). При этом, ККСС-модели, описывающие поверхность (кривая VI), показывают значительно большую стабильность, чем модели,

описывающие расположение конкретных атомов в пространстве: кривая VI с возрастанием числа дескрипторов в модели не убывает, а очень плавно возрастает, в то время как кривые Ш.МУ убывают на отдельных своих участках. Это свидетельствует в пользу того, что построенное на основании "поверхности электростатического потенциала" описание молекулы более адекватно отражает такой вид биологической активности, как психотропная активность, чем описания, построенные на конкретных атомах, входящих в состав молекул

Число дескрипторов в модели Число дескрипторов в модели

Рис.ба. Зависимость квадрата коэффициента Рис.66. Зависимость квадрата коэффициен-корреляции от числа дескрипторов, входящих а корреляции от числа дескрипторов, входящих модель, для серий вычислений 1ЛЛ модель, для серий вычислений М/1. Кривь

построены с использованием метода скользяще контроля.

Полученные модели VI серии были использованы для прогнозирования психотропной активности неисследованных соединений. Была использована выборка, состоящая из 21 соединения. Результаты прогноза были сопоставлены с данными экспериментальных измерений активности. Для всех 4-х экспериментально исследованных соединений результаты прогноза полностью совпали с результытами анализа.

На следующем рисунке сопоставлены по прогностической способности

предлагаемая модель (серия VI, особые точки на поверхности электростатического потенциала) и ККСС-модель системы БИБИГОН, построенная на "пустых цепочках".

Рис.7. Зависимость между количеством ошибок классификации и числом дескрипторов в модели. У1-кривая построена для серии VI, В-кривая построенная для ККСС-моделей системы БИБИГОН. кривые для тех же моделей, но

построены с использованием метода скользящего контроля.

Чмс!

Приведенные на рисунке данные показывают, что предлагаемые в настоящей

работе модели (кривые VI и построенные на дескрипторах, не связанных с атомами, но описывающих форму поверхности молекулы и распределение молекулярного электростатического потенциала на ней, обладают большей прогностической способность, чем ККСС-модели системы БИБИГОН. Как и в случае мускусных одорантов, это указывает на то, что предлагаемые в работе способы описания молекул формируют достаточно адекватное описание для исследуемого вида активности.

На основании полученных ККСС-моделей были определены такие системы особых точек, которые присутствуют в структурах веществ, обладающих сильной психотропной активностью, слегка искажены для веществ с промежуточной степенью активности и очень сильно искажены для слабоактивных веществ. На рис.8, для примера приведены 5 структур и показано расположение найденных систем особых точек.

Так же была найдена система особых точек, расположенных на поверхности электростатического потенциала, которая не встречается в молекулах, не обладающих запахом, но присутствует в тех структурах,

которые им обладают. Эта система представляет собой треугольник с такими параметрами: а,Ь=(+215,+405)Дж/моль, с=(-545,-435)Дж/моль;

(аЬ)=(9.3,10.1)А, (ас),(Ьс)=(8.3,8.9)А.

А«И Асг-1 Асс="1 Аср=0.5 Ас1=0

•»Л« (Л.40..0М) »-.01« (.0.40.-0.50) «.ЛЯ (-0.40.Л50) «-ЛЛ (Jn0.-0.50) • »..0.30 (-0.40.-0j0)

Ь- -0.4) (-0.45.-0-60) Ь-Л.49 (-0.45.-0 60) Ь- -0.46 (Л.4!.-0.Ш) Ь= Л-60 (-045..0.60) Ь= Л.49 (.0.45,-0.60)

е» +0.71 (+0.4^+0.73) «" +0.69 (+0.48.+1Ш) <> +0.65 (+04^+0.7)) г-+0.40 (+0.4И.+0.7}) • с-+0.40 (+0.48.+0.71

(.Ь)-2-)2А (132АЛ50А) (А)-г46А i2.32A.Z50A) (А)=2.45А (2.32А.2.ИА) (Л)-234А (23М.2.50А) (Д>»135А (13М.150А)

(«Н.42А (3-20АД<2А) («ИЛА (3-20А.3.42А) («И-20А (3.20АЛ2А) («И-41А (520А.142А) («>.3.40А (Э.20А3.42А)

Рис.8. Расположение системы особых точек, отвечающих за наличие мускусного психотропной активности. Ай=1 - вещество сильно активно, Ас1=0 - вещество слабо активно, Ай=0.5 - вещество проявляет промежуточную степень активности; а,Ь,с - аособые точки, расположенные на центрах атомов, и входящие в состав системы особых точек, в качестве метки использован формальный заряд. (аЬ),(ас) • расстояния между особыми точками. В круглых скобках указаны допустимые пределы формального заряда и межгочечных расстояний. * - данный параметр выходит за пределы, ** -показывает, что данный параметр сильно выходит за допустимые пределы.

В разделе 3.3 работы описан анализ температур кипения веществ.

Была использована выборка, содержащая 334 соединения. Для каждого соединения была известна температура его кипения.

Для каждой молекулы обучающей выборки была произведена оптимизация геометрии. Оптимизация выполнялась в два этапа: начальная оптимизация методами молекулярной механики с использованием силового поля ММХ; конечная оптимизация методами квантовой химии с использованием гамильтониана РМЗ.

Для формирования дескрипторов были использованы те же 6 типов особых точек, что и в предыдущих случаях. Для каждого из этих типов особых точек были выполнены те же действия, что и для мускусных одорантов и психотропных веществ.

В системе БИБИГОН было проведено построение ККСС-моделей, описывающих свойство Б по формуле (1). Однако ни в одной серии вычислений не удалось найти сколько-нибудь приемлемой зависимости

между построенным по нашему методу описанием соединений и их температурами кипения: квадраты коэффициентов корреляции меньше 0.5 при любом количестве дескрипторов, входящих в модель.

Такой результат не является неожиданным, поскольку предлагаемый нами метод построения дескрипторов ориентирован на поиск геометрических и структурных особенностей молекулы, которые являются общими для всей обучающей выборки или некоторого ее подмножества; они позволяют определить комплементарность молекулы и эталона (рецептора) по принципу "ключ-замок", важную для проявления биологической активности. Такие же свойства, как температуры и энтальпии фазовых переходов, не обусловлены взаимодействием молекул с эталоном, а зависят лишь от сил взаимодействия молекул между собой.

Отрицательный результат анализа температур кипения с помощью предлагаемого подхода, позволяет экспериментально подтвердить теоретически устанавливаемы границы метода: метод может оказаться перспективным для исследования таких свойств соединений, для проявления которых важна комплементарность молекулы вещества и некоторой эталонной структуры (рецептор, катализатор и т.п.); метод не следует применять для анализа тех свойств, где данная комплементарность несущественна (термодинамические свойства, спектральные характеристики и т.п.).

Основные результаты и выводы:

1. Предложена и реализована новая методика автоматического описания пространственной структуры, формы поверхности молекул и картины молекулярного электростатического потенциала на этой поверхности на основе перечисления всех неэквивалентных признаков заданного типа, опирающихся на реальную 3-х мерную геометрию моликул и их характеристики, с учетом требований, задаваемых экспертом.

2. Построение молекулярных дескрипторов на основе поверхности молекул и электростатического потенциала на этой поверхности позволяет не принимать во внимание конкретные типы атомов и фрагментов, входящих в молекулу, что предоставляет широкие возможности для обработки выборок, в состав которых входят соединения разных структурных классов.

3. На основе предложенной методики изучены взаимосвязи "структура-активность", построены ККСС-модели для веществ, обладающих мускусным запахом, и веществ, проявляющих психотропную активность. Выявлены пространственные особенности структур, ответственные за проявление данных видов биологических биологической активности.

4. Предсказаны структуры веществ, обладающих психотропной активностью.

Список работ по теме диссертации:

1. I.V.Svitan'ko, M.I.Kumskov, I.L.Zyryanov, I.A.Suslov, A method for describing the molecular electrostatic potential in determing structure-activity relationship. //Mendeleev Commun., 5,1994, p. 161-162.

2. Кумсков М.И., Зырянов И.Л., Свитанько И.В., Новый метод представления пространственной электронной структуры молекул в задаче прогнозирования биологической активности.//РаКегп Recognition and Image Analysis, 1995,3, p.477-484.

3. I.V.Svitan'ko, I.L.Zyryanov, M.I.Kumskov, L.I. Khmenitski, Ll.Suvorova, A.N.Kravchenko, T.B.Markova, O.V.Lebedev, GAOrekhova, S.V.Belova, The surface molecular potential method for calculating the structure-activity relationship for psychotropic compounds.//Mendeleev Commun., 2, 1995, p.49-51.

4. Зырянов И.Л., Кумсков М.И., Свитанько И.В., Задача дискретизации межфрагментных расстояний при "энумерационном" представлении молекул

при поиске зависимостей "структура-биологическая активность7/деп. г ВИНИТИ, № 2625-В-95.

5. Зырянов И.Л., Кумсков М.И., Свитанько И.В., Задача выбора "точе! представления" молекулярного электростатического потенциала при поиске зависимостей "структура-биологическая активность" //деп. в ВИНИТИ, № 2626-В-95.

6. М.И.Кумсков, И.Л.Зырянов, Г.М.Макеев, Учет локальных особенностей пространственных форм молекул с целью классификации их биологически)! свойств на основе структурных спектров // Тезисы доклада 7-ой Всероссийской конференции "Математические методы распознавания образов", Пущино, 1995г., с. 116.

7. I.V.Sviian'ko, M.I.Kumskov, I.L.Zyryanov, in: Molecular electrostatic potential method in determination of structure-activity relationshipII Abstracts of the IX-th European symposium on organic chemistry, Warszawa, Poland, 1995., p.256.