Новые топологические индексы в количественных соотношениях "структура-свойство" тема автореферата и диссертации по химии, 02.00.03 ВАК РФ

Девдариани, Роберт Отарович АВТОР
кандидата химических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1992 ГОД ЗАЩИТЫ
   
02.00.03 КОД ВАК РФ
Автореферат по химии на тему «Новые топологические индексы в количественных соотношениях "структура-свойство"»
 
Автореферат диссертации на тему "Новые топологические индексы в количественных соотношениях "структура-свойство""

[17,-2 9:.

МОСКОВСКИЙ ОРДЕНА ЛЕНИНА, ОРДЕНА ОКТЯЭРЬСКОИ РЕВОЛЮЦИИ И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В.ЛОМОНОСОВА

ХИМИЧЕСКИЙ ФАКУЛЬТЕТ

На. правах рукописи

ДЕВДАРИАНИ РОБЕРТ ОТАРОВИЧ

УДК 547.1+341.80+681.142.2

НОВЫЕ ТОПОЛОГИЧЕСКИЕ ИНДЕКСЫ В КОЛИЧЕСТВЕННЫХ СООТНОШЕНИЯХ "СТРУКТУРА-СВОЙСТВО".

(02.00.ОЗ-органаческая таи)

АВТОРЕФЕРАТ диссертации и» соискание ученсЗстепега кандидата жюшчесюи вауя

ШСКВА-1982

Работа выполнена ¡¡а кафедре органической химки в лаборатор/.к органического синтеза химического факультета Московского государственного университета им. К.В. Ломоносова.

Научные руководители: академик АН СССР,

доктор химических наук, профессор Н. С.Зефиров, ст. научны?, сотрудник, к.х. к. В. А. Палвлик.

Научньй консультант: научный сотрудник С. С-Трач.

Официальные оппоненты: доктор химических наук, профессор Раевский 0. А., кандидат Физико-математических наук Зенкин А. А.

Вея/лее учреждение: Физико-химический институт

им. А. В. Богатсхого АН Украины, г. Одесса

Зааята состоится 27 февраля 1992 года в 16" чао. на заседании специализированного Ученого Совета Л. О 53.03.58 по химическим наука« при Московском государственной университете киени Н. В. Ломоносова по адресу: 119899, ГСП. Москва, В-234, Ленинские горы, химический факультет МГУ. аудитория 337. С диссертацией можно ознакомиться в библиотеке химического факультета МГУ им. М. В. Ломоносова.

Автореферат разослан „января 1992 г.

Уч^кч-Я секретарь спецаализкроваявого Ученого Совета, хакгйд.!? хачхчесодс наук,

«ауч)!ЫЗ сотрудник -■"*•• " ■ " J Э. А. Вохова

ОБШ ХАРАКТЕРИСТИКА РАБОТЫ. \ Актуальность работы. Исследование проблемы связи мехду 'строением и свойствами органических соединения с использованием 'математических методов и вычислительной техники является од.чоЯ из важнейших задач теоретической органической химии. В настоящее время эта проблема особенно актуальна в тех случаях, когда требуется создать вещества с определенным набором свойств. Значительное место в методах ее решения занимает спосойи количественного описания молекулярной структуры органических соединений с помощью топологических индексов - инвариантов иолекулярных графов, соответствующих химическим структура«, и выявление связи между свойствами и такими индексам!!. Решение задачи о соотношении структура и свойств даге для отдельного, достаточно узкого класса соединений представляется весьма важным. Найденные закономерности можно использовать для систематизации структур данного класса, для прогнозирования свойств и поиска новых соединения с заданный набором свойств. Кроме того, установленные закономерности могут оказаться полезными при разработке новой теории, объясняющей изучаемое явление, дать клпч к понимание механизма действия биологически активных соединений, и т.д.

Цель работы состоит в разработке и применении г. о в их способов количественного описанкд щелоку.т. а также поиске корреляционных уравнений между физико-химическими свойствами органических соединений и предложенными топологическими индексами СТЮ. Задачами исследования являются:

-Поиск новых способов количественного описания молекул, а также поиск корреляционных соотноиенай между предлагаемыми индексами, основанными на определителе кодифицированной матриц.» смежности, учитьтасееЯ кратности связей и характер еходяздх в молекулу элементов, к свойствами отдельных классов органических соединений. Цель нахохдения таких закономерностей - это теоретическое предсказание свойств для новых соединения из рассматриваемого класса исходя лишь из иг структурной ^сриуот.

•, -Разработка ковьсс тополого-коафггурааненных аналогов индекса Вивера, характеризующих не только строение срггшяческжх соединений, "но в относительное расположение атомов на плоскости или в пространстве.

-Разработав подходов к реаеяив так казь¡ваеасЗ обрзткоЭ задачи, которая заключается в калоадекяя веса структуршга фермуя

1

некоторого класса соединений с заданными свойства««.

-Создание хсмпьотеряых программ для вычисления предложенных индексов.

Методы исследования. Предлагаемые в работе индексы были разработаны в лаборатории органического синтеза химического факультета МГУ. Комг.ьотеркые программы для расчета индексов ориентированы на микро ЭЭМ "Искра-226" и персональные коипьстерьг типа IBM PC. Построение количественных соотношения "структура-свойство" осуществлялось с помощью комплексов хоипызтерных программ 'ЭММА" и "STAR".

Научная новизна работы заключается в следующем:

-Для характеристики плоских укладок графов, отвечавши геометрический изомерам органических соединений плоского строения, предложен новый класс инвариантов - тополого-хонфигурациснн«? индехсы ¡Л С), К G) и KG), а также отвечаешь и« расширенные индексы.

-Введена группа топологических индексов, основанных на разновидности матрицы смегкости. Показано, что индексы хорошо коррелирует с некоторыми физико-химическими свойствами органических соединений, а один из них может служить критерием разветзленноста молекулярных графов.

-Найдено белее 20 корреляционных уравнений, связываодих физико-химические свойства и топологические характеристики для отдельных рядов органических соединения.

-Предложено использовать взвешенные аналоги топологического индекса Рандича. для опенка температуры плавления по структурной формуле для совал." яла ряда селенофена, индандиона и хизамеиенняс бензолов, подобраны "веса" различных типов атомов в таких индексах для перечисленных рядов.

-Разраготаиа методология реконструкции ациклических малс-кул.чркых графов для заданного интервала значения индекса Ракдпча, которая мехет служить основой для генерации структур с задаины* сгсЯством в тех случаях, когда свойство'коррелирует с ккд*ь.2си Ряндича.

Практическая акачпмс-сть выполненной работы заключается в тси. что еззмшю» топологические и тополого - конфигурационные гидексы является аногруиентои для количественного описания структуры органически* соединенна и могут использоваться при яр«огн»ировани; их свойств. Созданные коипызтерныв программы н;г,слы>;л,т;:я в ¡¡огосибирскок институте органической химии СО АН

г

СССР, а Институте органической химии и«. Н. Д. Зелинского АН СССР, в Институте физиологически активных веществ АН СССР, в Тбилисском государственном университете им. И. Дхавахишвили, в Тбилисском институте органической- и физической химии.

Апробация работы и публикации. Основные положения диссертационной работы долохены на VII и VIII Всесосэкых конференциях "Использование вычислительных машин в химических исследованиях я спектроскопии молекул" (Рига, 1986 г., Новосибирск, 1989 г.), на межвузовской конференции "Молекулярные графы в химических исследованиях" (Калинин, 1990 г.) и опубликована в научных журналах.

Структура и обьек диссертации. Диссертационная работа излогена на 170 страницах машинописного текста и состоя? ira введения, 5 глав, выводов, списка литературы С170 наименования) к приложения. Глава 1 представляет собой обзор литература, в главах 2-5 обсуждаются полученные результаты; приложение содержит 7 таблиц (21 стр.}.

СОДЕРШИЕ РАБОТЫ

Первая глава диссертационной работы посвящена обзору литературы по применение топологических индексов в органической химии. Подробно описывалтся разновидности топологических индексов как количественных' характеристик молекулярных структур. На. пр'лгорг яонкрв-шых молекул продемонстрированы методы расчета таких иэвестньк ТИ как индекс Ралдича и индекс Винера. Дан обзор а классификация основная ТИ. Показано, что большинство современных ТИ основано на матрице расстояния и матрице смежности. Обсуждаются следуйте классы ТИ: (1) индексы, связанные с матрицей расстояния D, (2) индексы, основанные на инвариантной множестве степеней вершин; СЗ) индексы, эависяжие от спектральных характеристик графа; С4) информацией»!!*} топологические индексы и некоторые другие.

Рассматриваются основные области применения ТИ: С1) ТИ, как характеристики, позволяемо различать изомеры, (2) ислолг.оовшгав ТИ для оценки физико-хкьаческих свойств соединений, (3) ТИ н биологическая активность.

Во втореЯ главе предлагается новые топо.того-конфятурационные-индексы для плоских кслехуя.

В последнее вреиа делавте* ncnsroai разработка далекая», способных ив только характеризовать мсяеку.игршЛ трз4, даз и уча-шаать некоторые другие фигтера acero

3

пространственные а электронные). от которых могут существенно зависеть свойства органических соединения. Целью данного раздела является краткое обсуадекне впервые предлагаемых нами для соединений плоского строения гополого-конфигураздонных индексов. Значения этих индексов определится не только структурой, но и относительна расположением а тонов рассматриваемого соединения ко плоскости Ст.е. плоской ухладхоЯ молекулярного графа).

Один из наиболее простих и часто используемых топологических индексов - индекс Винера УС О - базируется на понятии дистанционной матрицы 0=СсЗ 5; значений индекса Викера

' Г Р

для графа С определяется выражением УС С) * \/2. £ £ б. .

Значения индекса Винера для изомерных гексатриенов с сопряженными связями приведены на рис. 1а,б. Хорооо известно, что с помоаыз индекса Винера во многих случаях удается различать неизоморфные графа, например, структурные изомеры органических соединений Сек. рис.1). Лля наших целей важна, однако, но способность индексов к идентификации молекулярных графза, а характеристика хонфигураакя плоских молекул на их основе.

к а)

V (О) » 35

3

б)

и

V CG) « 31

0 1 г 3 4 ■5

1 0 1 2 3 4

г 1 0 1 2 3

3 2 1 0 1 2

i 3 2 1 0 1

5 4 3 2 1 0

0 1 2 3 4 3

1 0 1 2 3 2

г 1 6 1 2 1

3 2 1 0 1 2

4 3 2 1 0 3

3 2 1 2 3 0

Ркс.1. Малехуляркые графи, матрицы расстояний и значения икдехса Винера для изомерных гексатриенов.

¡Ъ рис.1 нетрудно видеть, что индекс Винера никак не учггмьдст кк госнетрач<.>скув кзоыерив относительно двойной связи (ка-трамер. в 1.3,5-гс.<сятр2еко), ни, тем более, возможность сухсстлъляъя s-ustc- и s-траке-конфигураций относительно cp»>nva с5. л-'-с-г в сосряхьалю: системах. £м учета этих факторов cpwurskrwrcs кезояъяэ&ать тозсяого-кокфигурационные индексы.

S дадк^г главе рассмотрены тра тополого-коифагурадионных •гядокол. катер»» прадстдмжт собой аяалоги индекса Винера в том iu^zxo. что дхл кх юхекдеюи такжз необходимо вычислить

4

г

i

4

5

полусумму вполне определенных величин для всех пар

героин графа. Каждая та этих величин, называемая для краткости составляюаей индекса, характеризует форму кратчайшей простой цепи, соединявшей конкретную пару версии плоской укладки молекулярного графа. Для адекватного описания формы плоской укладки графа составляющие должны, по ианему мнении, удовлетворять следусады условиям: СП линейным конфигурациям цепи (т.е. графовым конфигурациям, вое версииы которых расположены на одной линии) должны соответствовать максимально возможные значения составлявши; (2) более вытянутым, удлиненный конфигурациям должны отвечать бслызие значения составлявших по сравнение с хомпактныии конфигурациями со сближенными концами цепи и СЗ) в случае сходных по форме цепных конфигураций значения составлявши тополого-конфигурациовных индексов должны возрастать с увеличением длины цепи.

Пусть V - это множество, состояаее из р>2 точек Сверяй» графа или атомов молекулы). заданных своими декартовыми координатами на плоскости; будем предполагать, что лсб«? две точки множества различается значениями хотя бы одной из координат. Рассмотри« произвольную упорядоченную тройку точек уг Л " и сопоставим с этой тройкой значение функции е1^ С введенной ранее С. С.Трачоы -и Н. С. Зефировым в работе, посрявонной теория гбетрахтяих 22- * 32-кск$згурациз). Будем полагать, что функция определясаая 20-конфигурашш,

принимает значения +1, если точка расположена справа от направленного отрезка С вектора) (рис.га). -1 - е-гла она

расположена слева относительно (рас. 26) а 0 - если все три точка расположены на одной прядай С рис. 2в).

V. , V.

» + 1 * - 1 « о

а) б) а)

Рис.2. Значения функцкж о'3' для упорядоченное троек точек_ на плоскости.

Пусть теперь задана цегиая го-конфхг/рацня ¿хиа: п, т.ч. плоская укладка цепного графа в, состоящего ка г р*Сер я п-1

Б

вераин, пронумерованных произвольными числами V , V.....V

1 2 пН

На рис. За-е в качестве примера изображены цепные ЕЛ-конфигурации, отьечаюиие всевозможным геометрическим изомерам 1.3,5-гексатриена. Очевидно, что со всякой цепью длины п>2 можно сопоставить п-2 упорядочению: троек V ,у( ;

V .V ,у ; .... V .V ,у , и при этой для каждой из троек г э « '«-1 » «•!

определено значение функции 1 J = 1,2.....п-1

')' ¡»г'

С так. цепным 20-конфигурациям на рис. За-е отвечают тройки

У , V , V ; V , V , У ; V , V , V И V .V .V. ;

'г 'а* '« Ч '< Ч

коды конфигураций - значения функции »13) для этих троек приведены г.сд рисунками). Нетрудно убедиться, что вне зависимости от способа нуиерации вераин, вспомогательная функция

| ~ абсолютная величина суммы

значения вдоль цепи - определяется исключительно формой рассматриваемой цепи; значение Г для 20-конфигурации на

I*

рис.З.а равно четырем, для 20-конфигурации на рис.36,в - двум и для ЕО-кйнфигурациа иа рис. Зг-е - нули. Новая функция С ,

»• пМ

очевидно, представляет собой инвариант цепной 20-конфигурациа;

ату функцию можно записать к в Солее сжатом виде: г^* | £|>ш|

к* 1

в пр-еллэлежении, что номера концевых вервия цепи суть к а 1 (и что сумк;!роьднае ведется вдоль цепи).

V .. V V

Ь7 V. ¡. » ^ ( ЬУ

Л

г >

c-i.fi.-:.♦!) {-I.-15

г) д) е)

сО-иснфнгураоии, отвечаете геометрическим

»5.3,5-гекезтрхека.

6

V V

V

1

Вместе с тем вкачение этой функции но удовлетворяет вишеприведеннш условиям, поэтому введен функции «k,, f>k, и г , заданные на множестве кратчайших цепеЯ плоскоЛ укладки графа и определяемые соотношениями.

О . . ! - J-biL , Cl)

1 4du

fik= 0 ; р.,- 1 * du •C2)

\t* < cd*,- г',)«^ • c33

kl k l

d "означает длину кратчайшей цепи между вершинами к и 1.

Именно эти величины ш я будем использовать в качестве составлявших при вычислении новых индексов oCG), p(G) и iCG) для плоских укладок произвольных графов G. Отметим здесь только, что для цепей длины 1 (т.е. ребер графа) значение а

следовательно и г не определено. Далее будем считать, что величина f для пари вершин, соединенных ребром, по определении равна нули; из соотношения (1-3) следует, что в этом случае \,=*„=1 11

В качестве илпострирушцего примера рассмотрим вычисление тополого-коифигурационншс индексов cKG), p(G) я t(G) зля плоской укладки графа G, изображающей скелет

3,4-дииетиленщ!клобутена Сен. рис.4а). Следует подчеркнуть, что между параки версии ■/, v s v,, v , а также между парада вершин v , v( и v , v^ существует по две кратчайших цепи (длимы 2 и 3, соответственно), однако поскольку значения функции t для них совпадают, их нет смысла рассматривать по отдельности. Например, для любой крагчаЯоеП цепи ыеаду вершшаыя Y,-v, значение функций fu = |-1 + 1| =0. Теперь, зная величин« г (k,l = 1-6), нетрудно, пользуясь соотношениями (1-3). ынислять составлясвде индексов, т.е. недиагоналыше элемента, матриц на рис. 4б-г. Обратим внимание, что матрицы на рис. М-r суть еккыотрнчшэ матрицы с нулеврыи диагональными элемегг.-амм. Дла вычисления топояого-ксн^игурациоюшх индексов о(G), ^CGî и î(G) остается определить лишь значения полусую* катрячтсс зяеиенюв--

KG)=4ibtl.

1.1k.1 l.tt-I 1.11.1

значения индексов прахедены поя матрицами на ряс.4б-г.

Подчеркнем здесь, что составлясзде топологс-коа^нтр---..Awiim индексов «t[, Pit, в rtl отвди не ав/мот«:-! яолшшя инвариантами цепных кссфпгургиай. В частности, соетквяягахе t :

[которые всегда пр'тлш)т ш?ясчислс-шш« зиъч'чт? .tv

?

а)

0

1 г/з

1

г/э

1 С 1

г/3 1

1/г гхэ

2/3 1

0

1

г/з 1

1

г/з 1

0

1 г/з

г/з 1/г 1 г/з г/э 1 1 г/%

оС 03=12.5 б)

0 с 2 4 2 2 0 1 /3 3 /3 уб

2 С 2 2 2 2 1 0 1/31/3

2 с 0 2 2 4 /3 10 1/33

4 с 2 0 2 2 3 /3101/3

2 а г 2 0 2 /3 1/3101

2 с 4 2 2 0 /3 /3 3/3 1 0

л =34 7(03=24.63

в)

Рис. 4.

г)

индексов

«СО,

Вычисление тополого-конфигурационных КО, и гСО.

соотношения С2)3, в наименьшей степени способны отличать друг от друга формы кратчайших цепей; этот факт легко заметить ухе на примере матрицы рис.4в Содно и то ке значение ек1=2 отвечает случаю «1к|=1, '„,=0, случаи ^к1=2, /'к1=1 и случаю <1^=3, г =2). Отметим еае одну характерную особенность: максимальная

«СО равна 1 и не зависит от длина цепи; росток теоретико-графового расстояния КО и тСО могут принимать сколь угодно

величина составлявшей В то же время с составляющие индексов большие значения.

Существенно, что индексы аСО), эСО и тСО способны различать плоские укладки неразветвленных цепей, при этом дискриминирующая способность индексов увеличивается в ряду К 63, «¡СО, тСО. Так, при исследовании плоских укладок 16 трех-пятивершинных цепных графов обнаружено 4 случая вырождения индекса ЭСО Си ни одного случая выроадения аСЮ и тСО); для 23 кестивершкнных цепных графов, обнаружено 3 случая вырождение д?кса оСО, но по прежнему ни одного случая вырождения 1С О.

Следует упомянуть, что кроме оСО, ЭСО и тСО ^намя подложены также "расширенные" индексы <»С03, «СО,' КО, рСО, тСОЗ, >СО, основная идея вычисления которых обстоит в том, что для каждой кратчайаей цепи, соединяющей атомы с номерами к и 1. величина кидакса « (.$ или т) для отдельно взятой цепи, используется в качестве составляюаей "расширенного индекса «к1 £?и, Как и в случае "обычных" цепных индексов для

вычислении индексов »СО, . гСО, иеобходимо найти сумму всех составяяовдх, для которых к < 1."Расширенные" индексы "с

8

Рис.5. Конфигурационные изомеры 2-винил-1,3-бутадиена.

Таблица 1.

Структурные и конфигурационные изомеры гексатриенов.

N Рис. *CG) PC G) rCG) ÎCG) к G) ÎCG) SCG)

1. За 10.3 30 26.328 55.267 140 105.585 22.392

2. 36 11.533 35 30.502 57.900 152 111.914 25.952

3. Зв 12. 433 40 32.493 60.700 164 117.424 29.289

4. Зг 12.267 40 32.146 59.533 160 115.549 28.18

5. Зд 13.267 44 33.674 62.533 172 120.133 31.153

6. Зе 12.767 42 32.91 • 60.533 164 117.077 29.22

7. 5а 11.733 34 23.773 46.067 112 76.303 —

8. 56 12.133 36 28.005 46.967 116 78.294 —

9. 5в 12.133 36 28.005 47.467: 118 79.058

«» Л "»>Т1 -и • « »» •t w М.Ы] MA О к. ¡.т;;аип" отличается различиями способаии

усреднения по числу цепей; эта различая существенны в лишь случае некоторых графов, содержащих циклы.

Бее предложенные индексы хорошо различают плоские укладки произвольных графов; особенно высокой дискримшфуедея способностью отличается "расширенные" индексы. Так, га Табл.1 видно что индексы о, р и у различает все геометрические изомеры 1,3,5-гексатриенов и 2-вшгал-1.3-бутаднена кроме близких по геометрии конфигурационных изоыеров 5Сб,в). В то же время "расширенные" индексы позволяет идентифицировать все структурные и геометрические нзсыеры гексатриенов.Сем. Табл. 1).

Очертим в заключение некоторые области применения новых индексов. Прежде всего, индексы aCG), f)CG5 и KG), как я ' другие возможные тополого-конфигурацнонныа индексы Сцепной ; природы или же основывающиеся на других свойствах абстрактных • конфигураций), целесообразно использовать для поиск; хорроляниМ структуры органических соединения с их иаблвдасша свойсгая«г. Найдено, что вса три индекса хорошо коррелирует- (R > О.Ш" с

9

суммами расстояний SCG) между всеми парами вервии плоских укладок цешуа графов, вычисленных в предположении, что ребра имеют единичную длину, а углы меаду соседними ребрами равны 180° или + 120°. Значения SCG) для геометрических .изомеров 1,3,5-гексатрленоа приведены в - последней колонке Табл. 1.

Г'рименителыю к индексам «(G), g(G) и j(G5 наиболее перспективными моделями представляются плоские полнены с сопряженными aras кумулированньаш двойными связами С простые примеры были рассмотрены выше) я особенно плоские полиароматические систеыы, изучение которых с "позиций теории графов привлекает в последнее время все большее внимание специалистов в области математической химии . Подчеркнем здесь, что при поиске корреляция тополого-конфигурационные индексы могут использоваться как применительно к скелетным графам С что было продемонстрировано выае), так и к полный структурный формулам органических соединения. В случае полибензолов -полихроматических систем. . состоящих исключительно из исстичленных колец - возможно также использование индексов применительно к введенным Л. Т. Балабаном характеристический графам.

В разделе 3.1 нами вводится топологический индекс, характеризующий органические ыолекулы, в которой используются два параметра - заряды ядер атомов и кратность химических связей. Методику построения матриц рассмотрим на примера ацетилена. Ниже слева приведена структурная формула ацетилена с нумерацией входящих в нее атомов. Справа приведен граф этой молекулы. D кружочках даны заряды ядер атомов, вдоль ребер -кратность связей: _

ф-(б)-(6)-(I)

И — С =Е С — Н

1 2 3 4 1 3 1

Составим матрацу смежности С1) для юлекулн ацетилена, учитывал атош водорода, кратность связей ыожду атомами и расстаьив по диагеиаяя заряда ядер атомов.

1 1 .0 О

16 3 0

0 3 6 1

0 0 11

15 31

(15 |3 5i С2)

Отмотки, что ьо многая граф-теоретических исследованиях ьодородкыо атокы не учиткааются. Предложенная матрица также иъх&т ййтъ зшекеяа матрицей С2) для молекулярного графа (КГ) с

10

удаленными атомами водорода, при этом из чисел, стоящих на диагонали, вычитается число атомов водорода, связанных с соответствующим атомом. Подчеркнем, что детерминанты матриц (13 и (2) совладают: BeUl) = DetC2) = 16

Заметим, что значение детерминанта таких матриц не зависит от порядка нумерации атомов в молекулах, то есть он является инвариантом взвешенного молекулярного графа. Мы предлагаем испол! овать логарифм такого детерминанта в качестве нового топологического индекса, который будем обозначать как DE.

Для численной оценки значения детерминантов матриц для нормальных аяканов при любом значении п может использоваться следующая рекурентная формула:

det = - (2-уЗ)"

по.

Для любого изомера с данным п след Силур? матрицы постоянен и равняется Sp(K)=8n+2.

Обозначим предложенную матрицу типа С2) как А, а обратную ей матрицу как В. В настоящей работе наш! использовались .■угедувзше индексы, основанные на введенных матрицах:

1. DE - логарифм детерминанта матрицы А.

2. DEaN - индекс DE, деленный на число неводородных атомов.

3. ?rain - минимальный диагональный элемент матрицы В.

• 4. Pj. х - максимальный диагональный элемент матрицы В.

5. р - среднее арифметическое диагональных элементов

матрицы В.

6. Spur - след матрицы В.

7. - минимальный кедиагопальаый элемент матрицы В.

В. В_,„ - максимальный недиагональньй элемент матрицы В.

JTkâX

9. Bmicl - среднее арифметическое недиагокальных элементов матрицы д.

10, Bsun - сумма иедкагсналышх элементов матрицы В.

Во втором разделе третьей главы индекс DE анализируется как критерий разветвленности молекулярных градов. Известно, что ряд свойств изомерных молекул сильно зависит от степени их разветвленности. При оценке разветвленности комплексно учитываются различные факторы: длина основной цепи ьершш, обаео число ветвей, »гасло ветвей, исходящих из данной вершины, позиции ветвей относительно начала цепи и т.д.

Основное требование, которому должен отвечать топологический индекс, харайгеризуюгщй молекулярную

11

раэветвленность - это соответствовать ей лучше интуитивных представлений о ней. Большая раэветвленность при постоянной числе атомов в молекуле означает большую компактность,

• увеличение связности и укорачивание расстояний в молекулярном графе.

Введенный нами топологический индекс DE удовлетворяет всем критериям разветвленное™, предложенным Бончевым, и может служить мерой молекулярной разветвлеиности: чем ниже значение этого индекса, тем вьше раэветвленность. Индекс DE дает возможность отличить, например, валентные изомеры бензола.

Раздел 3.3 третьей главы диссертации посвящен исследованию корреляционных ' зависимостей физико-химических свойств органических соединений от предложенных топологических индексов к продемонстрирована применимость таких индексов для исследований в области OSAR и QSPR.

Расчетная часть была выполнена с помощью комплекса ЭММА (Эффективное Моделирование Молекулярной Активности) программной систем!;, предназначенной для выявления зависимости

• свойств веществ от дескрипторного описания молекул, причем к системе были подключены програмиые блоки для расчета предложенных индексов. Б комплексе ЭММА молекулярные графы описываются топологические индексами, элементами структуры, расчетными физико-химическими параметрами, построение модельных уравнений производится методом пошаговой линейной регрессии и на основании регрессионной модели можно получить прогноз свойств требуемых соединений.

На основании литературного поиска были созданы базы данных "структура-свойство" по следующим классам органических соединений : алканы от СгН5 до С9Нго (включая все изомеры), все изомеры декана, спирты, замещенные адамантаны, амины, альдегиды, кегоны, смешанные базы данных.

Корреляционные уравнения были найдены для таких свойств как молярный объем, теплота испарения, критическая температура, критическое давление, гидрофобность, температура плавлений, энтропия образования, растворимость в воде, индекс удерживания, показатель преломления, температура кипения, плотность, поляризуемость я др. Качество регрессионной функции характеризовалось следующий параметрами: коэффициентом корреляции R, стандартным отклонением S, критерием Фишера F, ' , числом структур К.

Для базы данных, содержащей 74 алкана, и состоящей из всех изомеров алканов, от этана до нонана включительно, получены следующие корреляционные уравнения:

-для молярного объема CMV) при 20°С: MV (см'/мол ) = 13.637 DE - 21.602 Pmin - 6,435С'О -- 2.632(\) + 44.908 R = 0.999 , S = 0.352 , F = 19200, К = 69 -д.,.1 теплоты испарения СНу) при 25°С: Ну Скдж/мол) = 2.0 DE + 193.0 DE/n - 220

R = 0.990, S =0.761, Г = 1660 N = 69 -для критической температуры СГсЗ: Тс С°С) = -143.767 DE -2326.29 Pmld + 669.109 Spur -- 279.760 Bsum+ 626.653

R = 0.99S, S = 5.61, F = 1880, N = 74 -для критического давления СР0): Рс СатхО = 5343.17 Pmx - 10.433 DE * 37.522 Spur -- 1655.93 Bmln - 1757.22 R = 0.968, S = 1.11, F = 261, H = 74 -энтропии образования CS^} при 25°С: SLo ' 87-812 + 33.411 DE - 13.819 DE/n -117.7 Spur

R = 0.995,. S = 1.43, F = 2240, N = 74 Удовлетворительное корреляционное уравнение найдено и для бази данных, содержащей энтропии образование (S° ) при 25°С, для всех 75 изомеров декана:

s:9B = -0.075 DE + 0.623 Ршх - 4.67 PRÍd > 4.03 Spur +

* 3nún - 8-41 Bmld + 8-07 Bsuffl + °-51

R= 0.972, S s 1.01, F = 164, N = 75

Хорошие корреляционные уравнения- получены также и для

растворимости спиртов в воде C--lg X, X - растворимость в мольных

долях в литре) и для гидрофобности Cl g Р) кис пород содержадах

соединений (база данных включала 38 предельно спиртов, 6

непредельных спиртов, 5 карбоновых кислот, 15 кетонов):

-lg X = 0.555 DE +■ 29.146 DE/n - 42. 289

. R = 0.988, S = O.15, F = 945, N = 30

log P = 0.303 DE - .319 DE/n -128 Pmtd + 78.3

R = 0.992, S = 0,104, F = 1290, H = 64

На базе данных, содержащей 60 замененных адакактанов,

получено хорошее корреляционное уравнение для

хроматографиvecxorо индекса удерживания:

13

I = 5573.41 0ЕЛ1 - 347.815 DE + 1469.74 Pni - S34.034 P^ + 1276.36 x - 1215.58 In 3xyf + 656.663 In Ypc - 6593.4 R = 0.982. S = 43.3," F = 205, N = 60 Интересно отметать что достаточно хорошее уравнение удалось получить для базы данных по поляризуемости о, которая вклвчала 278 органических соединений, принадлежащих к различным классам и содержавши разные гетероатокы:

а Сек3) = 12.951 DE/n + 44.467 Pmid + 5.723 Spur -- 6.651 Bsum - 31.803 R = 0.987, S = 1.3. F = 2610, N = 278 Кроме перечислены* уравнений в разделе 3.3 обсуздастся и другие найденные kamt корреляционные уравнения - для температуры плавления, температуры кипения и показателя преломления кетоков (база данных включает 79 соединений), показателя преломления, плотности к температуры кипения альдегиде! £113 альдегидов), температуры плавлепия, показателя преломления, плотности и температурь! кипения аминов (база со.трршт 126 аминов). Кроме предложенных наш индексов в уравнения вошли такге и другие топологические индексы (модифицированный индекс Випера, информационные индексы, индекс Балабана J и др.). Наилучшие корреляционные уравнения получаны для температура кипения для каждого из перечисленных классов (R г 0.99 во всех случях), г. у us других свойств коррелирует с индексами температура плавления, однако и для нее удалось получить удовлетворительные уравнения СЕ = 0.94 -0.96).

На нескольких базах дгших (алкаш, деканы, аышш к смешенная база данных) била проверена скоррелированность предложенных индексов с широким спектром известных индексов, таких как индексы связности, индекс Бикера W, индекс Хосойя, ккформациошше индексы и др. Показано, что они слабо коррелирует друг с другой i! с другими льАскегм.н (ь бсльшенства случаев 0.3 < R < 0.5). Отметим, что индекс BE коррелирует с индексом CR * 0.978) лишь для соединений, не содерхавдх гетероатоков. Таким образом, предлагааыые индексы могут быть полезны при проведении исследований в области поиска количественных соотношение цехду структурой и свойствам!: органических соединений.

Б первом разделе главы 4 исследуется свяуь нехд;- строение*, в температурой плавления соединений ^¿.-¡«ис^уноъогс t ищаидконового ряда на основе вводимых ь jkibkci. главе взвешенных

14

топологических индексов.

Как известно, при прогнозировании температур плавления <ТЛЛ.) органических соединения обычно возникают значительные трудности, обусловленные как характером экспериментальных данных в обучахдей выборке (отсутствие« в ряде случаев четко вырахенноя точки плавления, значительным влияние« на Тпл небольших примесей и т.д.), так и зависимостью Тгл от строения крис; лической решетки, размеров и степени разветвленности молекул, мекмолекуляркых взаимодействий. В то se время температура плавления является важной характеристикой органического вещества, кмеваей практическое значение. Поэтому, прогнозирование температур плавления даже з достаточно узких рядах представляет значительный интерес.

В рассматриваемом нами подходе молекула представляется в виде взвешенного молекулярного графа, веса вершин которого равны подобранным каким-либо способом числовым параметрам соответствуют« атомов, предварительно классифицированных. При классификации атомов учитывается как тип атома, так и картина их связевого окружения. Вообие говоря, схема классификации атомов может меняться в зависимости от конкретной задачи. Далее, в предлагаемом нами подходе постулируется, что Тпя может быть выражена через взвешенный аналог индекса Ранлича:

У = С Z XX + К ) (4)

11, j)

где - параметры i - го и j - го атом.«, К - константа,

обаая для всего изучаемого класса соединений, суммирование проводится по всем связям (i,j),Параметры для каждого типа атомов и константа К подбираются по обучающей выборке с помсаьв оптимизационных процедур миникизаичей целевой функции. Найденное таким образом уравнение позволяет оценивать температуру плавления для других соединения того же ряда, не входивших в исходную выборку, на основе лиаь их структурная формулы. Подчеркнем, что такой подход может кспо.тъзовагься лжь для достаточно узких рядов, включавших молекулы с больиим обэдм фрагментом и низкой симметрией.

В результате проведенного исследования были подобраны значения атомных параметров и константа К по выборкам для замещенных селенофенсв С32 соединения) и икдакдионсь С65 соединений), независимо для каждого ряда. При этом средночг отклонение вычисленной Т пл. от экспериментальной составило для 1-го ряда 12.0°, а для 2-го - 12.7°.

15

Полученные нами уравнения типа (4) использовались для оценки Тпл соединений вышеуказанных рядов по их структурным формулам. Для иести структур Тпл были рассчитаны теоретически и показано, что результаты удовлетворительно согласуются с последующ!»! экспериментальными измерениями.

Второй раздел четвертой главы диссертационной работы посвящен прогнозирование температур плавления дкзамеценных бензолов на основе использования взведенного топологического индекса, учитывающего расположение заместителей. Для индекса с помощью оптимизационных процедур подобраны параметры ряда заместителей СГ. С1. Вг, I. СН5, И0г, ОН, ОСН,) И параметры, отражающие их взаимное расположение. .Точность прогнозирования температур плавления составляет в среднем 9°С для исследованных дизаыеаенных бензолов и зависит от природы заместителей. Температуры плавления прогнозируются по следующей формуле:

гпл. = К. Ь,*..,+ к. Ь,*,.г + * К

х = х , при 1 >6. х - "веса" заместителей, К , К , и К -

1 1-6 ' - о т р

коэффициенты для орто-, кета- и пара-дизамещенных бензолов, К -константа; параметры подбираются с поыоцью ЭЕМ при использовании методов оптимизация. В результате расчетов подобраны конкретные числовые значения "весов" заместителей и конотант К ,К . К и К.

6 а Р

В пятой главе рассматриваются подходы к проблеме генерации ациклических структур органических соединений с заданным;! свойствами Собратная задача). Весьма привлекательной является исчерпываг.аая генерация структур органических соединений определенного ряда, величина свойства для которых лежит в заданном интервале. Хотя такая задача в наиболее общем виде в настоящее время практически неразрешима, для отдельных свойств и классов соединений несшиеся корреляционные соотношения позволяют находить струк- турные парамьтри по величине свойства и задача в этом случае может сводится к генерации структур по структурным параметрам.

В данной главе рассматривается такого рода обратная задача для случая, когда исследуемое свойство коррелирует с ТИ Рандича х . Обсуждается разработанная нами методология перечисления молекулярных графов, имеющих заданные интервалы значения индекса х. Яля простоты предполагаем, что КГ. соответствующий химической структуре, имеет немеченкые верщины и однократные ребра, причем степени всех его п вершин ке более четырех.

Решение обратной задачи разбивается на следувэде основные этапы: (1) определение количества ребер СсЕязеЯ) различных типов которые могут присутствовать в МГ при заданном значении индекса х. (2) отбраковка распределений типов ребер, заведомо не соответствующих МГ, СЗ) нахождение распределений степеней зерин и генерация МГ.

Восстановление структур по значении х. основано на том, что разные типы ребер вносят разный вклад в величину индекса Ралдича. Поэтому, подбирая с помоаьв переборных процедур сумму таких вкладов, попадасяус в требуемый интервал значения х. мохяо найти типы ребр, входяме в МГ с таким значением индекса. При этом следует отсеивать сочетания ребер, из которых нельзя построить МГ. Далее для ациклических МГ по наборам ребер nkJ определяется наборы степеней вершин' dk:

BiK.Ln»+ 2n"} с n"= n,t при k > 15

Отметим, что при вычислении числа вершин различных типов по приведенной формуле отсеивается большое число вариантов распределений ребер, не соответствувадх ациклическим МГ (число ■ d должно быть целым, в противном случае распределение ребер не расматривается). Используются и другие критерии для отбраковки " не реализуемых вариантов. Для генерации МГ по найденным степеням вершин может использоваться один из судеству.тах генератсрсз с последупцим исключением неподходящ« вариантов

Приведем пример решения обратной задачи: г:ля базы данных 74 ациклических алканов имеется хорошая корреляционная зависимость TK¡,n = 61.92 х - 113.12 CR = 0.985). Для интервала свсйстЕа

40° i ТК,5П s. 70°, из уравнения получаем интервал 2.5 í i ¡ 3, в этом интервале значений индекса Рандича генерируется 7107 различных распределений пшеь ребер, из которых лпуь б соответствуют ациклическим алканам (2.2-диметилбутану, 2,3-динетилбутану, 2-метилпентану, 3-метилпе-нтану, н-гексану, 2,2.3-трнметилбутану); остальные распределения тилов ребер по различным критериям отбрасываются.

Выводы

1. Для характеристики плоских укладок графов, слнсыьапдх строение и геометрическую конфигурацию органических соединений, предложен новый класс инвариантов - тслолого-кенфигурацноккие индексы «CG), Jr'.G) и i(G), а также отэечаюгие км расширенные индексы 3CG), Sg). &G), f(G) и r<G), ^G) - которые

17

обладают лучщей идентификацируюдей способностью для полиенов и сопряженных соединений.

2. Введена группа топологических индексов, основанных на детерминанте модифицированной матрицы смежности, а также на обратной ей матрице. Показано, что индекс, основанный на детерминанте модифицированной матрицы смежности, может служить критерием разветвленное™ молехулярных графов. Найдено, что на основе предложенных индексов могут быть построены корреляционные уравнения, связывающие структуру и физико-химические свойства отдельных рядов органических соединений.

3. Разработаны и подключены к прогнозирующим комплексам компьютерные йрограмкы для вычисления предложенных топологических индексов. Найдено более 20 корреляционных уравнений, связывасщих физико-химические свойства: температуру кипения, температуру плавления, теплоту испарения, молярный объем, гидрофобность, растворимость в воде, показатель преломления, плотность, энтропию образования, индексы удерживания, критическое давление, поляризуемость с предложенными топологическими индексами для отдельных рядов органических соединений.

4. На основе взвешенных аналогов индехса Рандича предложены уравнения, позволявшие прогнозировать температуру плавления по структурной формуле для'соединений ряда сеяенофена, индандиока к дизадещенных бензолов.

5. Разработана методология реконструкции ациклических молекулярных графов для заданного интервала значений индекса Рандича, которая может служить основой для генерации структур с заданным свойством в тех случаях, когда свойство коррелирует с индексом Рандича.

Основные результаты диссертационной работы изложены в следующих публикациях:

1. ТрачС. С., Девдариани Р. О., Зефиров Н. С. Конбжаторные модели и алгоритмы в химии. Тополого-конфигурационные аналоги индекса Винера./V ЮрХ. - 1990.- т. 25, вып.5.- стр. 921-932.

2. Трач С.С. , Девдариани P.O., Зефиров Н.С. Простой алгоритм вычисления цепных инвариантов цопокулдркых ¿^-конфигураций. //Тезисы докладов межвузовской конференции "Молекулярные графы в химических исследованиях". -1990.-Калинин.-С. 100-101.

3. Гвердаэте.та М. Я., Левдариани P.O., Девдзрканн О.Г. Применение ЗБМ для алгебраичесхой характеристики изомеров в гомологическом

18

ряду алкаяов . // Тезисы докладов VII Всесссз. конференции

"Использование вычислительных машин в химических исследованиях и спектроскопии молекул". - 1986.- Рига. - С. 212-214.

4. Гвердцители М. И., Девдариани Р. 0., Блиадзе И. Д. Алгебраическая характеристика изомеров и реакции изомеризации в гомологическом ряду алканолов.//Сообаения Академии Наук Грузинской CCP.-1S85. -Т. 121.N 2.-С. 324-328.

5. Кьэрдцители М.И. , Девдариани P.O. Алгебраическая характеристика валентных изомеров и процессов валентной изомеризации бензола.//Известия АН ГССР, химия и химическая технология. -1988. -С. 308-309.

6. Баскин И.И. . Станкаач Ы. И., Девдариани P.O. , Зефиров Н.С. • Комплекс программ для нахождения корреляций "структура-свойство" на основе топологических индексов. //ЖХ -1989. -Т. 30, N 6. С. 145-147.

7. Станкевич М. И., Девдариани P.O., Палшда В. А., Зефиров Н.С. Оценка с помоаьп ЭВМ температур плавления для некоторых классов органических соединений. //Тезисы докладов всесоюзной школы-семинара по автоматизации химических исследований.-Тбилиси. - Мешнереба, 1S88. - С. 39.

8- Девдариани P.O., Палолин В. А., Баскин И. И. , Скворцова М. И., Зефиров Н. С. Прогнозирование температур плав1ения ароматических соединения некоторых классов на основе использования взвешенных топологических индексов. // Тезисы докладов VIII Зсесосзной конференции "Использование вычислительных машин в химических исследованиях и спектроскопии молекул". - 1S89. - Новосибирск, - С. 251.

9. Скворцова И. И. , Баскин И. И., Девдариани P.O. , Лалшин В. А. , Зефиров Н. С. О проблеме генерации структур органических соединений с заданными свойствами.// Тезисы докладов VIII Всееото конференции "Исголъзозание вычислительных макчн в химических исследованиях и спектроскопии молекул".- 1S39 . -Новосибирск. - С. 250.

10. Баскин И. И, , Гордеева Б. В., Девдариани P.O., Зефиров Н. С. , Палюлин В.А., Станкевич М.И. Методология решения обратной задачи в проблеме связи "стр>.стура-своЯство" для случая топологических индексов. // ДАН СССР. - 1989, - Т.У07, вып.З.-С. 613-617.