База моделей экспертной системы прогноза взаимодействия неорганических соединений тема автореферата и диссертации по химии, 02.00.01 ВАК РФ

Манзанов, Юрий Евгеньевич АВТОР
кандидата химических наук УЧЕНАЯ СТЕПЕНЬ
Иркутск МЕСТО ЗАЩИТЫ
1992 ГОД ЗАЩИТЫ
   
02.00.01 КОД ВАК РФ
Автореферат по химии на тему «База моделей экспертной системы прогноза взаимодействия неорганических соединений»
 
Автореферат диссертации на тему "База моделей экспертной системы прогноза взаимодействия неорганических соединений"

иркутский государственный университет

РГ8 00 - 1 ПАП 1393

На правах рукописи

МАНЗАНОВ Юрий Евгеньевич

БАЗА МОДЕЛЕЙ ЭКСПЕРТНОЙ СИСТЕМЫ ПРОГНОЗА ВЗАИМОДЕЙСТВИЯ НЕОРГАНИЧЕСКИХ СОЕДИНЕНИЙ

Специальность 02.00.01 — неорганическая химия

Авторе фе р а т диссертации на соискание ученой степени кандидата химических наук

Иркутск 1992

Работа выполнена в Бурятском институте естественных наук СО РАН

Научные руководители: член-корреспондент АН СССР Мохосоев Маркс Васильевич!

доктор технических наук Никифоров Кузьма Александрович Официальные оппоненты: доктор химических наук, профессор Евдокимов Анатолий Аркадьевич

кандидат химических наук, доцент Карнаухова Вера Константиновна

Ведущая организация: Институт геохимии им. А. П. Виноградова, г. Иркутск

Защита состоится «_»_1992 г. в ч.

на заседании специализированного совета К 063.32.02 при Иркутском государственном университете по адресу: 664003, Иркутск, ул. Карла Маркса, 1, Университет, химический факультет.

С диссертацией можно ознакомиться в научной библиотеке университета.

Автореферат разослан «_»_1992 г.

Ученый секретарь специализированного совет кандидат химических нау;

/ * Голентовская И. П.

О

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность теш. Разработка и создание экспертных систем в различных областях знания - одна из наиболее важных особенностей настоящего времени, открывающая новые перспективы научного прогресса. Пример успешного применения искусственного интеллекта в химии - многочисленные экспертные системы, используемые для прогноза образования, структур органических соединений. Однако, когда речь идет о неорганической химии, следует констатировать, что экспертные системы для прогноза образования, структур и свойств соединений отсутствуют. Это тем более удивительно, что после работы Музера и Пирсона, их последователи не ограничились • эмпирическим прогнозом в подобранном двух- или трехмерном пространстве свойств, но и опробовали ряд других подходов.

Все метода прогнозирования химического взаимодействия имеет ограничения, связанные с применяемым математическим аппаратом, с функциональными особенностями используемых ЭВМ. Кроме того, поскольку все или почти все исследователи изучали различные системы, классы химических объектов, накопленный опыт применения той или иной методики носит выборочный характер, не систематизирован, не обобщен. Выработка в рамках одной базы моделей тактики и стратегии использования различных методик, позволила он существенно продвинуться на пути создания экспертной системы прогноза лирического взаимодействия неорганичес::их соединений и открыла бы новые- возмоаности для направленного химического синтеза з неорганической химии.

Диссертационная работа выполнялась в соответствии с Координационным планом Отделения физико-химии и технологии неорганических материалов АН СССР по проблеме "Физико-химические основы полупроводникового материаловедения" (2.21.1) и являлась частью систематических исследований, проводимых в Институте естественных наук БНЦ СО РАН по теме "Исследование закономерностей синтеза новых.

неорганаческих материалов на основе соединений молибдена, вольфрама одно-« двух- и трехвалентных элеменгов", а также раздала 2.1.6 программы фундаментальных исследований Сибирского отделения АН СССР 03.03 "Химическая ккфсрматика".

Цель работы заключалась в исследов^каи при помощи различных методов классификационного прогнозирования особенностей химического взаимодействия в различных системах и классах неорганические соединений. Проводился прогноз образований новых соединений в молибдатЕых и оксидных двойных и тройных системах. Для проведения, подобного рода исследований необходимо создание базы моделей прогнозирования, 'включающей различные методики проведения прогноза. Это потребовало разработки сервисного обеспечения и системной поддеркки математических и программных моделей прогноза хнмичес-, .кого взаимодействия. Уточнение наиболее информативных признаков, позволяющих глубже понять особенности взаимодействия исходных компонентов , соединений, повлекло создание базы физико-химических свойств, часто-используемых при прогнозе.

Создание.указанного выше комплекса было осуществлено на'ЗЕМ . ЕС-1033 и персональных компьютерах, совместимых: с IBM PC.

Научная новизна. Разработан и машинно реализован алгоритм дискретизации численныг признаков по обучающей выборке с учетом критерия максимума информативности, что позволяет использовать численные признаки объектов (т.е. физико-химические свойства элементов и соединений) в символическом представлении в планируемой базе знаний для построения эвристик.

Предложена, применена'и отработана на модельных системах соединений, ранее нз применявшаяся в неорганической химии, методика классификационного прогнозирования с помощью факторного анализа. В силу достоинств, которые предложенная методика прогнозирования имеет но сравнению с другими подходами, получеьы наборы ияферма-

шформетивлах свойств, определяющих особенности взаимодействия в различит: классах ч системах неорганических соединений.

Дпя построения разделяющих поверхностей при эмпирическом прогнозе в пространстве подобранных свойств и в пространстве получаемых факторов предлагается применение метода потенциальных функций.

Практическая ценность partoгы. Создана 6sse моделей прогноза химического взаимодействия неорганических соединений, включающая систему формирования понятий "Анализатор"; факторную и кластерную методику прогнозирования; метод потенциальных функций (собственно для прогноза и для построения разделяющих поверхностей); графическое представление эмпирического прогноза в двухмерном пространстве выбранных свойств. Все математические модели объединены управляющим программным б чоко!.' и связаны через него с созданной базой данных физико-химических свойств элементов и соединений.

База i,гаде лег прогнозирования гтозЕоляет расширить возможности направленного химического синтеза, предсказывать образование новых соединений, их структуру и физико-химические свойстве. .

Проведено прогнозирование е- экспериментально, подтверждено синтезом образование рада соединений в .тройной системе одно-, двух-, и трехвалентных молибдатов.

Разработанный' паке? программ для сервисного обслуживания системы формирования понятий "Анализатор" (дискретизация численных признаков, создание описание двойных систем и вывода результатов; внедрен б Институте металлургии дН СССР.

На защиту выносятся: - применение методики классификационного прогноза с использованием факторного анализа.

построение разделяющих поверхлостей ¿три классификационном прогнозе методом потенциальных функций.

-4- • _ . .

- разработка н реализация алгоритма дискрэтизации численных признаков по критерию максимума информативности для представления физико-химических свойств элементов и соединений в символьном виде .позволяющем строить эвристики в базе знаний. •

- создание базы моделей, интерфейса знаний для экспертной системы прогноза химического взаимодействия неорганических соединений.

Апробация работы. Материалы диссертации доложены и обсуждены на V и VI Всесоюзных школах-семинарах "Применение математических методов для описания и изучения физико-химических равновесий" (1985,1989, г. Новосибирск); У Всесоюзной школе "Физико-химические основы ьлэктронного материаловедения" (1988, г. Иркутск); VI Всесоюзном совещании по химии и технологии молибдена и вольфрама (7988, г. Нальчик); VII Всесоюзном совещании по физико-химическому анализу (1в88 г. Фрунзе); IV Всесоюзной конференции ;,Математичес-кие методы распознавания образов" (1589, г. Рига); на ежегодных научных сесиях БНЦ СО АН СССР (1985-1989, г. Улан-Удэ).

Публикации. Основное содержание диссертации опубликовано -в Ю статьях, в 11 тезисах докладов.

Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения» списка^цитируемой литературы (135 наименований) и приложения, содержит "19 рисунков, 15 таблиц. Основной текст составляет 142 страницы.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность теш, сформулирована цель работы, показана научная яоеизнэ и практическая значимость полученных результатов. . -

В 1лаве 1 рассматриваются известные в литературе метода про-

-О- «

гкозирования взаимодействия неорганических соединений. Для решения проблемы классификации t ъ на основе ее - предсказания взаимодействия (тип взаимодействия: эвтектика, твердые растворы, образование соединений; струмуркче типы; физико-химические свойства) были выработаны эмпирические правила, например: правило соотношения радиусов (предсказание и объяснение структурных типов); пра- ' вило Юм-Розери (об образовании твердых растворов); эллипса Дарке-на-Гурри - оценка растворимости в координатах: атомный радиус -электроотрицательность.

Существенным ша*"ом в предсказании структурных типов явилась работа, опубликованная Музером и Пирсоном. Ими первыми были построены структурные поля для соединений типа АВ элементов основных подгрупп. В координатах: средние значения главных квантовых чисел элементов- разность электротрицательностей; соединения разделяются на группы, соответствуйте структурам цинковой обманки ZnS (В), вюртцита ZnS (W), NbCI и CcCl (рис. 1).

Основной методологической ценностью работ Музера и Пирсона, может быть не сразу понятой другими исследователями, было следующее: они показали, что прч правильном выборе признаков, химические объекты одного клзсоа (тип взаимодействия, структура, физико-химические свойства) составляют компаютое множество. Это означает, что существует очевидная возможность применить для целей классификационного прогноза в химик метода распознавания образов.

В дальнейшем и сам Пирсон, и другие исследователи прододвили и развили методику эмпирического прогноза, что позволило достигнуть значительных результатов.

Некоторая ограниченность эмпирического прогноза (в частности, использование двух- , в лучшем случае трехмерного пространства признаков) и развитие вычислительной техники привело -я широкому использованию ЭВМ б прогнозе химического взаимодействуя- ; -

I О Д5 ЦВ 1.5 20 2Д 5.0 1>злнос1ь.эйектроотрицатвпы«остей дх

Ркс;1. Структурное поле,соединений, типа' АВ.-. • " -

В первую очередь следует отметить успешное применение для прогнозирования в химии разработанной в Институте кибернетики АН УССР машинной системы Армирования понятий "Анализатор". Согласно разработанной методике прогноза в многомерных пространствах признаков проводился прогноз образования соединений, структурннх типов для сложных оксидных соединений (АВ03,!АВО^, АВ204); сседине-нений состава А2В207 со структурой пирохлоре; соединений состава АВ?Тед ; состава А302 ; халькогвшдных шинелей состава АВ2Х^. Достоверность результатов прогноза была на уровне 90 %.

Паралельно с указанным выше подходом к прогнозу химического *

' " »

взаимодействия развивались и другие. Одним из широко применяемых в химии методов является, мокет быть в силу достаточной простоты и наглядности, метод потенциальных функция. Так, метод потенциальных ■ функций применялся для прогнозирования каталитической активности; для распознавания типа взаимодействия компонентов в жидком и в твердом состоянии; для прогноза образования соединений состава АВ£04, АВ2Б4, ЛВ2Бе4 со структурой шпинелд.

Из теории распознавания образов для прогноза взаимодействия применялся также метод дискриминантных функций - •

Таким образом, применение ЭВМ для прогноза химического взаимодействия в многомерных пространствах признаков продемонстрировало широкие возможности зтогр подхода. Однако, внимательное изучение результатов этих работ свидетельствует, что каздый из применяемых методов имеет недостатки, связанные либо с недостаточной глубиной проникновения в сущность химизма происходящих процессов, либо с математическими ограничениями самих методов, либо с техническими возможностями ЭВМ. Одним из оптимальных путей преодоления недостатков, присущих кавдому йз методов, и способного помочь реализации всего объема знагай, накопленных разными грушами исследователей, явилось бы

создание экспертных систем прогноза взаимодействия.

В силу одной из особенностей химии как научной дисциплины -отсутствия точной и простой математической формы многих ее законов - не обходам поиск новых путей для представления химических знаний. Разработанный- для создания экспертных систем подход может помочь в решении этой задачи. -

/ В еторой главе рассматриваются основные математические методы, применяемые при создании базы моделей прогноза взаимодействия -~7 неорганических соедапений, а также способ дискретизации численных .,

цризнакэв по обучаодей выборке с использованием критерия максимума информативности. ; .

В задачах обучения распознаванию образов принято два способа представления информации - непрерывный и дискретный. При дискретном способе каждая координата вектора X (X принадлежит пространству признаков) может принимать лишь фиксированное число значений. ■ При непрерывном способе представления координаты вектора X могут принимать любые значения числовой сси.

При, дискретном кодировании диапазон значений параметра, имокь щего непрерывные значения, разбивается на род градаций.

Задача заключается в следующем: необходимо так разбить значения параметра, чтобы оценка неопределенности (знтрогаи) при классификации с помощью этого признаке была минимальной (оценка энтропии производится с использованием ооучапцей выборки).

Пусть признак X может принимать значения из интервала (а,Ь], а вектор, обладающий этим признаком принадлежит к одному из к

классов. Будем считать,что существуют условные веооятностг принад-

ч

лезкнссти к каждому из классов:Р(1/2),.... ,Р(к/х). Для каждого фгк-сированного значения признака х=х мокет быть определена мера неопределенности (энтропия) принадлежности к тому или иному классу. Н(х)г~У Р(1/х) Зь1?Ц/%))

Среднее по мере Р(Х) значение энтропии вычисляется: к

н*Гн(х)Р(х)аг= I ра/х)/п1Ра/х)?(х)ах1 <п

Пусть теперь параметр X разбит па т градаций, тогда средняя энтропия может оыть записана в виде: ' кг ■ -

нсо= 1 ¿'мра/х^р^.)! (2)

Воспользуемся формулой Байесса

... -9-t

P(Xj/i)P(i)

p(i/z )= ——:- • (3)

PU,)

Подставляя (3) в (2), получим:

H(t)=- J I Pi^/UPdJ Sr. _i_ (4). :

i 3 P(Xj)

Теперь можно воспользоваться байессовскимми оценками Pix^./i),

P(i), P(Xj), найденными-пз обучающей последовательности .

n m,(i)+1 l(i)+1 » пь(1)+1 l(i)+1 I+т ' --Sh Л- --ш

l(i)+x 1+k • ^ , jr

где l(i)- число элементов i -го класса в обучапцей выборке, m.j(i)- число векторов i-ro класса, попадающих.в j-ю градации, 1 - объем обучающей выборки. : .

В случав, когда число классов равно двум,'т.е.^класс положительный (например, класс образования соединений) и класс отрицательный (класс необразования соединений):

х _р. 1 , пй+1 N+f N^H^+t

_ mj+i Ьр-и ~ ft, 3 P p с .

H(1)= J -3----- —— -e- —---.: +r •

Л Д >i—• V. * . л aSrt H>1 " Ы+Н-й

\

jBj+1 wo+i■ l v- ; vv^ *-v.'4

-3—-- pt>-—t>-e- —-^ (2.1.5)

Vе vv2; -:.1

'"* / - ¿Д ; V/ г., • . . -

где Мр,Н0 - число объектов в положительном и -отрицательном классах,^ число векторов положительного и отрицательного пассов. попадающих в ¿-в градацию. ~ - ^ ; - - .

Задача состоит е следующем: надо так разбить йнтервал определения параметра на т. градаций (и определить число этих градаций), ..чтобы энтропия стала минимальной (а информативность максимальной).* Этот алгоритм, реализованный б программном виде,- зошзл в па- •

-г : -10- ' ..... ."'" ..

кет сервисных программ к системе формирования понятий "Анализатор", внедренный в Институте металлургии АН СССР.

Большое количество, разнотипность, структура признаков, с которыми работают исследователи при прогнозе создают значительные методические сложности. Кроме того, надо учесть, что вряд ли решающими, определяющими особенности химического взаимодействия являются один, два или три признака. Скорее всего, признаки сложным образом взаимодействуют между собой. Эта зависимость сеойств химических элементов и соединений друг от друга, зависимость от ка-.ких-то других (может быть неизмеряемых или неизвестных) параметров может быть прояснена, определена с помощью вычисления коэффициен-- тов корреляции. Знание корреляции мэжду свойствами необходимо для . сжатия информации, т.е. для достаточно точного, полного, но не . громоз;&кого описания объектов, систем, классов.

7 Существует хорошо разработанный математический аппарат моделей и методов.предназначенных для сжатия и извлечения информации, содержащейся в .корреляционной матрице - это факторный анализ, ß основе различных моделей факторного анализа лежит следующее: наблюдаемые или измеряемые параметры являются лишь косвенными характеристиками изучаемого объекта или явления, на самом деле существуют внутренние ( скрытые, не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения на: блвдаемых параметров. Эти внутренние параметры.принято называть факторами. Задача факторного анализа - представить наблюдаемые параметры в виде линейной.комбинации факторов. Замечательным является тот факт, что, хотя сами факторы не известны, такое разложение может быть получено, и, более того, такие факторы могут быть определены, т.е. для каждого объекта могут быть указаны значения каждого фактора. • - "

Многочисленные экспериментальные исследования в различных .

областях знания с применением факторного анализа показали, что определяемые факторы удается, как правило, интерпретировать как некоторые существенные внутренние характеристики изучаемых объектов. Таким образом, факторный анализ оказался эффективным формальным средством генерации новых понятий в самых разных науках.

Методы распознавания образов довольно часто применяются для • решения научных задач в различиях областях химии. Один из наиболее часто применяемых методов (причем для решения самых разнообразных задач) - это метсд потенциальных функций. Выбор этого метода, очевидно, обусловлен его интуитивной простотой при постановке задачи классификации. Дадим геометрически наглядную интерпретацию метода потенциальных функцчй. Воспользуемся двухмерной моделью: представьте сеое горизонтальную поверхность, нь которой определены координаты точек из двух классов (положительного и отрицательного). Если точка относится к положительному - над этой точкой строится холм (например 1= если_точка относится к

отрицательному классу, та же функция берется со знаком минус, т.е. можно представить себе, что роется яма с центром в этой точке. Когда мы над всеми точками, принадлежащими к пояснительному клас-; су построим "холмы", а во всех точках из отрицательного класса выроем "ямы", то горизонтальная поверхность обретет (т.е. сложим все отдельные потенциалы) сложный рельеф, и если мы хотим узнать, к.какому классу может принадлежать точка на этом'рельефе - достаточно проверить: выше или ниже уровня первоначальной горизонтальной поверхности эта точка находится.

В третьей главе рассматриваются особенности прогноза химического взаимодействия с использованием системы формирования понятий "Анализатор" и приводятся результаты прогноза полученные'по этой методике." "

Для создания базы моделей прогноза химического взаимодействии' ;.

неорганических соединений, отработки признаков, накопления первичной информации, прежде Есего необходимо было выбрать какой-нибудь из методов, применявшийся ранее и принесший неплохие результаты. ' Выбор был остановлен на системе формирования понятий "Анализатор".

Эта система формирования понятий была использована для прогноза образования соединений в двойных оксидных и мслибдатных системах. Системы оксидов двух- и -трехвалентных металлов в последнее время привлекли пристальное внимание исследователей в связи с обнаружением высокотемпературной сверхпроводимости. Было проведено прогнозирование возможности образования новых соединений наиболее распространенных составов (3:1,2:1, 1:1,1:2) в этих системах.

В качестве пространства признаков для прогнозирования взаимодействия были взяты признаки, неоднократно использовавшиеся для прогноза в оксидных и солевых системах. Таким образом, были сформированы три пространства признаков: I - распределение электронов по энергетическим оболочкам катионов А и В и их валентность; II - тип незавершенной электронной оболочки, заряд, первые три потенциала ионизации, стандартная теплоемкость, ионный радиус ( по Белову-Бокию ) катионов; III - стандартная энтальпия образования, стандартная энтропия и температура плавления оксидов Аг0а и ВО, в также ионный радиус ( Белов, 'Бокий ) катионов.

Все численные признаки дискретизацией по максимуму информативности приводились к символьному виду (те же признаки использовались и при прогнозе в моллбдатных системах). Для соединений состава 1:1 прогнозировалась также возможность их * кристаллизации в структурных типах шпинели и СаРег04. Структуру ;;

2 3

Шпинели еле,чует ожидать у соединений V Вг04 (В= В, 1Ш, 1п, БЬ, .

2 Э »„'»•.

Се-Тй, Об, 1г, Аи, Ас-и), А А1 О (А= Се, Ии, Рй, Р*, Аи), Бт В204

г з г а

(В= V, Мп, Ре), А МпгОА (А= Тс), А Со204 (А= Ве, БГ, Ва,

Иа, Си); В структурном типе СаРе204 должны кристаллизоваться .

га-- гз

Ьа ВгОл (В= В, Л1, Сг, У, Еи-Тга), Са Вг04 (В= Со, Ни, из, 1г, Иг-и"), Бг В204(В= Ра, и), А (А= Тс, Ли, Бт) и Бт Еиг04.

Прогноз проводился также для молибдатной системы А2Мо04-ВМо04 (где А - Ы,На,К,Шз,С8,Т1; В - 1%, Са, Бг, Ва. Си, 2п, С(1, РЬ, ЫЬ,

Со, N1) в соотношении 1:2, 1:1, 2:1. Осуществлялся прогноз образования соединений молибдатов Св и Т1 с мэлибдатами двухвалентных металлов. Результаты взаимодействия молибдатов Ы,На,К,КЬ с Шо04 служили обучающей выборкой. Достоверность прогноза оказалась достаточно высокой. Следует сказать, что указанная система при соотношении 1:2, использовалась при проведении исследований по определению информативности различных признаков.

Одним из путей определения достоверности прогноза, а также преодоления или хотя бы частичного разрешения сомнений в вопросе правильного выбора признаков для тех или иных систем химических соединений является проверка информативности1различных пространств признаков на модельной системе, т.е. на такой химической системе, в которой известны все или почти все факты образования и необразования соединений. \\

На двух модельных системах (указанная выше, а также А2Но04 -В2(Мо04)э в соотношении 5:1, где (А - Ы, К, И>, Св;В - А1,1п, Ga.Sc, Сг, Ре, В1, Ьа, Ш, Бга-Ьи, У) была определена достоверность прогноза в кавдом из трех пространств признаков. Исследование показало, что пространство признаков, включающее распределение электронов по энергетическим оболочкам, оказалось наименее информативным. Большей информативностью обладает второе пространство. Наиболее информативным оказалось третье пространство признаков. Объяснить это можно следувдим образом: распределение электронов по энергетическим оболочкам катионов, вводимое в систему прогнозиро-- , вания в виде символьной информации является очень грубой характе-". ристикой. И, .конечно .ев;-по сравнению со свойствами оксидов тех же

: -14- \ ■■...-.. ■

самых катионов, энергетическое расцределение в таком виде оказывается более отдаленные фактором в генезисе образования соединений е молибдатных системах.

Включение в число признаков для классификации термодинамических функций средних молибдатов оказалось не эффективным. Величины термодинамических свойств молибдатов в справочниках (е тех редких случаях, когда имеются два или три значения) сильно отличаются. Также нужно отметить несогласовайность термодинамических функций между собой. В силу этих указанных причин повышения достоверности не произошло.На тех же модельных системах было проведено исследование влияния выбора формы признаков на достоверность прогноза.

В четвертой главе рассматриваются результаты классификационного прогноза с использованием факторного, кластерного анализа и построения разделяющих поверхностей методом потенциальных функций.

Для того, чтобы убедиться в эффективности применения факторного анализа для классификационного прогноза взаимодействия неорганических соединений были выбраны.три следующие ситуации: I) прогноз-классификация образования шпинелей; 2) структурные поля соединений АВ204 ; 3) прогноз-классификация двойных металлических систем по типу взаимодействия, (полная взаимная растворимость или эвтектика).

В целом ряде исследований шпинелр АВгО<1 показали себя как очень удобная модельная система для проверки на ней новых методов прогноза. Именно поэтому, эта ситуация была выбрана дляцроверки принципиальной возможности применения факторного анализа в целях прогноза-классификации. В качестве признаков были выбраны следующие физико-химические свойства: суммы и разности -трех первых потенциалов ионизации, поляризующего действия ионов,ионных радиусов, эффективных зарядов (по Вацанову) катионов А й В. Выборка для про-гнова-класси^икации была представительной - 170 объектов. . .После проведения факторного анализа, в пространстве двух первых

тт 2

Рис.2. Клзсафосацдонный анализ образования соединений-АВ^ со структурой шпинели. Образование соединений - "+", несбрэ- ■ ■ • зованив - "о". " . ! . 1: -

[акторов.( вклад их в дисперсию гостазил более 60% ) получен очень юроший результат распознавания - только два объекте классифицнро-товались неверно. Но оказалось, что и этот результат мазне улучишь. В первоначальном наборе признаков отсутствовали термодинамические параметры. После включения в него суммы и разности потея-, даалов Гиббсг. оксидов АО и Вг0а, неточное распознавание было устранено (рис.2}. Все объекты классифицировались верно. Таким обра-

-16- • зом, при использовании шпинелей АВ„04 - как модельной системы -была четко продемонстрирована возможность применения факторного анализа для прогноза химического, взаимодействия. Исследования на других модельных системах привели к аналогичному результату. '".

„ Тагам образом, была показана перспективность использования факторного анализа для прогноза химического взаимодействия. Следует указать, что к достоинствам метода относится следующее; общность признаков,т.е. отсутствует необходимость подбора разделявдих признаков; сохраняется наглядность графиков эмпирического прогноза, но достигается большая глубина понимания при использовании факторов, -. обьединящих значительно большее число признаков; полученные корреляционные зависимости факторов от признаков сохраняют возможность физико-химической интерпретации факторов; используемые комбинированные признаки ( например: разность потенциалов ионизации . или отношение ионных радиусов ) достаточно наглядны и позволяют . судить о химизме взаимодействия. . , .■3 дальнейшем факторный анализ применялся при классификационном прогнозе взаимодействия в солевых, оксидных, молибдатных системах. Результаты приведены в табл. 1. . ( ,

Повышение точности прогноза впрямую сказывается на эффективности и экономичности научных исследований и поэтому проблема достоверности полученного результата очень важна. После самых первых работ по эмпирическому графическому прогнозу, когда стало ясно, что при удачном подборе признаков:можно построить разделяющую по-Ёбрхность мевду объектами разных, классов, - вопросу о том, как строить эту разделяющую поверхность, авторы уделяли очень мало внимания. Хотя,"на самом деле очевидно, что при использовании гра- -■•^леской' методики для прогноза - проблема достоверности прогноза

адекватна проблеме построения разделяющей поверхности. ' Приведенная в гл. 2 теория метода потенциальных функций дает

система стехиометрия

тип

прогноза

информативный набор признаков; вид комбинированных признаков

корреляция перв.фактора с при?- | тор2 нахами Л призн

корреляция зтотз.фзк-

АВа°4

АВ„0.

структура

ШШШ9Д1

;—т=з71-э _ +

структурное поле

А В А ЙА±?'В,СА±СВ

отношения г.Р.йД С

г-з

всэ признаки

взятые в ви-дб суши

все признака с виде разности

А-В

двойные металлич

твердый

р-р; эвтектика

отношения ^р»8' Зпл'11

О V

чеуб ' -"от

I .я.а^,

Б.

:ТЛ

--.-(-5-

стлошенкя И I I Н Б С Т

ПЛ.СОЛ

1—5--

I I ас

т

пл.сол

А,Б //X до.солев с общ.. анионом

тв.р-р;тз. р-р с минимумом; эвтектика

К Б

КеНо04 3:1 .

обр соединений

Л'.1

---

отношения И, 1-1 ,

Р, г, а

МеМоО^-^(МоО^

обр,соединений

---- .—

отношений К. I -I-5,

Ъ, и,

й. I ,р

3

Я, I ,?

1 2 I Д

1 °

I

в,1 -г,г

ао-в;,о3

1:1 2:1 3:1

оор. соединений

отношения Н £ Б К разность Р 21Р N V

Р Б Ш N С- Н

Р Б 272 N К ! в Н Р Б ЕР N К VI йй Р Б Е1Р N

Табл. 1.Информативные наборы признаков при классификационном анализе с использованием факторов.

- > - - . -18-' • ' • простой и эффективный способ построения разделяющей поверхности. Границу между классами определяют нулевые значения общей потенциальной функции. Выбор на этом способе построения разделяющей пове рхности был остановлен еще и потому, что метод .потенциальных функ ций мокет быть использован собственно для прогноза взаимодействия Разделяющая поверхность нз рис.2 построена указанным методом.

.Процедура иерархического кластер-анализа была применена на примере построения структурннх полей АВ204. Несмотря на то, чтЬ бкл получен удовлетворительный результат, следует отметить, что широкое применение кластерного анализа для прогноза химического взаимодействуя требует тщательного изучения информативности призраков,

В пятой главе дано описание базы дачных, базы моделей и АРМ взаимодействия неорганических соединений. Приводятся результаты прогноза образования соединений в тройных молибдатных системах, проведенного с лспользованием АРМ. Предлагается способ представ- . лекия знаний, для химических экспертных систем с использованием критерия максимума информативности.

База данных состоит "йз шести файлов: файл свойств элементов; файл свойств простых веществ; свойств оксидов;свойств солей; . свойств молибдатов; файл ионных радиусов (по Шенноцу). Ключевыэ поля при поиске б файле веществ - символ "элемента; для всех остальных файлов - символ элемента (или катиона) плюс его валентность.

В файл элементов включены следующие физико-химические свойства: ионный радиус по Боюпо-Белову; эффективный заряд ядра по Баца-нову; параметр поляризации; три первых потенциала ионизации; главное кзантовое число; элзктроотрицательность: обобщенный и эффек-' тинный ионизационные потенциал. Температура плевлешя, теплоемкость, теплота сублимации, энергия кристаллической решетки, тепло-• та и энтропия плавления - свойства, содержащиеся в файле веществ. Файлы оксидов, солей и мольбдатов - это температура плавления,ста-

-19-. . . ФАЙЛЫ ФИЗИКО-ХИМИЧЕСКИХ свойств

Элементы

Вещества

Метод потенциальных функций

Оксида

Сола

Молкбдатн

Радиуса по-Шеннону

ИНТЕРФЕЙС СОЗДАНИЯ ПРИЗНАКОВ

Обучающие вкботжи

БАЗА МОДЕЛЕЙ

Представление знаний

Кластерный ■......... Факторный

анализ • анализ.

Г

Графический эмпирический прогноз .

Построение разделяющих поверхностей

ОБРАБОТКА РЕЗУЛЬТАТОВ • • : \ , - ' 1 • Рис.3. Структура АРМ прогноза взаимодействия неорганических соединений. • ' " :

дартная знтрспия, энтальпия и потенциал Гиббса: структурный тйп оединения. Структура АРМ приведена на рпо.З. , '

АРМ был апробирован на задаче класстфссационЕого анализа к рогноза образования соединений в тройной, молибдагчой системе: . 2Ко04 - ВУоО^ - Сг(Мо04)э с соотношением компонентов 1:2:1. де А - { Ь1, На, К }; Б - { Ыа, Со, !Т1, 2п, Си, РЬ, Бг, Ва,* а }; С - { А1, 1п, Сг, Ре, Бс, Ьа-Ьи, У Ь На первбм этапе этого сследования для изучения информативности различных признаков при-енялся графический эмпирический прогноз. В пространстве тех приз-аков, которыз оказались более информативными, с использованием •

метоль потенциальных функций к факторного анализа осуществлялся прогноз образования соединений. Последующая экспериментальная проверка показала высокую достоверность прогноза.

На той же системе был опробован указанный вше способ представления знаний. Исходный оазис численных признаков был представлен следующим образом: для молибдатов трехвалонтных металлов 21x4 зньчг-нкя. ( рассматривался 21 молибдат; 4 признака - стандартная энтальпия образования, стандартна^ энтропия, температура плавления оксидов С203 и ионный радиус катиона С+я); 5x4 - значений для «о-лиодатов одновалентных металлов ( пять молибдатов и те же четыре признака); 10x4 - значений для молибдатов двухвалентных меташюЕ (десяти молибдатов и признаки те ке ). Обучающая Еыборка - 39 объектов положительного класса ( образование соединений ) и 41 объект иь отрицательного класса (несбразование соединений).

После максимизации информагазности безис сократился следующим

7? ==~> 21x4 ' [ н|, Щ-, С с С-''. фС тс. _ 1' к 1 5* 1

г? --> 10x4 . { н? _ ов _ ов. п,В_ фв. „в _ ь4> 11 х4" К1 кз

7к Б*, Т^, } ■

Т.е-, вместо первоначального базкеа численных признаков размерностью 144 ( 84 ^ 20 + 40 ) был. получен символьный базис, размерность которого равна 39.

Предусмотренный в структура АРМ блок представления знаний позволяет на основе обучающих выборок получать символьные базисы рассматриваемых задач для последующего накопления в оазе знаний.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ.

С использованием различных методик классификационного прогнозирования выполнено исследование химического взаимодействия в различных системах и классах неорганических соединений. Построена бь-за моделей прогноза химического взеимодэйствия неоргаяпчеокх со*-

динений.Постановка задачи обусловлена необходимостью изучения особенностей работы известных методик прогнозирования, расширения набора этих методик и определения физико-химических сеойств, которые определяют особенности взаимодействия в ряде химических систем.Определение информативных наборов признаков и создание базы моделей прогноза позволяют повысить достоверность получаемых прогнозов и помочь в выборе путей проведения направленного химического синтеза

1. Проведен прогноз образования соединений в молибдатной системе А2ИоО,- ВЫо04 при соотношениях 1:2, 1:1, 2:1 и в оксидной системе АО - В20э при соотношениях 3:1, 2:1, 1:1, 1:2. Прогаоз проводился с использованием системы формирования понятий "Анализатор". Эксперимент показал высокую достоверность проведенного прогноза.

2. Был предложен и апробирован метод дискретизации численных признаков с использованием критерия максимума информативности. Газра-

. ботанный программный пакет сервисного обслуживания при проведении химического прогноза с применением "Анализатора" внедрен в Институте металлургии ¿II СССР, г. Москва.

3. В рамках изучения методики проведения прогноза с использованием "Анализатора" при исследованиях на модельных системах была определена информативность различных пространств признаков при прогнозировании образования соединений в молибдатных системах. • Также было изучено втаяше выбора вида комбинированных признаков на достоверность прогноза в модельных молибдатных системах.

4. Была предложена новая методика проведения классификационного прогноза взаимодействия неорганических соединений с использованием Факторного анализа. С помощью этой методики были определены наборы наиболее информативных признаков,определяющих особенности взаимодействия в ряде молибдатных, солевыг и оксидных систем. К достоинствам предложенной методики относятся - общность пространства признаков; графическая наглядность; корреляционная 'зависимость

фактороЕ от пригкакоз. .

5. Для построения разделяющих поверхностей при графическом эмпирическом 'прогнозе к прогнозе с использованием факторного анализа предложен к машинно реализован метод потенциальных функций. Использование метода потенциальных функций позволяет осуществить псст7 роение границ между разными классами химических соединений достаточно наглядно и математически строго, е такжо поЕктаат достоверность прогноза с использованием указанных выше методик.

6. Были исследованы возможности кластерного анализа при проведении прогноза взаимодействия неорганических соединений. Проведенное исследование показало - применение кластерного анализа требует предварительного изучения информативности используемых при прогнозе физико-химических свойств.

7. Создана саза моделей прогноза химического взаимодействия неорганически соединений, в которую вошли программно реализованные методики прогнозирования: графический эмпирический прогноз; метод потенциальных функций:- факторный анализ: кластерный анализ. Созда-

ч

ше базы и объединение в рамках одной программной системы перечисленных методик существенно расширяет возможности при проведении прогноза и определении путей направленного химического синтеза,

8. Разработан и создан АРМ прогноза взаимодействия неорганических соеданений.Еключакдий базу физико-ХкЯличесих свойств для прогноза и базу моделей прогнозирования. С использованием этого АРМа спрогнозировано и экспериментально подтверадено образование ряда соединений в тройшх молибдатных системах.

3. Предложен метод представления знаний в химических экспертных системах прогнозирования взаимодействия неорганических соединений. Мето£ заключается в преобразовании (при учете обучающей выборки) ■с использованием критерия минимизации неопределенности (энтропии) исходного базиса численных признаков в сокращенный базис символь-

нт. признаков.

' основное содержание диссертации изложено в публикациях: .1. Манзанов Ю.Е., Луцнк Б.П., Мохосоев М.В. Влияние шбора системы признаков на прогноз образования соединений в системах а2Мо04-Вя(Мор4)3 и АгМо04- СМоОt.Докл.АН СССР. I SSV. т. 2уг' , N ?,с.646-64Э.

2. Манзанов Ю.Е., Луиык В.И., Мохосоев М.В. Классифнкацронннй прогноз образования молибдатов одно- и двухвалентных металлов. Яурн. непрг. химии, 1986,'Т.33,.в.8, с.<080-2082.

3. Киселева H.H.,Луцык B.W..Воробьева В.П.»Манзанов Ю.Е.,Ващеш:о II.Д. Домекко Л.В.'.Мохоссев М.В. Кибернетическое прогнозирование

новых соединэний в системах АО- В203 .Докл.АН CCCP.I98S, T.ZQi, * '

N 3, С.657-660.

4. Манзанов Ю.Е., Мсхосоев М.В.. Луцык B.ii. Применение факторного анализа для прогноза химического взаимодействия. Докл. АН СССР,

1989, т.307, N Ь, C.II60-II64.

5. Мохосоев М.В., Манзанов Ю.Е., Луцук В.И. Прогноз взаимодействия в солеБых системах методом факторного анализа. Докл. АК СССР,

1990, Т.3X0, Н 2, с.ЗС-8-402.

6. Манзанов Ю.Е., Луцык В.И., Мохосоев М.В. Построение раздел*-• • поверхности методом потенциальных функций при прогюза ¿¿ей-*-.:.«-взаимодействия. Докл. АН СССР, 1990,т.312, N 3, с. €52-656.

7. Манзанов Ю.Е., Луцык В.И., Мохосоев М.В. О влиянии свойств компонентов на образованно соединений в системе АО - 0ч. Докл

АН СССР, 1990,т.313, N 5, C.IIS4-II6Ö.

8. Манзанов Ю.Е., Мохосоев M.S. Представление знаний в химических экспертных системах с использованием критерия максимума информативности. ДОКЛ. АН СССР, 1991,Т.316, П 5, C.II79-1I82.