Компьютерное конструирование неорганических соединений, перспективных для применения в электронике, с использованием баз данных и методов искусственного интеллекта тема автореферата и диссертации по химии, 02.00.21 ВАК РФ
Киселева, Надежда Николаевна
АВТОР
|
||||
доктора химических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2004
ГОД ЗАЩИТЫ
|
|
02.00.21
КОД ВАК РФ
|
||
|
На правах рукописи
КИСЕЛЕВА Надежда Николаевна
КОМПЬЮТЕРНОЕ КОНСТРУИРОВАНИЕ НЕОРГАНИЧЕСКИХ СОЕДИНЕНИЙ, ПЕРСПЕКТИВНЫХ ДЛЯ ПРИМЕНЕНИЯ В ЭЛЕКТРОНИКЕ, С ИСПОЛЬЗОВАНИЕМ БАЗ ДАННЫХ И МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Специальность 02.00.21 - химия твердого тела
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора химических наук
Москва -2004
Работа выполнена в Институте металлургии и материаловедения им.ААБайкова Российской академии наук.
Официальные оппоненты:
доктор химических наук, профессор Дробот Дмитрий Васильевич
доктор технических наук, профессор Жариков Евгений Васильевич
доктор технических наук, профессор Кузнецов Олег Петрович
Ведущая организация: Институт теплофизики экстремальных состояний Объединенного института высоких температур Российской академии наук, г.Москва.
Защита диссертации состоится 23 ноября 2004 г. в 14 часов на заседании диссертационного совета Д 212.120.06 при Московской государственной академии тонкой химической технологии имени М.В.Ломоносова по адресу: 119571 г.Москва, проспект Вернадского, д.86, аудитория М119.
С диссертацией можно ознакомиться в библиотеке Московской государственной академии тонкой химической технологии имени М.В.Ломоносова по адресу: г.Москва, ул.Малая Пироговская, д.1.
Отзывы на автореферат отправлять на имя ученого секретаря по адресу: 119571 г.Москва, проспект Вернадского, д.86.
Автореферат разослан 20 сентября 2004 г.
Ученый секретарь диссертационного Совета
2005-4 12506
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Настоящая диссертационная работа посвящена разработке одного из перспективных методов конструирования новых неорганических веществ, основанного на использовании современных информационных технологий. Создание и применение таких методов является одним из актуальных направлений химии и материаловедения, которое в последние годы интенсивно развивается во всем мире.
Актуальность темы обусловлена также объектами для компьютерного конструирования — это материалы для электроники. Химия и материаловедение этих веществ являются одними из наиболее динамически развивающихся отраслей высоких технологий. Особенностью использования материалов в электронике является то, что в большинстве случаев они являются главной функциональной частью электронных устройств. Поэтому разработка новых материалов, процессов их получения и обработки в значительной степени определяет прогресс электроники. Автоматизация поиска новых веществ, перспективных для практического использования в качестве материалов электронной техники, позволяет ускорить процесс перехода от одного поколения электронных устройств к другому.
Цель работы заключалась в разработке нового подхода к компьютерному конструированию неорганических соединений, использующего методы искусственного интеллекта для анализа информации баз данных по свойствам неорганических веществ с целью поиска многомерных классифицирующих закономерностей, и применении разработанного подхода для прогноза соединений, перспективных для создания новых материалов для электроники.
Для достижения указанной цели в рамках диссертационной работы решались следующие задачи:
1. Разработка и интеграция баз данных (БД) по свойствам неорганических веществ и материалов: БД по свойствам неорганических соединений «Фазы», БД по фазовым диаграммам систем с полу-
проводниковыми соединениями «Диаграмма» и БД по свойствам акустооптических, электрооптических и нелинейнооптических веществ «Кристалл».
2. Выработка критериев отбора наилучших алгоритмов анализа данных, использующих обучение ЭВМ классификации объектов. Выбор методов конструирования неорганических веществ, соответствующих выработанным критериям отбора и обеспечивающих наибольшую достоверность прогноза неорганических соединений и оценки их свойств. Разработка методики конструирования неорганических соединений с использованием методов обучения ЭВМ и баз данных, направленной на повышение достоверности прогнозирования возможности образования и свойств фаз.
3. Проверка эффективности предложенного подхода на примерах решения задач конструирования новых неорганических соединений, перспективных для использования в электронике:
3.1. Конструирование соединений, существующих при нормальных условиях, которые перспективны для разработки новых полупроводниковых материалов: АВ2Х4 (со структурами типа шпинели, РЬСа25е4, ТЬ3Р4, СаРе204 и т.д.), АВХ2 (структурный тип (СТ) а-№Ре02) и т.д. (X = Б, Бе, Те), АВХ со структурами типа МдАдАэ, 2гЫ1А1, ТМ81 и РЬРС1 (X = Р, Ав, БЬ, В1). А и В здесь и далее — любые химические элементы.
3.2. Конструирование соединений, перспективных для использования в качестве новых сегнетоэлектрических, пьезоэлектрических, акустооптических, электрооптических и нелинейнооптических материалов: халькопиритов состава АВХ2 в халькогенидных и пниктидных системах, АВО3 со структурой типа перовскита, ильменита и т.д., ABF5 со структурами типа BaFeF5, BaGaF5 и CaFeF5 и т.д., А2В2(ХО4)з (X = S, Сг, Mo, W) со СТ лангбейнита и т.д.
3.3. Конструирование соединений, перспективных для поиска новых магнитных материалов: АВ2О4 со СТ шпинели, АВ2Х2 (X=Al, Si, Ge, P, As, Sb) со CT ТЬ|Сг^12 и интерметаллических фаз Гейслера состава АВХ2.
4. Разработка кибернетико-статистического подхода к конструированию новых веществ с заданными свойствами, предназначенного
для автоматизации материаловедческой практики. Подход основан на использовании баз данных по свойствам веществ и материалов, систем искусственного интеллекта для поиска новых веществ с заданными свойствами и расчетно-экспериментальных методов оптимизации технологии их синтеза и обработки. С помощью предложенного подхода можно не только предсказать новые неорганические соединения, но и разработать оптимальную технологию получения материалов с заданными свойствами.
5. Разработка принципов организации компьютерной системы нового поколения для конструирования неорганических веществ, а именно, информационно-прогнозирующей системы, предназначенной для поиска данных об изученных соединениях, прогноза еще неполученных фаз и оценки их свойств.
Научная новизна работы состоит в следующем:
1. Для компьютерного конструирования сложных неорганических соединений впервые предложен подход, основанный на использовании методов искусственного интеллекта (обучение ЭВМ) для поиска многомерных классифицирующих закономерностей в информации баз данных по свойствам веществ и прогноза новых фаз.
2. С использованием предложенного компьютерного подхода к конструированию неорганических веществ впервые получены прогнозы существования сотен новых соединений составовДВХ2(Х = 8, Бе, Те, N. Р, Ав, ЭЬ, В1), АВХ (X = Р, Аэ, БЬ, В|). АВР5, А2В2(Х04)3 (X = Б, Сг, Мо, \Л/), АВ2Х2 (X=А1, в!, ве, Р, Аб, БЬ) и т.д. и типа их кристаллической структуры
при нормальных условиях, часть из которых уже подтверждена экспериментально разными исследователями.
3. На основе анализа результатов компьютерного конструирования подтверждена гипотеза о существовании периодических зависимостей между фундаментальными свойствами многокомпонентных неорганических соединений и свойствами химических элементов, входящих в их состав.
4. Впервые предложен и использован кибернетико-статистический подход, предназначенный для автоматизации поиска и разработки новых материалов с заданными свойствами.
Полученные результаты позволяют сформулировать научное направление работы: компьютерное конструирование неорганических соединений с использованием баз данных и методов искусственного интеллекта.
Практическая значимость работы определяется следующим:
1. Компьютерное конструирование неорганических соединений позволяет автоматизировать поиск новых неорганических соединений. Полученные прогнозы уменьшают количество исследуемых составов при поиске веществ, перспективных для полупроводниковых, сегнетоэлектри-ческих, пьезоэлектрических, акустооптических, электрооптических, нелинейнооптических, магнитных и прочих применений.
2. Предложенный кибернетико-статистический подход дает возможность не только осуществить прогноз новых соединений, но и найти оптимальные режимы получения и обработки материалов с заданными свойствами.
3. Использование созданной интегрированной системы баз данных, объединяющей БД по свойствам неорганических веществ, БД по фазовым диаграммам систем с полупроводниковыми соединениями и БД по свойствам акустооптических, электрооптических и нелинейно-оптических веществ, которые содержат информацию, собранную и оцененную специалистами, сокращает затраты на разработку новых неорганических материалов за счет оперативного информационного обслуживания исследователей, уменьшения необоснованного дублирования работ и компьютерной обработки информации с целью конструирования новых соединений.
Личный вклад автора. Результаты, изложенные в диссертации, получены автором и группой руководимых ей сотрудников в ИМЕТ РАН, а также в кооперации с сотрудниками Института кибернетики им.В.М.Глушкова Национальной Академии наук Украины. Необходимость коллективной работы была связана со сложностью используемых в
настоящей работе систем искусственного интеллекта, являющихся результатом многолетних исследований и разработок, проводимых большой группой высококвалифицированных специалистов по информационным технологиям. Информация БД «Диаграмма» и большинство данных БД «Кристалл» собраны и оценены сточки зрения достоверности-российскими специалистами, работающими в области полупроводниковых и диэлектрических материалов, что позволило создать информационные системы, содержащие наиболее надежные данные. В целом же личный вклад автора включает разработку основных принципов предложенного в настоящей работе подхода к компьютерному конструированию сложных неорганических соединений; выбор темы исследований; постановку целей и задач диссертационной работы; выбор и тестирование программных средств искусственного интеллекта и систем управления базами данных, обеспечивающих наилучшее решение поставленных задач; сбор и ввод информации в БД «Фазы», сбор и обновление данн ых БД «Диаграмма» и «Кристалл», отбор информации для компьютерного анализа, проведение расчетов; анализ и интерпретацию полученных результатов, а также обобщение представленных в работе результатов и выработку перспектив дальнейшего развития предложенного автором подхода.
Апробация работы. Основные результаты работы были доложены и обсуждены на следующих конференциях, совещаниях и семинарах: IV Всесоюзной конференции «Планирование и автоматизация эксперимента в научных исследованиях» (Москва, 1973), IV Всесоюзном совещании по высокотемпературной химии силикатов и окислов (Ленинград, 1974), Workshop National Bureau of Standards (Gaithersburg, 1977), 1-ой Всесоюзной школе по диаграммам состояния в материаловедении (Кацивели, 1978), 3-й и 4-й Всесоюзных конференциях по кристаллохимии интерметаллических соединений (Львов, 1978 и 1983), IV Международной конференции по применению ЭВМ в химии (Новосибирск, 1979), II Всесоюзной школе-семинаре по машинным методам обнаружения закономерностей (Рига, 1979), I Всесоюзной конференции по применению летучих соединений (Москва, 1979),
V Всесоюзном совещании «Сплавы редких металлов с особыми физическими свойствами» (Москва, 1980), 15. Jahrestatagung der Vereinigung fbir Kristallographie (Leipzig, 1980), International Conference "Filamentary A15 Superconductors" (New York, 1980), Научно-технической конференции «Организация знаний и принятие решений в системах искусственного интеллекта» (Киев, 1980), 9 Всесоюзном семинаре секции «Химия многокомпонентных солевых систем» (Москва, 1981), IV и V Всесоюзных совещаниях «Диаграммы состояния металлических веществ» (Звенигород, 1982,1989), III Всесоюзном совещании по кристаллохимии неорганических и координационных соединений (Новосибирск, 1983), Всесоюзном семинаре «Организация знаний в системах искусственного интеллекта» (Киев, 1983), Xth Conference on Applied Crystallography (Kozubnik, 1984), V и VI Всесоюзных школах «Применение математических методов для описания и изучения физико-химических равновесий» (Новосибирск, 1985, 1989), Всесоюзном семинаре «Применение методов искусственного интеллекта в научных исследованиях, проектировании и робототехнике» (Киев, 1985), II Всесоюзной школе-семинаре «Современные проблемы исследования многокомпонентных металлических систем» (п.Кратово Московской обл., 1987), III Всесоюзной конференции по проблемам получения и использования в народном хозяйстве данных о свойствах материалов и веществ (Москва, 1987), VII Всесоюзном совещании по физико-химическому анализу (Фрунзе, 1988), 2-м Всесоюзном совещании «Применение ЭВМ в научных исследованиях и разработках» (Днепропетровск, 1989), International Conference "Electronic Ceramics - Production and Properties" (Riga, 1990), Всесоюзном научно-техническом симпозиуме «Теория и практика классификации и систематики в народном хозяйстве» (Пущино, 1990), XIII Всесоюзном совещании «Получение, структура, физические свойства и применение высокочистых и монокристаллических тугоплавких и редких металлов» (Суздаль, 1990), I Российско-китайском Симпозиуме "Actual problems of modem materials science" (Томск, 1992), International Workshop "Regularities, Classification and Predictions of Advanced Materials" (Como (Italy), 1992), Workshop "Innovations in Materials Design" (Wright-Patterson
AFB, OH (USA), 1994), Fall Meeting of Materials Research Society (Boston, 1994), Japan International SAMPE Symposium & Exhibition (Tokyo, 1995), Международной конференции «Математические методы в химии и химической технологии» (Тверь, 1995), XVII Congress and General Assembly of International Union of Crystallography (Seattle, 1996), V Международной конференции «Термодинамика и материаловедение полупроводников (Москва, 1997), 1 -st и 2-nd International Conferences on Intelligent Processing and Manufacturing of Materials (IPMM'97 и IPMM'99) (Gold Coast (Australia), Honolulu, 1997,1999), VIII Международная конференция KDS-99 «Знание-диалог-решение» (Кацивели, 1999), 2-nd International Conference on Inorganic Materials (Santa Barbara, 2000), IFAC Symposium on Artificial Intelligence in Real Time Control (AIRTC-2000) (Budapest, 2000), Международной научно-практической конференции KDS-2001 «Знание-диалог-решение» (Санкт-Петербург, 2001), 11-й Всероссийской конференции «Математические методы распознавания образов (ММРО-11)» (Пущино, 2003).
Исследования по компьютерному конструированию неорганических соединений и разработке БД были поддержаны российскими и зарубежными фондами и организациями: РФФИ (фанты №99-07-90040 и №04-07-90086), Правительством Москвы (гранты №В117 Программы «Поддержка инфраструктуры науки в г.Москве», №3-4 и 1.2.1 Программы «Инфраструктура и адресная поддержка науки»), International Scientific Foundation (ISF) (фанты MBM000 и МВМ300), European Office of Aerospace Research and Developments (EOARD) (контракты SPC-94"4097, SPC-95-4016, SPC-95-4096, SPC-96-4067 и SPC-00-4014), а также выполнялись в рамках Государственной научно-технической программы «Новые материалы» (направление «Полупроводниковые и особочистые материалы»).
Публикации. Основные результаты диссертационной работы изложены в 93 публикациях, в том числе 1 монографии, 59 статьях, 1 депонированной статье, 32 публикациях в сборниках трудов и тезисов докладов конференций и семинаров.
Объем и структура работы. Диссертация изложена на 333 страницах, проиллюстрирована 59 таблицами и 40 рисунками, содержит
введение, 3 главы, заключение, выводы и список цитируемой литературы, состоящий из 453 наименований.
Положения, выносимые на защиту:
1. Подход к компьютерному конструированию сложных неорганических соединений на основе использования баз данных по свойствам неорганических веществ и материалов и методов искусственного интеллекта и результаты его применения на примерах соединений, перспективных для разработки новых полупроводниковых, сегнето-электрических, пьезоэлектрических, акустооптических, электрооптических, нелинейнооптических и магнитных материалов.
2. Результаты компьютерного конструирования неорганических соединений, подтверждающие гипотезу о том, что фундаментальные свойства многокомпонентных неорганических соединений (возможность образования соединения, тип кристаллической структуры и т.д.) при определенных условиях (температуре, давлении, соотношении компонентов и т.д.) связаны сложными периодическими зависимостями с фундаментальными свойствами химических элементов, входящих в их состав. Использование многомерных классифицирующих зависимостей, включающих в качестве переменных множество свойств химических элементов и простых соединений, позволяет получить наилучшие результаты конструирования еще неполученных фаз.
3. Критерии выбора алгоритмов искусственного интеллекта, которые предназначены для поиска сложных закономерностей в больших объемах информации, и выбор методов для компьютерного конструирования неорганических соединений, основанных на обучении ЭВМ классификации объектов и сетевых структурах данных.
4. Разработка и использование интегрированной распределенной системы БД по свойствам веществ и материалов для повышения достоверности и оперативности компьютерного конструирования неорганических веществ, объединяющей БД по свойствам неорганических соединений, БД по фазовым диаграммам полупроводниковых систем и БД по свойствам акустооптических, электрооптических и нелинейнооптических веществ.
5. Результаты применения комплексного подхода к автоматизации процесса разработки новых материалов, включающего теоретические методы компьютерного конструирования веществ и расчетно-эксперимен-тальные методы оптимизации технологических процессов, полученные при решении задачи поиска новых сверхпроводников со структурой фаз Шевреля, которые подтверждают перспективность предложенного кибернетико-статистического подхода к конструированию материалов с заданными свойствами.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении дана постановка решаемой в диссертационной работе задачи компьютерного конструирования новых неорганических соединений, которую можно сформулировать следующим образом: найти совокупность химических элементов и их соотношение (т.е. качественный и количественный состав) для создания (при заданных внешних условиях) определенной пространственной молекулярной или кристаллической структуры, позволяющей реализовать необходимые функциональные свойства. Исходной информацией для расчетов должны быть только свойства химических элементов и данные о других уже изученных соединениях. Во введении кратко изложено состояние проблемы конструирования неорганических соединений, дано обоснование выбора методов решения поставленной проблемы, показана актуальность темы диссертации и определены цели работы, рассмотрена практическая значимость и научная новизна полученных результатов, сформулированы основные положения, выносимые на защиту.
В первой главе «РАЗРАБОТКА БАЗ ДАННЫХ ПО МАТЕРИАЛАМ ДЛЯ ЭЛЕКТРОНИКИ» представлены базы данных по свойствам неорганических веществ и материалов, и в первую очередь - БД по свойствам веществ, используемых в электронике.
В п.1.1 «Базы данных по веществам и материалам для электроники, созданные в мире» дан анализ известных компьютерных информационных систем по свойствам неорганических веществ и материалов.
Информацию о материалах для электроники можно разбить натри группы: (1) данные о материалах для использования в качестве активных компонентов (полупроводниковых устройств, магнитной памяти, пьезоэлектрических преобразователей, фильтров и гетеродинов, пиро- и сегнетоэлектрических, лазерных, сверхпроводящих, нелинейноопти-ческих, акустооптических, электрооптических устройств и т.д.), (2) информация о материалах для применения в качестве пассивных компонентов (резисторов, сопротивлений, трансформаторов, проводников, оптических волокон, печатных плат и т.д.) и (3) данные о вспомогательных материалах (элементоорганических соединениях, кислотах-травителях, пластмассах и т.д.). Помимо этого важное значение для практических применений имеют сведения о процессах получения и обработки материалов. Аналитический обзор информационных систем по свойствам неорганических веществ и материалов, которые содержат сведения о материалах, используемых в электронике, позволил определить тематику баз данных, созданных нами в ИМЕТ РАН: БД по фазовым диаграммам систем с полупроводниковыми фазами и БД по веществам с особыми акустооптическими, электрооптическими и нелинейнооптическими свойствами. Таким образом, настоящая диссертационная работа посвящена разработке баз данных и конструированию соединений, перспективных для использования в качестве активных компонентов электронных устройств.
Разработанные нами БД по свойствам веществ и материалов для электроники отличаются от созданных ранее следующим комплексом преимуществ:
> сбор и экспертная оценка достоверности данных осуществляются высококвалифицированными российскими специалистами;
> отсутствие аналогов;
> возможность доступа к БД в сети Интернет.
П.1.2 «База данных по свойствам неорганических соединений «Фазы»» содержит краткую информацию о разработанной нами БД «Фазы». Она включает данные о наиболее распространенных
характеристиках соединений (рис.1), а также библиографические ссылки и более тысячи полных текстов соответствующих статей.
Рис.1. Концептуальная структура базы данных «Фазы»
В настоящее время в БД введены сведения о более 41 тыс. тройных соединений из свыше 17 тыс. систем. Информация извлечена из 13 тыс. публикаций. БД доступна пользователям из глобальной сети Интернет (адрес БД в системе Интернет - http://phase.imet.ac.ru/phases). БД «Фазы» зарегистрирована в Государственном регистре БД (Регистрационное свидетельство №1071 от 16 декабря 1996 г.).
В п.1.3 «База данных по фазовым диаграммам систем с полупроводниковыми соединениями «Диаграмма»» дано краткое описание структуры, программного и аппаратного обеспечения разработанной нами БД «Диаграмма». Основной информацией БД являются таблицы экспериментальных данных, собранных и оцененных экспертами, а также данные, полученные В результате отатистичеСКОИ обработки ИЛИ термодинамического согласования экспериментальных данных, рисунки
фазовых диаграмм и другая информация (рис.2 и 3). В БД хранятся сведения о термодинамических свойствах фаз и систем, расчетные модели, а также написанные экспертами аналитические обзоры по фазовым диаграммам, в которых, в частности, дается дополнительная информация о системах, не включенная в таблицы БД. Кратко описана система обработки и визуализации графической информации о фазовых диаграммах, созданная специально для БД «Диаграмма». Разработанная система позволяет пользователю БД изменять масштаб рисунков и определять координаты точек на Т-х-фазовых диаграммах двойных систем и диаграммах Розебома. При разработке БД «Диаграмма» особое внимание было уделено оценке достоверности хранящейся информации о фазовых диаграммах. Точность измерения каждого экспериментального значения (содержания компонентов, температуры и давления и т.д.) в таблицах БД оценивалась экспертами по пятибалльной шкале, соответствующей различным фиксированным уровням ошибок измерения. Информация о величине ошибки, предлагаемая экспертом, выдается пользователю при просмотре соответствующих таблиц, содержащих данные о линиях равновесий. Пользователь БД «Диаграмма» может просмотреть полные тексты большинства англоязычных публикаций последних лет, из которых отобрана
информация, хранящаяся в базе" данных. В настоящее время БД содержит информацию о нескольких десятках двойных и тройных систем, извлеченную примерно из 2 тыс. публикаций. БД «Диаграмма» зарегистрирована в Государственном регистре баз данных (Регистрационное свидетельство N.943 от 29 декабря 2001 г.). БД доступна зарегистрированным пользователям из глобальной сети Интернет (адрес БД в системе Интернет- http://phase.imet.ac.ru/diagram).
Рис.2. Концептуальная структура блока данных по двойным системам БД «Диаграмма»
В п. 1.4 «База данных по свойствам акустооптических, электрооптических и нелинейнооптических веществ «Кристалл»» кратко рассмотрены структура, программное и аппаратное обеспечение разработанной нами БД «Кристалл». БД «Кристалл» включает таблицы, содержащие данные о свойствах веществ рассматриваемых классов, информацию о погрешностях, методах измерений, условиях получения и т.д. (рис.4).
Важно, что основная часть информации БД собрана и оценена российскими специалистами, непосредственно участвующими в
Рис.3. Концептуальная структура блока данных по тройным системам БД «Диаграмма»
разработке и использовании материалов, относящихся к этим классам веществ. Табличная информация о каждом веществе дополнена аналитическим обзором, в котором кратко описана технология получения веществ, возможные области их применения, а также особые свойства, не включенные в таблицы базы данных. Здесь же, по возможности, дана экспертная оценка данных, хранящихся в БД.
Рис.4. Концептуальная структура базы данных «Кристалл»
В настоящее время БД содержит информацию о более сотни наиболее важных для практических применений веществ. В БД хранится обширная графическая информация о зависимостях свойств (более 1500 рисунков). Для большинства англоязычных публикаций последних лет возможен просмотр полных текстов статей, из которых извлечена информация, хранящаяся в таблицах БД. БД доступна зарегистрированным пользователям из сети Интернет (адрес БД в сети Интернет - http:// phase.imet.ac.ru/ crystal). БД «Кристалл» зарегистрирована в Государственном регистре БД (Регистрационное свидетельство N.944 от 29 декабря 2001 г.).
В п.1.5 «Интеграция баз данных по веществам и материалам ИМЕТ РАН» представлены основные принципы организации системы баз данных по свойствам веществ и материалов, созданной нами в ИМЕТ. Проведено сравнение различных путей интеграции БД: (1) полная интеграция БД и создание большой информационной системы (мегабазы данных) и (2) использование специальных справочных метабаз данных, содержащих перечни свойств и веществ, данные о которых хранятся в разных информационных системах, и систему программных шлюзов. Выбран второй путь как наиболее оптимальный вариант, который имеет следующие преимущества по сравнению с большой мегабазой данных:
— простота эксплуатации и модификации отдельных БД;
— возможность объединения БД, разработанных в разных организациях и странах, в том числе с различным уровнем достоверности данных и с разными СУБД;
— простота поиска данных;
— возможность использования менее мощных серверов БД и Web-серверов;
— равномерное распределение нагрузки на каналы связи.
Приведены результаты разработки распределенной системы баз
данных по свойствам материалов ИМЕТ РАН, объединяющей информацию БД «Диаграмма» и БД «Кристалл», а также БД «Фазы». В настоящее время система включает только программные шлюзы (рис.5), однако ведется разработка новой версии системы на основе метабазы
данных. Распределенная информационная система объединит российские БД по материалам для электроники.
Рис.5. Структура интегрированной системы БД ИМЕТ РАН
Во второй главе «МЕТОДЫ КОНСТРУИРОВАНИЯ НЕОРГАНИЧЕСКИХ ВЕЩЕСТВ» отмечено, что рациональное использование информации, хранящейся в базах данных по свойствам материалов, предполагает ее обработку с целью поиска закономерностей. Найденные закономерности могут применяться для конструирования новых веществ с заданными свойствами, а также для разработки технологий их получения, для прогнозирования поведения веществ под воздействием различных факторов, т.е. для автоматизации исследований. В настоящем исследовании рассматривается поиск эмпирических классифицирующих закономерностей и их применение для конструирования новых неорганических соединений.
В п.2.1 «Квантовомеханические методы», п.2.2 «Эмпирические методы» и п.2.3 «Методы поиска многомерных классифицирующих
закономерностей» проведен анализ возможностей различных подходов к решению задачи прогнозирования новых соединений с заданными свойствами на основе знания только свойств химических элементов:
> квантовомеханического подхода;
> эмпирических двух- и трехмерных критериев;
> многомерных эмпирических классифицирующих закономерностей.
На основе анализа имеющихся подходов к конструированию новых неорганических соединений с заданными свойствами обоснован выбор многомерных эмпирических классифицирующих закономерностей как основного инструмента исследований, проводимых в настоящей работе. Для поиска многомерных закономерностей, связывающих свойства неорганических соединений со свойствами химических элементов, нами предложено использовать методы искусственного интеллекта, в первую очередь, методы распознавания образов.
В п.2.3 «Методы поиска многомерных классифицирующих закономерностей» рассмотрены основные задачи распознавания образов:
> автоматическая классификация;
> поиск наиболее важных для классификации параметров (признаков);
> обучение ЭВМ распознаванию образов (классификации объектов).
Кратко рассмотрены методы решения задач распознавания образов.
На основе опыта применения различных алгоритмов нами сформулированы основные критерии выбора программ обучения ЭВМ классификации объектов, обеспечивающих наиболее эффективное решение химических задач:
> возможность анализа больших объемов данных;
> возможность определения качественных классифицирующих закономерностей при анализе малых обучающих выборок;
> автоматическое исключение неинформативных свойств;
> возможность работы в условиях слабого выполнения основной гипотезы распознавания образов - гипотезы компактности; быстрое обучение и прогнозирование;
> возможность работы с пропусками в некоторыхзначенияхсвойств;
> возможность работы со свойствами, имеющими качественную природу (т.е. со свойствами, которые нельзя выразить в виде числа);
> высокая точность при решении химических задач;
> удобный интерфейс пользователя.
С точки зрения выдвинутых критериев рассмотрены некоторые алгоритмы решения задачи распознавания образов с обучением. Подробно описан алгоритм обучения ЭВМ, применяющий специальную ассоциативную организацию памяти ЭВМ - растущие пирамидальные сети*), разработанный в Институте кибернетики НАН Украины. В этом алгоритме многомерная классифицирующая закономерность, получаемая в результате обучения ЭВМ, имеет вид сетевой ассоциативной структуры (растущей пирамидальной сети), представленной в памяти компьютера в виде набора взаимосвязанных узлов. Пирамидальная сеть может также выдаваться в виде конъюнктивно-дизъюнктивного логического выражения. Показано, что этот алгоритм, используемый в настоящей диссертационной работе для решения задач конструирования неорганических соединений, наиболее удовлетворяет критериям, сформулированным выше.
В п.2.4 «Обзор исследований по конструированию неорганических веществ и материалов» дан аналитический обзор работ по применению методов искусственного интеллекта для прогноза новых неорганических веществ, которые были проведены в мире. Экспериментальная проверка результатов, полученных в этих исследованиях, доказывает эффективность использования предложенного подхода к конструированию неорганических веществ.
В главе 3 «КОНСТРУИРОВАНИЕ НЕОРГАНИЧЕСКИХ СОЕДИНЕНИЙ, ПЕРСПЕКТИВНЫХ ДЛЯ ПРИМЕНЕНИЯ В ЭЛЕКТРОНИКЕ» даны основные результаты использования предложенного компьютерного подхода. Результаты компьютерного конструирования соединений
*) Гладун В.П. Эвристический поиск в сложных средах. Киев: Наукова думка, 1977. - 166 с.
представлены в виде таблиц. Они содержат прогнозы возможности образования сотен новых соединений в тройных и четверных системах. Для большинства новых соединений предсказан тип кристаллической структуры при нормальных условиях. Прогнозирование осуществлялось с использованием только свойств химических соединений и/или более простых соединений (простых галогенидов, халькогенидов или оксидов — в зависимости от состава сложных соединений), например, потенциалов ионизации, энергий кристаллической решетки, температур Дебая, стандартных изобарных теплоемкостей и энтропии индивидуального вещества, температур и теплот плавления и кипения, типа незавершенной электронной оболочки p, d, данных о распределении электронов по энергетическим оболочкам изолированных атомов, радиусов (ионных, ковалентных, атомных), электроотрицательностей и других свойств элементов, а также стандартных энтальпий образования, энтропии, изобарных теплоемкостей, энергий Гиббса, температур плавления и прочих свойств соответствующих простых соединений. Следует отметить, что при компьютерном конструировании соединений используемая система искусственного интеллекта сама отбирает из всей совокупности введенных параметров компонентов те интервалы изменения значений свойств, которые являются наиболее важными для классификации химических систем. Однако выбор исходной совокупности параметров компонентов выполняется специалистом, отбирающим информацию для компьютерного анализа. Подробно описана методика применения методов обучения ЭВМ, используемая в настоящей диссертационной работе при конструировании неорганических соединений: постановка задачи, выбор примеров для обучения ЭВМ, отбор исходной совокупности свойств компонентов, проведение обучения ЭВМ на примерах известных соединений, прогнозирование с использованием свойств компонентов. Особое внимание уделено различным способам повышения достоверности прогнозирования, разработанным нами, в первую очередь: оптимальной дискретизации свойств компонентов, позволяющей уже на стадии предобработки данных найти интервалы изменения значений свойств химических элементов и/или более простых соединений, которые
соответствуют разным классам химических систем, и принятию решения о принадлежности соединения к тому или иному классу на основе сравнения результатов прогноза с использованием различных совокупностей свойств компонентов, которое дает возможность уменьшить ошибку прогнозирования, связанную с неправильной классификацией соединений, информация о которых использована для обучения ЭВМ, неточной дискретизацией свойств, малым количеством примеров для обучения и т.д.
П.3.2 «Конструирование соединений, перспективных для разработки новых полупроводниковых материалов» содержит результаты конструирования новых фаз, перспективных для поиска полупроводниковых веществ. При выборе составов и кристаллохимических типов конструируемых фаз был использован генетический принцип, предложенный Резом*) заключающийся в том, что новые соединения с особыми физическими свойствами целесообразно искать среди семейств веществ, в которых хотя бы один из представителей обладает явно выраженными такими свойствами. На основе анализа информации разработанных баз данных нами были выбраны наиболее распространенные по составу и типу кристаллической структуры классы соединений, представители которых проявляют полупроводниковые свойства. Далее было осуществлено прогнозирование новых соединений наиболее распространенных составов и типов кристаллической структуры, существующих при нормальных условиях.
В п.п.3.2.1 «Соединения состава АВ2Х4 (X = Э, Бе, Те)» приведены результаты компьютерного конструирования новых соединений состава
подобных известным фазам 2пСг25е4, СиСг2Зе4, РеСг234 — халькогенидным магнитным полупроводникам со структурой шпинели. В табл.1 приведена часть результатов компьютерного конструирования соединений состава А|1В|||2Зе4.
*) Рез И.С. О некоторых вопросах кристаллохимии пьезоэлектриков // Кристаллография. 1960. Т.5. №1. — С.63-70.
Часть результатов конструирования соединений состава А"В|И25е4 (прогноз возможности образования при нормальных условиях)
А» В1" V Сг Мп Ре Со К! Си Ъп Бг са Яп Вя Тш
А1 + + + + + + + © Ф © + © © ?
Бс + + © + + + + + + + + + + +
■п © © © © © © + + + + + ? +
V © © © © © © + + Ф + + ? +
Сг © © © © © © © ® Ф © + © +
Мп + + + + + + © © + + + ? +
ва + + © © + © © © Ф © © +
.Ая - © © © + © о ©
У + + © + + + + + © © + © © +
Н1| + ® . + © © © © + + + + ? +
1п + + © © + + + Ф © © <гЛ Ф © +
вп + + + + ® + + + +
вь + + © © © + + Ф © © © ©
Ьа + © + + + + + + © © © © © +
Се + Ф + + + + + + Ф Ф © Ф Ф +
Рг + © + + + + + © © ф © © +
N(1 4- © + + + + о + © © © © © +
Рш ? + + + + + + + + + + + + +
Бт + © + + + + ■ + + © © © © + +
Ей + © + + + + + + + + + + + +
ва + © + + Ф © © © Ф +
ть + © + + + + + + © © + © © +
Оу + © + + + + + © © Ф © Ф © +
Но + © + + + + + + © © + © © +
Ег + © + + + + + + © © © © © +
Тш + © + + + + + + © © © © © ©
УЬ + © © + © © © © © +
Ьи + © © + + + + + © © © © © +
Т1 © + + + + + + + © + + ?
В1 + + © © + + + <9 © Ф © © © ©
Обозначения: + — прогноз образования соединения при нормальных условиях;
--прогноз отсутствия соединения; © — информация о существовании соединения
использована для обучения ЭВМ; <-> — соединение не образуется, и этот факт использован для обучения ЭВМ; © — прогноз образования соединения подтвержден экспериментом; ® — прогноз образования соединения не подтвержден экспериментом; ? — неопределенный прогноз; пустые клетки — несовпадения прогнозов по разным системам свойств.
Часть результатов компьютерного конструирования соединений состава А||В"|25е4 (прогноз типа кристаллической структуры при нормальных условиях)
в"1 А" А1 Сг Са У 1п Ьа Се Рг N(1 Рш вт Ей ва ТЬ
Мд *© *© т
Са (Р) (Р) (V) (*) т
ТЧ (К)
V (Ы)
Сг (Ю т (Т) (Т) (Т) т (Т) С) (*)
Мп <*) (*) т
Ре (С)
N1 (К)
Си (в) (*) - о
Ъп (С) (Э) (С) (С) т
вг (Р) п (Р) р© ТО (р)
У (Т) (Т) т т т т
Сс1 со (Я) (С) (8) (С) (Т) СП (Т)
Ва И (*) (Р) (Р) т© (р) (Р)
Ьа т т т т Е
Се т т (Т) т т т т Т
Рг т т (Т) (Т) т т т Т
N<1 (Т)
Рш т т
вш т (Р) т© ТО т© (Т) т (Т) т Т©
Ей (Р) С) (Р) (Р) (Т) (Т) (Т) (Т) (Т) р (Т) (Т)
вй т т©
ТЬ Р т т т , И
»у р т т т р р
Но р т т т р р
Ег р т т т р р
Гш т т р
УЬ (Р) (Р) (Р) <-» <-> <-> о
Ьи т т Е р
щ (С) (С) Р
РЬ (Р) *© (Р) (Т) (Т) (Т) (Т) (Т) ? р р
Обозначения: Э — шпинель; С — халькопирит; Р — РЬСа2Зе4; У — УЬ38а; Р — СаРе204; Т — ТИЭР4; N — №Сг2в4; * — прогноз кристаллической структуры, отличной от
приведенных выше;--прогноз отсутствия соединения; пустые клетки —
несовпадения прогнозов по разным системам свойств; в круглые скобки заключены примеры, использованные для обучения ЭВМ; <-> — соединение не образуется, и этот факт использован для обучения ЭВМ; значок © — прогноз подтвержден экспериментом.
Далее для соединений состава было осуществлено
прогнозирование возможности их кристаллизации при нормальных условиях в одном из типов структуры, например, шпинели, халькопирита, ТЬ3Р4, СаРе204, оливина, МЮг234, РЬСа2Зе4, УЬ334 и т.д. В табл.2 в качестве примера приведена часть результатов прогноза типа кристаллической структуры соединений состава Сравнение
результатов компьютерных расчетов с новыми экспериментальными данными показывает, что ошибка прогноза возможности образования соединений состава АВ2Х4 составляет 18 %, а ошибка прогнозирования типа кристаллической структуры равна 9 %.
Пл.3.2.2 «Соединения состава АВХ2 (X = 5, Бе, Те)» содержит результаты компьютерного конструирования сотен соединений состава АВХ2, подобных известным полупроводниковым фазам состава Си6аЗе2, Ыа1п32 и т.д. В табл.3 приведены прогнозы возможности образования соединений АВХ2(Х = 3, Эе) при нормальных условиях. Для соединений далее было проведено прогнозирование возможности кристаллизации при нормальных условиях в наиболее распространенной кристаллической структуре типа а-ЫаРе02. Результаты компьютерного конструирования соединений АВХ2были проверены экспериментально. Средняя ошибка предсказания: возможности образования соединений состава АВХ2 составляет 11 %, а типа кристаллической структуры — 18%. Некоторые из предсказанных соединений позже были синтезированы различными исследователями и у них были обнаружены полупроводниковые свойства: №1пЗе2 (ДЕ = 2.8 эВ), У1п32 (АЕ = 3 эВ), Т1РгЗе2 (ДЕ = 1.18 эВ) и т.д.
В п.п.3.2.3 «Соединения состава АВХ (X = Р, As, Sb, Bi)» даны результаты компьютерного конструирования сотен эквиатомных соединений состава АВХ с наиболее распространенными типами структур: "П1\П31, гг1\ПА1 и РЬРС1 — для соединений АВР и АВАэ, РЬРС1 и МдАдАэ для ABSb и МдАдАэ — для АВВк Эти соединения являются аналогами известных полупроводниковых фаз: Се^Лв, ТЮоЗЬ и т.д. В табл.4 приведен пример компьютерного конструирования соединений состава ABBi.
Часть результатов компьютерного конструирования соединений состава А'В^Хг (прогноз возможности образования при нормальных условиях)
X Б 8е
А1 В1" 1л № к Си ш> Н Св N3 К Си ИЬ А8 Св Т1
В © © © © + © + + + ©
А1 © © + © + © © © © + © + ф
8с © © + © + + + + + + © + © + +
Т1 е © © © © + ф © © + + + + + +
V © © + + + + + © © + + + + + +
Сг © © © © © © + + © + Ф Ф © + ©
Мп + + + + + + + © © + + © + © +
Ее + © © © © © © + + © © © © © ф
№ + + + © + + + + © + + + © + +
Са © © © © © © © + + © © + ф © ф
Ав + © © © + Ф + Ф © Ф © ф ф © ф
У © © © © + © + © © + © + ф + ©
1п © © © © © Ф ф © © © © © ф + ф
Ьа © © © © © <-> © © © <->
Се © © © © © © © Ф + © + +
Рг © © © © © + © + © © о + ©
N<1 Ф © © © © + © © + © © о + ©
Бш © © Ф Ф © Ф + © © + © © + ф
Ей в © © © ф © + + Ф + Ф + + ®
01 е © © © ф © + © Ф + © © © + ф
ТЬ © © © © © © + © © + © © © + ©
пу © © © © © © © Ф + © + © + ©
Но © © © © © ф + © Ф + Ф © Ф + ©
Ег © © ® Ф © © + © Ф + Ф © Ф + ©
Тш © © © Ф © ф + + + + Ф + © + ©
УЬ © © © © © © + + + + Ф + Ф + ф
Ьи © © © © © © + + + + © © © + ©
Т1 + + © Ф ф © © © © Ф ф © +
Обозначения: + — прогноз образования соединения при нормальных условиях;
--прогноз отсутствия соединения; Ф — информация о существовании соединения
использована для обучения ЭВМ; <-> — соединение не образуется, и этот факт использован для обучения ЭВМ; © — прогноз образования соединения подтвержден экспериментом; в — прогноз образования соединения не подтвержден экспериментом; пустые клетки — несовпадения прогнозов по разным системам свойств.
Сравнение результатов компьютерного конструирования с новыми экспериментальными данными показало, что средняя ошибка прогноза для эквиатомных фаз — менее 28 %.
Таблица 4.
Часть результатов компьютерного конструирования соединений состава ABBi со структурой типа MgAgAs
А В Са N1 Р(1
N1 М
Ва м М
Ьа М м© м©
Се М (М) (М)
Рг М© м© м©
N<1 М© м© м©
Рш М м м
Бш М© м© м©
Ей м м м
С(1 (М) (М) (М)
ТЬ м© м© м©
»У (М) (М) (М)
Но м© (М) (М)
Ег м© м© (М)
Тш (М) м© м©
УЬ м (М) (М)
Ьи м© м© м©
Обозначения: М — прогноз кристаллической структуры типа МдАдАэ; (М) — примеры соединений со структурой МдАдАэ, использованные для обучения ЭВМ; значок © — прогноз подтвержден экспериментом; пустые клетки — несовпадения прогнозов по разным системам свойств.
П.3.3 «Конструирование соединений, перспективных для использования в качестве новых сегнетоэлектрических, пьезоэлектрических, акустооптических, электрооптических и нелинейнооптических материалов» иллюстрирует возможности компьютерного подхода к конструированию неорганических соединений, перспективных для применения в сегнетоэлектрических, пьезоэлектрических, акусто-оптических, электрооптических и нелинейнооптических устройствах. При выборе объектов для конструирования был использован генетический принцип Реза, а также информация о том, что линейный электрооптический эффект, пьезоэлектрический эффект и эффект генерации второй гармоники
возможны только в нецентросимметричных (ацентричных) кристаллах. В соответствии с этими принципами проведен анализ информации разработанной нами БД «Кристалл» и выделены перспективные составы и кристаллохимические семейства для последующего прогнозирования аналогов.
В п.п.3.3.1 «Халькопириты состава АВХ2» приведены результаты компьютерного конструирования десятков новых халькопиритов - аналогов фаз, применяемых для параметрического преобразования частоты лазерного излучения, - гпСеР2,Ад6а52иСсЮеА52. В табл.5 дана часть результатов компьютерного конструирования халькопиритных фаз состава
Таблица 5.
Часть результатов компьютерного конструирования халькопиритов состава АВХ2
В А X Mg Са вг Ва Ъп са
Р (С) * (С) (С)
Ая - - - - (С) (С) -
81 вь
в - - - - - -
8е - - - - 4 -
Те - - - - - о -
Р (*) * * * (С) (С) *
Ая С С С С (С) (С) (С)
ве вЬ с С с С в -© с
В1 - - - - - -
в - - - - -
$€ - - - -
Те - - - - <-> (С)
Р (С) (С) -
Ая - - - (С) (С) -
вЬ - - (С) -
Ьп вг о с - <->
в * - <->
ве - - о
Те - <-> <->
Обозначения: С — халькопирит; В — 3-№РеОг, — соединение состава АВХ2 не образуется в системе А-В-Х (прогноз); * — соединение состава АВХ3 имеет при нормальных условиях структуру, отличную от приведенных выше (прогноз); — соединение состава АВХ2 не образуется, и этот факт использован для обучения ЭВМ; пустые клетки — несовпадения прогнозов по разным системам свойств; в круглые скобки заключены примеры, использованные для обучения ЭВМ; значок © — прогноз подтвержден экспериментом; £ — прогноз не подтвержден экспери-
АВХ2. Приведены также результаты прогноза халькопиритов составов АВХ2 (А = 11, N8, К, ЯЬ, Се, Ад, Аи, гп, Сс1, Нд; В = А!, ва, !п, Т1, Ре, Со, 1М1; X = О, Б, Бе, Те) и СОУ2 (С = и, На, К, ЯЬ, Се; 0 = Р, Аб, БЬ, В"|; У = N. Р,
П.п.3.3.2 «Соединения состава-АВ03 с кристаллическими структурами искаженного ильменита и перовскита» содержит результаты конструирования сотен новых оксидных соединений АВ03. Особое внимание уделено конструированию новых фаз со структурами перовскита и ильменита, в том числе и с искажениями идеальных решеток. Среди них ранее уже обнаружены соединения
РЬ2г03и т.д., применяемые в пьезоэлектрических, электрооптических, сегнетоэлектрических, нелинейнооптических, акустооптических устройствах. Табп.6 содержит результаты компьютерного конструирования соединений состава А2+В4+03. Экспериментальная проверка полученных результатов показала, что ошибка прогнозирования возможности образования соединений состава АВ03 равна 10 %, а ошибка прогноза типа кристаллической структуры — менее 16 %. В прогнозированных соединениях разными исследователями обнаружены сегнетоэлектри-ческие свойства, например, температура Кюри Сс1НГОзТс= 153 К, а для РЬТеОз —Тс = 473 К.
В п.п.3.3.3 «Соединения состава АВР5 с кристаллическими структурами типа представлены результаты
компьютерного конструирования десятков новых соединений состава ABF5 сацентричными структурами (табп.7). С использованием методов обучения ЭВМ были найдены закономерности, связывающие возможность образования соединений состава со свойствами химических элементов А и В и простых фторидов. Были также построены классифицирующие закономерности, разделяющие различные кристаллохимические семейства соединений состава АВР5: с кристаллической структурой типа ВаРеР5, Ва6аР5, СаСгР5, СаРеР5 или вгРеР5. Прогнозы соединений с ацентричными кристаллическими структурами, относящимися к типам наиболее
важны для поиска новых пьезоэлектрических, электрооптических и
Часть результатов компьютерного конструирования соединений состава А2+В4+03 (прогноз возможности образования при нормальных условиях)
А2+ в4+ Ве м8 Са Мп Ее Со N1 Си Ъп вг Р<1 Сё 8п Ва н8 РЬ
с <-> © ' © © © © © © © © + © © © © ©
© © © © © © © © © + © © © + ©
в © © © © + + © + © © © © ©
Т| © © © © © © © © © © © + © © ©
V © © + © © © + © + © + © © ©
Мп + © © + © © © © © © + © © © + ©
Се + © © © © © + © © © + © + © + ©
ве © © © © © © © © © + © + © © ©
Ъг © + <-> + + + © © + © + © + ©
Мо © © © © © © + © © + + + © + +
Тс © + + + + + + © + + + © + ©
Яи © + + + + + + © ® + + © + ©
вп © © + © © + © © + © + © + ©
Те © © © + © © © © © + © + © © ©
Се © © + + © + © © + ©
Рг + + © + + © + +
ТЬ - - + + + © + + ©
НГ © + + + + + © + © © © ©
Та + + + + + + + + + + © +
Ие - - + + + + + + + + + + + ©
Ов - - © + + + + + + © + © + ©
1г © + + + + + + © + + + ©
- - © + + + + + + + + + +
РЬ © © © + + © © © + © © © ©
Ро + + + + + + + © + + + ©
ТЬ © © + + + + + + © + © + © ©
и о © +. + © + + + © + © + ©
Обозначения: + — прогноз образования соединения при нормальных условиях; — прогноз отсутствия соединения; © — информация о существовании соединения использована для обучения ЭВМ; <->— соединение не образуется, и этот факт использован для обучения ЭВМ; © — прогноз образования соединения подтвержден экспериментом; ® — прогноз образования соединения не подтвержден экспериментом; пустые клетки - несовпадения прогнозов по разным системам свойств.
Часть результатов компьютерного конструирования соединений составаА2+В3+Р5
А1+ В* Ве Са Ке Си Ъп вг са Ва Бт Ей УЬ Н5 РЬ
В ? - В
А1 Р в С в (В) ? (О) В (В) в (В)
вс О - - <->
"Л ? (С) С * ? (в) (В) С в
V В (С) в В (8) (В) в ?
Сг С (С) с ? (В) (р) (О) ?
Мп Р р р (О) В в
Ре р (р) р р (8) (В) - - в
Со с (С) С (§) (С) о - - ■ -
N1 ? р ? ? ? (О) Б ? ?
Са с (С) С ? с (В) (О) с (В)
Ьа - <-> -
Се о - -©
Рг - - <-> -©
N(1 - <-> - - - -©
Рш - • ? - - <-> - -
вш - о - <-> - - - -
Ей - - - - - - - - -©
- <-> - -© - <-» - - -©
ть - - -©
Бу - - <-> -©
Но - <->
Ег - <-> - -©
Тш О - -© -©
УЬ <-> -
Ьи <-> В В в -©
Т1 - - (В) -
Ас С ? - - В в
ТЪ с ? - - В в
Обозначения: В — прогноз соединения состава АВР5 с кристаллической структурой типа ВаРеР5, в — прогноз структуры типа ВаОаР5, С — прогноз структуры типа СаСгР,, Р — прогноз структуры типа СаРе!%, (в) — известное соединение со структурой ЭгРеР5 (данные использованы для обучения ЭВМ), — соединение состава АВр5 не образуется в системе АРг - ВР3 (прогноз); * — соединение состава АВР5 имеет при нормальных условиях структуру, отличную от приведенных выше (прогноз); <-» — соединение состава АВРд не образуется, и этот факт использован для обучения ЭВМ; в круглые скобки заключены примеры, использованные для обучения ЭВМ; пустые клетки - несовпадения прогнозов по разным системам свойств; ? — неопределенный прогноз; значок © — прогноз подтвержден экспериментом.
нелинейнооптических веществ. Проведенная экспериментаторами проверка наших прогнозов для 14 составов (ВаР2-НР3 (И = Сс!, Ег и Тт) и РЬР2-КР3 (К = Ей, Сс1, ТЬ, Оу, Ег, Тт и Ьи)) полностью подтвердила полученные теоретические результаты.
П.п.3.3.4 «Соединения состава А2В2(Х04)3 (X = Б, Сг, Мо, W) с кристаллической структурой типа лангбейнита» включает результаты компьютерного конструирования более сложных по составу соединений -лангбейнитов, перспективных для разработки новых сегнетоэлектри-ческих, электрооптических и пьезоэлектрических материалов. В табл.8 дана часть результатов прогноза типа кристаллической структуры соединений состава А2В2(Х04)3 при нормальных условиях. Из 17 экспериментально проверенных составов А2В2(Х04)3 в 12 случаях прогнозы, полученные с использованием компьютерного конструирования, совпали с экспериментальными данными, т.е. в этом случае достоверность прогнозирования равна 70 %.
Таблица 8.
Часть результатов компьютерного конструирования соединений состава А2В2(Х04)3
X в Сг Мо
А В N8 к яь Сз Т1 № к ИЬ с$ Т1 N3 к ИЬ с* Т1 к кь С* Т1
мг 14 (Ь) (Ь) <-> ь ь ь© ь© ио щ (К) (Ц (Ь) 00 (*) 00 ь© ь
Са (Ь) ь© (Ь) <-> ь ь ь <-» ? ? 7 ? - 7 7 ?
Мп <-> (Ь) (Ь) ь (Ь) ь 00 ь© ь к (*) (Ь) (Ь) 00
Ре - ь© ьо 00 ь к ь ь ъ к к 7 7 7 к
Со <-> (Ь) ь© 00 ъ к ь ь ъ (К) (Ь) (Ь) (*) к.
N1 (Ь) ь© ь ь ь ь ь ь к (К) 00 (Ь) (Ь)
Си ь - ь 1 к ь ь ь к. (К) 7 7 7 к
Ха - ь - ь 1 к. 1 ь ь (*) (К) (К) * (К) щ
Бг <-> ? ? <-» - - ? ? ? <-> ? 7 7 7 • - - -
са (Ь) 00 00 к (*) (Ю и 1 ь ь
Ва о о о <-> - - о - - - -
РЬ - <-> - -© - - <-> -© о "0 - ■ о <-> -
Обозначения: I. — прогноз образования соединения с кристаллической структурой лангбейнита; К — прогноз образования соединения со структурой типа К2гп2(МоС>4)3;
--прогноз отсутствия соединения состава А2В2(Х04),; * — прогноз соединения с
типом кристаллической структуры, отличным от лангбейнита или К2гп,(Мо04)3; в круглые скобки заключены примеры, использованные для обучения ЭВМ; <-> — соединение состава А2В2(Х04)3 не получено, и информация об этом была использована для обучения ЭВМ; пустые клетки - несовпадения прогнозов по разным системам свойств; ? — неопределенный результат; значок © — прогноз подтвержден
РОС НАЦИОНАЛЬНАЯ
БИБЛИОТЕКА | 33
В п.3.4 «Конструирование соединений, перспективных для использования в качестве новых магнитных материалов» генетический принцип поиска новых веществ с заданными физическими свойствами распространен на соединения, проявляющие магнитные свойства: окисные шпинели, фазы с кристаллической структурой типа ~П1Сг28!2, фазы Гейслера и т.д.
В п.п.3.4.1 «Соединения состава ,АВ204 со структурой шпинели» приведены результаты компьютерного конструирования десятков новых оксидных шпинелей - аналогов известных ферримагнитных и антиферромагнитных фаз СиСг204, РеСг204, РеСо204, №Мп204, ЛЯдЯ^О^ 2пРе204, МпРе204 и т.д. В табл.9 даны результаты экспериментальной проверки прогнозов возможности образования соединений состава А2+В3+204. Средняя ошибка прогноза возможности образования соединений состава АВ204 с использованием предложенного подхода к конструированию соединений - меньше 7 %, а средняя ошибка прогноза шпинельной структуры равна 10 %.
П.п.3.4.2 «Соединения состава АВ^ (X = А1, Се, Р, Аэ, БЬ) с кристаллической структурой типа ТЪСг25"12» содержит результаты компьютерного конструирования более сотни соединений со структурой типаТЬСГгЭ^, перспективныхдля поиска новых магнитных материалов. Втабл. 10 приведены примеры прогноза соединений АВ2512 со СТТЬСг2312. Сравнение результатов расчетов с экспериментом показывает, что средняя ошибка прогноза соединений состава АВ2Х2 со СТ ТЬСг2312 составляет 8 %. Многие предсказанные соединения со структурой ТЬСг^г синтезированы разными исследователями и у них измерена температура Нееля (Тц) и температура Кюри ("Гц), например, для Сс1Ви25'!2
= 47 К, для НоНи2812 Тц = 56 К, для НоИи26е2 = 37 К, для 1)Си2312
Результаты компьютерного конструирования десятков фаз Гейслера (кристаллическая структуратипа А1МпСи2)составовДВХ2(Х-Со, Си или Рс1) и АВ2Х (Х-А1, ва или 1п) - аналогов известных ферромагнитных соединений МпСа№2, Мп1п№2 и т.д., обобщены в п.п.3.4.3 «Фазы Гейслера состава АВХ2». Приведены результаты экспериментальной
Часть результатов конструирования соединений состава А|1В,||204 (прогноз возможности образования при нормальных условиях)
А» В111 Ве Са И V Мп Ре Со № Си Хп ве Бг Сс! Ва щ
А1 © ф © © Ф Ф Ф Ф © Ф о Ф Ф Ф о
Бс © © + + + + + + <-> © + © © Ф +
Т1 © © + + Ф © + + + + © + © +
V © Ф + + Ф Ф Ф + + Ф Ф © + ©
Сг ® ф Ф + + Ф © Ф Ф © Ф + Ф © Ф ©
Мп © Ф © © Ф © Ф © Ф © © © © +
Ре ф © © Ф Ф © Ф Ф Ф Ф © Ф © © +
ва Ф ф Ф + + © © © Ф Ф © + ® © Ф +
А$ © © + + + © © © Ф © + + © + +
№ ф Ф + + © + Ф © © Ф - © © © +
1п О ф © + © <-» Ф © Ф
въ ф © + + © Ф Ф © © Ф + © + + +
Ьа <-> + + © + © © © + © о Ф ©
Се О <-> + + + © + + © + + © +
Рг - о <-> + + © + © Ф Ф + + <-» + Ф
N<1 О <-> + + © + © Ф Ф + + Ф Ф
вт о + + + + © Ф © © + Ф Ф
Ей - <-> - © + + + + Ф © © + Ф + Ф ©
Сё <-> + + © + + Ф © + + Ф + © ©
ТЬ - <-> + + ® + + <-» + + + Ф Ф
Бу - <г-> + + ® + + <-> © + + Ф + Ф +
Но О о + + ® + + © + + Ф + Ф ©
Ег - <-> 0 - + ® - - Ф - © -
Тш - <-> - + + - - Ф Ф -
УЬ о © + + ® + + ® + + Ф © Ф +
Аи - 0 © + © + ©
Т1 - + © © © + ©
В| О © + © © ©
Обозначения: + — прогноз образования соединения при нормальных условиях;
--прогноз отсутствия соединения; Ф — информация о существовании соединения
использована для обучения ЭВМ; <-> — соединение не образуется, и этот факт использован для обучения ЭВМ; © — прогноз образования соединения подтвержден экспериментом; ® — прогноз образования соединения не подтвержден экспериментом; пустые клетки - несовпадения прогнозов по разным системам свойств; О — прогноз отсутствия соединения состава АВ,04 подтвержден экспериментом; 0 — прогноз отсутствия соединения состава АВ2С)4 не подтвержден экспериментом.
Результаты компьютерного конструирования соединений состава АВ2512 с кристаллической структурой типа ТИСг^^
В А Сг Мп Ре Со N1 Си Хп Ки ЯЬ Р«1 Ag 0$ 1г Аи
Са + ф <-> ф ф ф ф + + © © + + + ©
Бг ф ф ф © ф - - © © ©
У ф ф ф ф ф - - + © + 0
Ва + ф + ф ф е ф + ® + © + ® + ф
Ьа + ф ф ф ф © ф ф © © © + © ф ©
Се <-> ф ф ф ф © ф ф ф ф © © ф ф
Рг + ф, ф ф ф © ф © + -© ф © © + ф
N<1 ф ф ф ф © ф ф + © ф + © ф ф
Р«й + + + + ф + + + + + + + + + +
вга © ф ф ф ф © + ф + © © + © ® ©
Ей + ф ф ф © © + © © ф + + ф ф
Сс! © ф ф ф ф © + © © ф ф © ф ф ф
ТЬ © ф ф ф ф © + ф © © + © © + ©
»У © ф ф ф ф © + © © © + + + ф ф
Но © ф ф ф ф © + © +. © + © + ® ф
Ег © ф ф ф ф © + ф © © + © © ф ©
Тш © © ф ф ф © + © + © + + + ф +
УЬ © ф ф ф ф © + ф © © © + + ф ©
Ьи © © ф ф ф © + © © © + + + ф +
Ас + + + + + + + + + + + + + +
ТЬ ф ф ф ф ф ф © © © + © © © ©
Ра + + + + + + + + + + + + +
и © © © ф © © © © + © ф © ©
ГОр ф ф ф ф ф + + + + + + + +
Ри + + + + + + + + + + + + +
Аш + + + + + + + + + + + + + +
Сш + + + + + + + + + + + + +
Обозначения: + — прогноз структуры типа ТИСг2812; - — прогноз отсутствия соединения со структурой типаТЪСг28|2 в системе А-В-в1; ® - информация о соединении со структурой ТЬСг2812 использована для обучения ЭВМ; <-» — в системе А-В-Э! не обнаружено соединение состава АВ2812 или оно существует, но имеет структуру, отличную от ТЬСгг&г, и этот факт использован для обучения ЭВМ; © — прогноз структуры типа ТКсг281? подтвержден экспериментом; в — прогноз соединения со структурой типа ТЬСг2812 не подтвержден экспериментом; 0 — прогноз структуры, отличной от ТЬСГгЭ^, не подтвержден экспериментом; пустые клетки - несовпадения прогнозов по разным системам свойств.
Часть результатов компьютерного конструирования фаз Гейслера состава АВСи2
А В и Ве А1 К вс V Сг Ре Со N1 Са Се У мь Мо Яи Ш1 Ра 1п
Ъп +
С,а + + + © + + + + + О - +
1п + + + © + + + + + + + © + + + + + ®
вл О - О - - - ® © Ф - - - <-> - - - - ©
Ьи ©
Та - <-> - - - - - - +
Аи +
Т1 - - +
РЬ - - О - - - - - - - - - - - - - - - О +
Обозначения: + — прогноз фазы Гейслера; — прогноз отсутствия фаз Гейслера; © - информация об известной фазе Гейслера использована для обучения ЭВМ; <-> — в системе А-В-Си не обнаружено соединения состава АВСи2 или оно существует, но имеет структуру, отличную от А1МпСи2, и этот факт использован для обучения ЭВМ; © - прогноз фазы Гейслера подтвержден экспериментом; О — прогноз соединения со структурой, отличной от А!МпСи2, подтвержден экспериментом; ® — прогноз фазы Гейслера не подтвержден экспериментом; пустые клетки - несовпадения прогнозов по разным системам свойств.
проверки прогнозов фаз Гейслера, которые свидетельствуют о том, что в этом случае средняя ошибка предсказания составляет 16 %. Многие предсказанные фазы проявляют магнитные свойства, например, Тм = 58 К для Ад1пТЬ2, Тм =10 К для Ад1гЮс12 и т.д. Табл.11 содержит прогнозы новых фаз Гейслера состава АВСи2.
Следует отметить, что разделение различных классов соединений на вещества с перспективными полупроводниковыми, магнитными, сегнетоэлектрическими и прочими физическими свойствами достаточно условно. Например, оксидные соединения со структурой перовскита, халькошпинели и эквиатомные пниктиды могут иметь перспективные для применений магнитные свойства и т.д. Полупроводниковое соединение 1Лп82, предсказанное нами, проявляет также и нелинейно-оптические свойства и т.д.
Приведенные выше таблицы включают результаты прогноза, полученные нами в разные годы. Большинство из таблиц содержат
несколько несовпадений прогнозов с новыми экспериментальными данными. Преимуществом предложенного нами подхода является возможность быстрой коррекции классифицирующего закономерности при появлении новых данных, противоречащих старому критерию классификации. Такая адаптация системы конструирования неорганических соединений к изменению анализируемого массива данных позволяет последовательно уточнять классифицирующие закономерности и прогнозы при появлении новой экспериментальной информации.
В п.3.5 «Кибернетико-статистический подход к конструированию новых веществ с заданными свойствами» рассмотрены принципы подхода, являющегося дальнейшим развитием методологии компьютерного конструирования новых веществ. Основной идеей подхода является сочетание рассмотренной выше методологии прогнозирования на основе применения методов искусственного интеллекта со статистическими методами планирования экстремальных экспериментов (либо другими методами оптимизации). Сначала с использованием баз данных и методов обучения ЭВМ конструируются соединения с заданными функциональными свойствами и выбирается технология их получения (теоретический этап). Далее с использованием, например, статистических методов планирования экспериментов проводится экспериментальный поиск оптимальных условий получения и/или обработки, соответствующих экстремальному значению функционального свойства (свойств), для конкретного, сконструированного на первом этапе соединения (теоретико-экспериментальный этап). На этом этапе за счет одновременного варьирования всех параметров процесса удается сократить время и затраты на разработку технологии получения новых соединений. Эффективность использования предложенного кибернетико-статистического подхода подтверждена на примере прогноза сверхпроводящих сульфидных фаз Шевреля и оптимизации технологии их синтеза, позволившей максимизировать критическую температуру перехода в сверхпроводящее состояние.
В заключении рассмотрена роль компьютерного конструирования неорганических соединений как перспективного средства автоматизации
разработки новых веществ с заданными свойствами. Предложенный подход является универсальным. С его помощью нами было осуществлено конструирование тысяч новых неорганических соединений с различным типом химической связи: ионным, ковалентным, интерметаллическим. Помимо указанных выше, были получены прогнозы новых соединений составов: АВХ (X=А1, Са, ве, Бе, Рс1,1п, Те), А2ВХ2 и АхМоеХд (X = Б, Бе), АВОг, АВХ3 (X = Г, Б, С1, Бе, Вг, Те, I), АВХ4 (X = О, Р, С1, Вг, I), АВ2Х4 (X = Р, С1, Вг, I), А2В2Х7 (X = О, Б, Бе), А^БОД * В^БО^, А(1\Ю3)Х * В(М03)у, АВ004 и т.д. Для большинства этих соединений было проведено прогнозирование типа кристаллической структуры при нормальных условиях. С помощью методов обучения ЭВМ оценены некоторые свойства предсказанных соединений, например, критическая температура перехода в сверхпроводящее состояние фаз Шевреля составов АхМо6Х8 (X = Б, Бе), концентрационные интервалы для компонентов R, R' и R" в соединениях состава Нх.уЯ'2.м,Н"к.тСи04, в которых реализуются различные кристаллические модификации ВТСП Т-фаз:
Обсуждены трудности, возникающие при практической реализации предложенного подхода: проблемы выбора совокупности свойств компонентов для описания сложных неорганических систем, влияние достоверности анализируемой информации на ошибку прогнозирования, проблемы дискретизации целевых свойств, возникающие при конструировании неорганических фаз с заданными количественными параметрами (температурами плавления, шириной запрещенной зоны, электрооптическими коэффициентами и т.д.), физическая интерпретация сложных закономерностей, полученных в результате компьютерного анализа экспериментальных данных, сложность использования существующих компьютерных систем конструирования веществ, а также пути преодоления существующих трудностей. Одним из наиболее перспективных направлений, позволяющих частично решить указанные выше проблемы, является использование разрабатываемой нами в ИМЕТ РАН информационно-прогнозирующей системы (ИПроС) (рис.6). ИПроС предназначена для поиска данных об изученных соединениях, прогноза
Рис.6. Схема информационно-прогнозирующей системы
еще неполученных фаз и оценки их свойств. В ее состав входят база данных по свойствам неорганических соединений «Фазы», связанная с другими БД ИМЕТ, БД по свойствам химических элементов, подсистемы обучения и прогноза, основанные на методах искусственного интеллекта, база знаний, в которой хранятся уже полученные закономерности для различных классов неорганических соединений, диалоговый процессор,
который организует общение пользователя с информационно-прогнозирующей системой, и монитор, управляющий вычислительным процессом и осуществляющий интерфейс между всеми функциональными подсистемами, а также теледоступ к системе.
Рассмотрены принципы работы и отличия ИПроС от широко применяемых экспертных систем, которые обусловлены спецификой предметной области.
Путь автоматизации научных исследований — от баз данных до компьютерных систем конструирования веществ и материалов повторяет исторический путь познания: от сбора и обработки исходных эмпирических данных до обобщения опытных фактов и построения на этой основе научных теорий, отображающих фундаментальные отношения и связи исследуемых процессов и явлений. Создание и применение систем искусственного интеллекта позволяет говорить о появлении нового вида моделирования—моделирования познавательной деятельности, инженерии знаний. Этот тип моделирования будет играть особую роль в тех областях науки и техники, в которых обычное математическое моделирование и вычислительный эксперимент часто дают плохие результаты (химия, материаловедение и т.д.).
Выводы
1. На основе комплексного анализа методов конструирования новых неорганических веществ сложного состава впервые предложен подход, использующий методы обучения ЭВМ.
2. Сравнение результатов прогноза сложных неорганических соединений, полученных с использованием компьютерного конструирования, с экспериментальными данными позволило подтвердить гипотезу о существовании периодических зависимостей между фундаментальными свойствами многокомпонентных неорганических соединений и свойствами химических элементов, входящих в их состав.
3. В результате сравнения существующих методов обучения ЭВМ и их применений в химии твердого тела и материаловедении сформулированы критерии отбора наилучших алгоритмов для компьютерного конструирования неорганических соединений и выбран метод обучения растущих пирамидальных сетей как наиболее оптимальный. Разработана методика конструирования новых неорганических соединений с использованием методов искусственного интеллекта, позволяющая получать наиболее достоверные результаты.
4. Выполнен анализ материаловедческих баз данных, на основе которого разработаны принципы организации БД по неорганическим материалам и создана не имеющая аналогов в мире распределенная система баз данных по свойствам веществ и материалов для электроники, включающая БД по фазовым диаграммам систем с полупроводниковыми соединениями «Диаграмма» и БД по свойствам акустооптических, электрооптических и нелинейнооптических веществ «Кристалл». В настоящее время БД «Диаграмма» включает информацию о 33 двойных и 10 тройных системах (объем БД свыше 60 МБайт). БД «Кристалл» содержит данные о свойствах 104 веществ (объем БД около 340 МБайт). Разработана система доступа к базам данных из сети Интернет. Проведена интеграция БД ИМЕТ РАН и разработан проект дальнейшего объединения российских БД по материалам для электроники, реализация которого позволит создать самую полную информационную систему в области электронного материаловедения.
5. Впервые разработана БД по свойствам неорганических соединений «Фазы», содержащая в настоящее время информацию о наиболее распространенных свойствах более 41 тыс. тройных соединений из более 17 тыс. систем. Объем БД - свыше 430 МБайт. Разработана система доступа к БД из сети Интернет. Показана необходимость оснащения БД по материалам системами расчета и прогноза свойств веществ.
6. Впервые проведено компьютерное конструирование соединений, перспективных для разработки новых материалов для электроники:
6.1. Сотен соединений составов: АВ2Х4 и АВХ2 (X = Б, Бе, Те), АВХ (X = Р, Аэ, БЬ, В1) и т.д., перспективных для поиска новых полу-
проводников. Предсказаны существование и тип кристаллической структуры этих соединений при обычных условиях. Средняя достоверность прогноза выше 82 %.
6.2. Сотен соединений составов: АВХ2 со СТ халькопирита и др., АВ03 со СТ ильменита, перовскита и др., АВР6 со СТ ВаРеР5, ВаСаР5, СаРеР5 и т.д., А2В2(Х04)3 со СТ лангбейнита и т.д., перспективных для поиска
новых сегнетоэлектрических, пьезоэлектрических, акустооптических, электрооптических и нелинейнооптических материалов. Средняя достоверность прогноза равна 85 %.
6.3. Сотен соединений составов: АВ204 со СТ шпинели, АВ2Х2 со СТ Т1*1Сг2812, фаз Гейслера состава АВХ2 и т.д., перспективных для поиска новых магнитных материалов. Средняя достоверность прогноза равна 90 %
7. Впервые предложен и практически проверен на примере поиска сверхпроводящих фаз Шевреля кибернетико-статистический подход к конструированию новых веществ с заданными свойствами, включающий использование баз данных по свойствам веществ и материалов, систем искусственного интеллекта для поиска новых веществ с заданными свойствами и оптимизацию технологии синтеза и обработки материалов.
8. Разработаны принципы организации компьютерной системы нового поколения для конструирования неорганических веществ - информационно-прогнозирующей системы, предназначенной для поиска данных об изученных соединениях и прогноза еще неполученных фаз и оценки их свойств.
Таким образом, итогом диссертационной работы явилась разработка нового подхода к компьютерному конструированию сложных неорганических соединений, использующего методы искусственного интеллекта для анализа информации баз данных с целью прогноза новых веществ. Эффективность предложенного подхода была показана на примерах решения задач конструирования новых соединений, перспективных для использования в электронике. При решении этих задач средняя ошибка прогноза была ниже 20 %.
Основные публикации по теме диссертации
1. Киселева Н.Н., Прокошев И.В., Дударев В.А. и др. Система баз данных по материалам для электроники в сети Интернет // Неорганические материалы. 2004. Т.42. №3. - С.380-384.
2. Киселева Н.Н. Компьютерное конструирование неорганических веществ с использованием методов обучения ЭВМ // Математические методы распознавания образов (ММРО-11). Доклады 11-й Всероссийской конференции. М.: ВЦ РАН, 2003. - С.323-326.
3. Kiselyova N.N. Computer design of materials with artificial intelligence methods // Intermetallic Compounds. Vol.3. Principles and Practice / Ed. J.H.Westbrook & R.LFIeischer. John Wiley&Sons, Ltd., 2002. - P.811-839.
4. Христофоров Ю.И., Хорбенко В.В., Киселева Н.Н. и др. База данных по фазовым диаграммам полупроводниковых систем с доступом из Интернет // Изв.ВУЗов. Материалы электронной техники. 2001. №4. - С.50-55.
5. Киселева Н.Н. Конструирование неорганических соединений с использованием баз данных и методов обучения ЭВМ // В сб. Тр.Международной научно-практической конференции KDS-2001 «Знание-диалог-решение». Т.1, Санкт-Петербург: СЗГЗТУ, 2001. - С.288-294.
6. Белокурова И.Н., Дударев В.А., Земсков B.C., Киселева Н.Н. и др. Базы данных по материалам для электроники, доступные пользователям Интернета // Информационное общество. 2001. №5. - С.24-27.
7. Kiselyova N.N. Databases and semantic networks for the inorganic materials computer design // Eng. Appl. Artificial Intelligence. 2000. №3. - P.533-542.
8. Гладун В.П., Величко В.Ю., Киселева Н.Н., Москалькова Н.М. Вывод гипотез о составе и свойствах объектов на основе аналогии // Искусственный интеллект. 2000. №1. - С.44-52.
9. Kiselyova N.N., LeClair S.R., Gladun V.P., Vashchenko N.D. Application of pyramidal networks to the search for new electro-optical inorganic materials // In: IFAC Symposium on Artificial Intelligence in Real Time Control AIRTC-2000. Preprints, Budapest, Hungary, October 2-4, 2000. - P.35-40.
10. Kiselyova N.N. Application of artificial intelligence to predict inorganic compounds promising for the search of new materials of electronics // Искусственный интеллект. 1999. №2. - С .371-377.
11. Дегтярев Ю.И., Подбельский В.В., Киселева Н.Н. и др. База данных по свойствам кристаллов акустооптических, электрооптических и нели-нейнооптических веществ, доступная из Internet // Изв.ВУЗов. Материалы электронной техники. 1999. №3. - С. 35-40.
12. Киселева Н.Н., Ващенко Н.Д., Гладун В.П. и др. Прогнозирование неорганических соединений, перспективных для поиска новых электрооптических материалов // Перспективные материалы. 1998. №3. - С.28-32.
13.Kiselyova N.N., Gladun V.P., Vashchenko N.D. Computational materials design using artificial intelligence methods // J. Alloys and Compounds. 1998. V.279.№1.-P.8-13.
14. Земсков B.C., Киселева Н.Н., Петухов В.В. и др. Банк данных по фазовым диаграммам полупроводниковых систем // Изв.ВУЗов. Материалы электронной техники. 1998. №3. - С.17-23.
15. Белокурова И.Н., Земсков B.C., Киселева Н.Н. Статистический анализ данных по фазовым диаграммам полупроводниковых систем// Неорганические материалы, 1998. Т.34, N.3. С.306-308.
16.Киселева Н.Н. Прогнозирование новых соединений состава ABF5 // Ж.неорган.химии. 1997. Т.42. №6. - С.896-899.
17. Киселева Н.Н. Применение методов искусственного интеллекта для конструирования неорганических соединений // Перспективные материалы. 1997. №4. - С.5-21.
18. Юдина Н.В., Петухов В.В., Черемушкин Е.А., Киселева Н.Н., Земсков B.C. Банк данных по свойствам акустооптических, электрооптических и нелинейнооптических веществ // Кристаллография. 1996. Т.41. №2. - С.490-495.
19. Киселева Н.Н., Кравченко Н.В., Петухов В.В. Банк данных по свойствам тройных неорганических соединений (вариант для IBM PC) // Неорганические материалы. 1996. Т.32. №5. - С.636-640.
20. Земсков B.C., Киселева Н.Н., Киселев Н.Н. и др. Банк данных по фазовым диаграммам полупроводниковых систем «ДИАГРАММА» // Неорган, материалы. 1995. Т.31. №.9. - С.1198-1203.
21.Kiselyova N.N. Information-predicting system for the design of new materials // J.AIIoys and Compounds. 1993. V.197. №2. - P.159-165.
22.Kiselyova N.N. Prediction of inorganic compounds: experiences and perspectives // MRS Bull. 1993. V.18. №2. - P.40-43.
23.Луцык В.И., Воробьева В.П., Киселева Н.Н., Смирнягина Н.Н. Классификационный прогноз ВТСП-фаз в системах R-R2-R3-Cu04 и A^-BFj// В сб. Оксидные соединения редких элементов. Синтез, структура и свойства. Улан-Удэ: изд-во БНЦ СО РАН, 1993. - С.115-131.
24. Киселева Н.Н., Кравченко Н.В. Банк данных по свойствам тройных неорганических соединений как основа для компьютерного конструирования новых веществ //Журн.неорган.химии. 1992. Т.37. №3. - С.698-702.
25. Kiselyova N.N. Intelligent information systems for designing of new materials // Управляющие системы и машины. 1992. №5/6. - С.125-130.
26. Кравченко Н.В., Бурханов ГС, Киселева Н.Н. и др. Банкданных по свойствам кристаллов для управления лазерным излучением // Изв. АН СССР. Неорган.материалы. 1991. Т.27. №1. - С.164-165.
27.Грибуля В.Б., Киселева Н.Н. Прогнозирование новых неорганических фаз с использованием кибернетических методов // В сб. Новые металлургические процессы и материалы. М.: Наука, 1991. - С.256-261.
28. Савицкий Е.М., Грибуля В.Б., Киселева Н.Н. и др. Прогнозирование в материаловедении с применением ЭВМ. М.: Наука, 1990. - 86 с.
29.Rez J., Kiseleva N.N., Kravchenko N. Computerized search for new polyfunctional electronic materials // Proc. Int.Conf. "Electronic Ceramics -Production and Properties". Riga, Apr.30 - May 2, 1990. Part I. Univ.of Latvia, 1990. - P.41-46.
30. Киселева Н.Н., Луцык В.И., Воробьева В.П. и др. Кибернетическое прогнозирование новых соединений в системах АО-В2О,// Докл.АН СССР. 1989. Т.304. №3. - С.657-660.
31. Киселева Н.Н., Бурханов Г.С. Поиск новых тройных фаз с Al, Ga и In с использованием информационно-прогнозирующей системы // Изв.АН СССР. Металлы. 1989. №1. - С.218-221.
32. Голикова М.С., Бурханов ГС, Киселева Н.Н. и др. Банкданных по свойствам акустооптических кристаллов неорганических соединений // Изв.АН СССР. Неорган.материалы. 1989. Т.25. №4. - С.700-701.
33. Грибуля В.Б., Киселева Н.Н. Принципы кибернетического прогнозирования неорганических фаз // В сб. Прямые и обратные задачи химической термодинамики. Новосибирск: Наука, 1987. - С.88-97.
34. Киселева Н.Н. Прогнозирование фаз Гейслера состава АВД2 (Д = Со, Ni, Си, Pd) // Изв.АН СССР. Металлы. 1987. №2. - С.213-215.
35. Киселева Н.Н., Бурханов Г.С. Прогноз кристаллических фаз в тройных системах с элементами V группы с применением методов обучения ЭВМ // Изв.АН СССР. Неорган.материалы. 1987. Т.23. №12. - С.2006-2011.
36: Савицкий Е.М., Грибуля В.Б., Киселева Н.Н. Кибернетические пути прогнозирования диаграмм состояния неорганических соединений // В сб. Физическое материаловедение в СССР. Киев: Наукова думка, 1986. - С.173-182.
37.Савицкий Е.М., Киселева Н.Н. Кибернетическое прогнозирование возможности образования и свойств химических соединений в трех-компонентных системах //В сб. Расчеты и экспериментальные методы построения диаграмм состояния. М.: Наука, 1985. - С.69-73.
38. Савицкий Е.М., Грибуля В.Б., Киселева Н.Н. Структура банков данных по фазам в двойных и тройных физико-химических системах //В сб. Расчеты и экспериментальные методы построения диаграмм состояния. М.: Наука, 1985. - С.93-97.
39. Савицкий Е.М., Киселева Н.Н. Прогнозирование типа кристаллической структуры некоторых эквиатомных тройных соединений // Изв.АН СССР. Металлы. 1985. №5. - С. 182-184.
40.Киселева Н.Н., Савицкий Е.М. Прогнозирование новых фаз в системах АГал2 - ВГал //Ж. неорган, химии. 1984. Т.29. №12. - С.3104-3110.
41. Савицкий Е.М., Киселева Н.Н. Кибернетическое прогнозирование германидов состава AB2Ge2 с кристаллической структурой типа ThCr2Si2// Изв.АН СССР. Металлы. 1984. №1. - С. 191-194.
42 Савицкий Е М , Киселева Н Н , Пищик Б Ни др Разработка автоматизированного банка данных по свойствам тройных неорганических фаз / /ДоклАНСССР 1984 Т279 №3 -С627-629
43 Savitskii Ye M , Gribulya V В , Kiselyova N N Application of learning computers to prediction of crystal structure types for inorganic phases //Proc Xl-th Conf on applied crystallography Vol 1/ Kozubmk, Poland/ September 10-14, 1984 Silesian Univ, Katowice, Institute of Ferrous Metallurgy, Gliwice - P169-174
44 Савицкий E M , Киселева Н Н Поиск критериев образования химических соединений в солевых системах с применением кибернетических методов // Докл АН СССР 1983 Т272 №3 - С 652-655
45 Киселева Н Н , Савицкий Е М Прогнозирование образования тройных силицидов со структурой типа ThCr2Si2// Изв АН СССР Неорган материалы 1983 Т19 №3 -С 489-491
46 Савицкий Е М , Киселева Н Н , Шкатова ТМ Кибернетико-статистический подход к поиску веществ с заданными свойствами // Изв АН СССР Неорган материалы 1982 Т18 №2 - С 235-238
47 Savitskiy Е М , Gribulya V В , Kiselyova N N Cybernetic prediction of inorganic compounds and its correlation with expenment // Crystal Res & Technol 1982 V17 №1 -P3-17
48 Киселева H H , Савицкий Е М Прогнозирование соединений состава АВГал4 в галогенидных системах //Ж неорган химии 1982 Т27 №11 -С 2880-2884
49 Savitskii Е М , Gribulya V В , Kiseleva N N Forecasting of superconducting compounds//Phys Stat Sol (a) 1981 V63 №1 -PK67-K72
50 Киселева H H , Савицкий Е М Кибернетическое прогнозирование селенидных фаз Шевреля // Ж неорган химии 1981 Т26 №5 - С 13641367
51 Грибуля В Б , Киселева Н Н Кибернетическое прогнозирование в физикохимии сплавов //Физикохимия сплавов редких металлов М Наука 1981 С 51-61
52 Savitskii Е М , Gribulya V В , Kiselyova NN On the application of cybernetic prediction systems in the search for new magnetic materials // J Less-Common Metals 1980 V72 №2 -P 307-315
53 Савицкий E M , Киселева Н Н Основы прогноза тройных фаз кибернетическими методами // Диаграммы состояния в материаловедении Киев 1980 -С 117-122
54 Savitskii Е М , Gribulya V В , Kiselyova N N Cybernetic prediction of superconducting compounds//CALPHAD 1979 V3 №3 -P171-173
55 Савицкий E M , Киселева H H Кибернетическое прогнозирование существования фаз составаАВХ2// Изв АН СССР Неорган материалы 1979 Т15 №6 -С 1101-1102
»17337
56. Киселева Н.Н., Савицкий Е.М. Прогнозирование халькогенидных шпинелей общей формулы АВ2Х4 с применением метода обучения ЭВМ // Ж.неорган.химии. 1979. Т.24. №6. - С. 1427-1429.
57. Савицкий Е.М., Грибуля В.Б., Киселева Н.Н. Кибернетические методы прогноза неорганических соединений // В сб. Сплавы редких и тугоплавких металлов с особыми физическими свойствами. М.: Наука, 1979. - С.29-35.
58. Савицкий Е.М., Грибуля В.Б., Киселева Н.Н. Кибернетический прогноз неорганических фаз // Доклады, представленные на IV Международную конф. по применению ЭВМ в химии. Новосибирск: НИОХ СО АН СССР. 1979.-С.403-407.
59. Савицкий Е.М., Киселева Н.Н. Прогнозирование сверхпроводящих фаз Шевреля // Докл. АН СССР. 1978. Т.239. №2. - С.405-407.
60. Савицкий Е.М., Киселева Н.Н., Ващенко Н.Д. Применение обучающихся ЭВМ для поиска новых соединений состава АВ2Те4// Докл.АН СССР. 1978. Т.239. №5. -С. 1154-1156.
61. Киселева Н.Н., Савицкий Е.М. Прогноз неорганических соединений состава АВ02 с применением обучающейся ЭВМ //Докл. АН СССР. 1977. Т.235. №6. - С. 1367-1370.
62.Киселева Н.Н., Покровский Б.И., Комиссарова Л.Н., Ващенко Н.Д. Моделирование образования сложных окислов из исходных компонентов на основе кибернетического метода формирования понятий //Ж.неорган. химии. 1977. Т.22. №4. - С.883-886.
63. Савицкий Е.М., Гладун В.П., Киселева Н.Н. Прогноз соединений состава ^В207 со структурой пирохлора//Докл.АН СССР. 1977. Т.233. №4. - С.657-660.
64. Savitskii E.M., Gribulya V.B., Kiselyeva N.N. Cybernetic prediction of the formation of chemical compounds in uninvestigated systems // Applications of Phase Diagrams in Metallurgy and Ceramics. Proc. of Workshop held at NBS. Gaithersburg, January 10-12,1977. - P.1139-1160.
65. Киселева Н.Н., Покровский Б.И., Ващенко Н.Д. Применение кибернетической системы формирования понятий для прогноза образования сложных химических соединений // Планирование и автоматизация эксперимента в научных исследованиях. М.: Сов.радио, 1974. - С.308-315.
РНБ Русский фонд
12506
Подписано в печать 9.09.2004 г. Заказ №25. Тираж 100 экз. Объем 1,9 п.л. Отпечатано в ООО «Интерконтакт наука», Москва, Ленинский пр.49.
Определения, обозначения и сокращения
Введение
1. Постановка задачи
2. Актуальность темы
3. Положения, выносимые на защиту
4. Практическая значимость работы 20 1. Разработка баз данных по материалам для электроники
1.1. Базы данных по веществам и материалам для электроники, созданные в мире
1.2. База данных по свойствам неорганических соединений «Фазы»
1.2.1. Структура базы данных
1.2.2. Программное и аппаратное обеспечение БД «Фазы»
1.2.2.1. Архитектура БД
1.2.2.2. Подсистема редактирования информации БД
1.2.2.3. Подсистема поиска информации в БД
1.3. База данных по фазовым диаграммам систем с полупроводниковыми соединениями «Диаграмма»
1.3.1. Системы и свойства, заносимые в базу данных «Диаграмма»
1.3.2. Структура базы данных
1.3.3. Программное и аппаратное обеспечение БД «Диаграмма»
1.3.3.1. Архитектура БД
1.3.3.2. Система удаленного администрирования БД
1.3.3.3. Система удаленного доступа пользователей к БД «Диаграмма» из сети Интернет
1.3.3.4. Система визуализации графической информации
1.4. База данных по свойствам акустооптических, электрооптических и нелинейнооптических веществ «Кристалл»
1.4.1. Физические основы функционирования акусто-, электро- и нелинейнооптических материалов и обоснование выбора свойств веществ, заносимых в базу данных «Кристалл»
1.4.2. Критерии отбора материалов, информация о которых заносится в базу данных
1.4.3. Структура базы данных
1.4.4. Программное и аппаратное обеспечение БД «Кристалл»
1.4.4.1. Архитектура БД
1.4.4.2. Система удаленного администрирования БД 79 1.4.4.3: Система удаленного доступа пользователей к БД
Кристалл» из сети Интернет
1.5. Интеграция баз данных по веществам и материалам
ИМЕТ РАН
2. Методы конструирования неорганических веществ
2.1. Квантовомеханические методы
2.2. Эмпирические методы
2.3. Методы поиска многомерных классифицирующих закономерностей
2.3.1. Автоматическая классификация
2.3.2. Обучение ЭВМ распознаванию образов
2.3.2.1. Статистические методы
2.3.2.2. Эвристичрские методы
2.3.2.3. Методы нейрокибернетики
2.3.2.4. Методы обучения ЭВМ процессу формирования понятий на основе растущих пирамидальных сетей
2.3.3. Поиск наиболее важных для классификации признаков
2.4. Обзор исследований по конструированию неорганических веществ и материалов
2.4.1. Прогноз типа диаграмм состояния физикохимических систем
2.4.2. Прогноз возможности образования соединений определенного состава в неорганических системах
2.4.3. Прогноз свойств неорганических соединений
2.4.3.1. Прогноз типа кристаллической структуры неорганических соединений
2.4.3.2. Прогноз физических свойств неорганических соединений
2.4.4. Применение методов распознавания образов в промышленных разработках неорганических материалов
3. Конструирование неорганических соединений, перспективных для применения в электронике
3.1. Методика конструирования новых неорганических соединений, используемая в настоящей работе
3.1.1. Выбор наборов признаков для описания физико-химических систем
3.1.2. Дискретизация признаков
3.1.3. Выбор примеров для обучения ЭВМ
3.1.4. Повышение достоверности прогнозирования за счет сравнения результатов прогноза с использованием разных наборов признаков
3.1.5. Классифицирующие закономерности
3.2. Конструирование соединений, перспективных для разработки новых полупроводниковых материалов
3.2.1. Соединения состава АВ2Х4 (X = S, Se, Те)
3.2.1.1. Прогноз возможности образования соединений состава АВ2Х
3.2.1.2. Прогноз типа кристаллической структуры соединений состава АВ2Х
3.2.2. Соединения состава АВХ2 (X = S, Se, Те)
3.2.2.1. Прогноз возможности образования соединений состава АВХ
3.2.2.2. Прогноз соединений состава АВХ2 с кристаллической структурой типа a-NaFe
3.2.3. Соединения состава АВХ (X = Р, As, Sb, Bi)
3.3. Конструирование соединений, перспективных для использования в качестве новых сегнетоэлектрических, пьезоэлектрических, акустооптических, электрооптических и нелинейнооптических материалов
3.3.1. Халькопириты состава АВХ
3.3.1.1. Халькопириты состава АВХ2 (А = Li, Na, К, Rb, Cs, Ag, Au, Zn, Cd, Hg; В = Al, Ga, In, Tl, Fe, Co,
Ni; X = O, S, Se, Те)
3.3.1.2. Халькопириты состава ABX2 (A = Mg, Ca, Sr, Ba, Zn, Cd, Hg; В = Si, Ge, Sn; X = N, P, As, Sb, Bi, S, Se, Те) и CDY2 (С = Li, Na, K, Rb, Cs; D = P, As,
Sb, Bi; Y = N, P, As, Sb, Bi)
3.3.2. Соединения состава АВОз с кристаллической структурой искаженного ильменита и перовскита
3.3.2.1. Поиск эмпирических критериев существования перовскитной структуры
3.3.2.2. Прогноз возможности образования соединений состава AB
3.3.2.3. Прогноз типа кристаллической структуры соединений состава АВ
3.3.3. Соединения состава ABF5 с кристаллическими структурами типа BaFeF5, BaGaF5 и CaFeF
3.3.4. Соединения состава А2В2(Х04)з (X = S, Cr, Mo, W) с кристаллической структурой типа лангбейнита
3.4. Конструирование соединений, перспективных для использования в качестве новых магнитных материалов
3.4.1. Соединения состава АВ204 со структурой шпинели
3.4.1.1. Прогноз возможности образования соединений состава АВ
3.4.1.2. Прогноз соединений состава AB204 со структурой шпинели
3.4.2. Соединения состава АВ2Х2(Х = Al, Si, Ge, Р, As, Sb) с кристаллической структурой типа ThCr2Si
3.4.3. Фазы Гейслера состава АВХ
3.5. Кибернетико-статистический подход к конструированию новых веществ с заданными свойствами
Задачу компьютерного конструирования новых неорганических соединений можно сформулировать следующим образом: найти совокупность химических элементов и их соотношение (т.е. качественный и количественный состав) для создания (при заданных внешних условиях) определенной молекулярной или кристаллической пространственной структуры соединения, позволяющей реализовать необходимые функциональные свойства. Исходной информацией для расчетов должны быть только свойства химических элементов и данные о других уже изученных соединениях.
Термин «компьютерное конструирование соединений» - «computer-aided compound design» - появился четверть века тому назад в связи с решением проблем поиска взаимосвязей между структурой и свойствами органических соединений [1,2]. Использование разнообразных методов компьютерного анализа экспериментальной информации о многочисленных органических соединениях позволило предсказывать молекулярную структуру, набор и положение заместителей в еще неполученных органических соединениях, которые обеспечивали бы заданные функциональные свойства. Соблюдение правил валентности для четырехвалентного углерода и одновалентного водорода в органических соединениях значительно упрощает решение задачи компьютерного дизайна органических соединений. С этой точки зрения проблема компьютерного конструирования неорганических соединений - более сложная, т.к. правило валентности строго соблюдается лишь в соединениях с ионным типом химической связи и частично - в ковалентных соединениях. Поэтому появившийся в девяностые годы термин «компьютерное конструирование неорганических соединений» [39] ассоциировался не только с разработкой молекулярной структуры, но и с поиском качественного и количественного состава еще неполученных соединений и с оценкой их возможных свойств на основе использования информации об образующих их элементах и других, уже полученных, соединениях. Следует отметить, что термин «компьютерное конструирование соединений» оказался очень удачным, поэтому он сейчас широко используется исследователями для обозначения разнообразных теоретических методов априорного (т.е. на основе только значений свойств компонентов) расчета новых веществ: от квантовоме-ханических методов [10] до эмпирических подходов, использующих методы компьютерного анализа данных [3, 4, 6, 7, 11-26].
Примеры задач компьютерного конструирования неорганических соединений:
- компьютерное конструирование химических систем с образованием и отсутствием соединений; компьютерное конструирование химических систем с образованием соединений определенного количественного состава при заданных внешних условиях;
- компьютерное конструирование химических соединений с заданной кристаллической структурой при определенных внешних условиях;
- компьютерное конструирование химических соединений с заданными функциональными свойствами (температурой плавления, температурой перехода в сверхпроводящее состояние и т.д.).
Разработано несколько подходов к решению указанных выше задач:
- квантовомеханический подход [10,27-37];
- простейшие эмпирические двух- и трехмерные критерии образования соединений с заданными свойствами [38-62];
- многомерные эмпирические классифицирующие закономерности, предназначенные для прогнозирования новых неорганических веществ [3-7, 1126,63-153].
Как известно [10, 27-37], квантовомеханический подход к расчету химических соединений основан на уравнении Шредингера. Точное решение последнего для конкретных неорганических веществ связано с серьезными математическими трудностями, которые удалось преодолеть лишь для простейших систем. Для сложных атомов и систем в настоящее время возможно получение только приближенных решений.
В связи с многочисленными трудностями, возникающими при квантово-механических расчетах еще неполученных неорганических веществ, химики и материаловеды начали разрабатывать и использовать различные эмпирические критерии образования соединений с заданными свойствами [38-62]. Основная гипотеза, лежащая в основе методов поиска таких критериев и закономерностей в вышеуказанных работах: фундаментальные свойства неорганических соединений при различных условиях (температуре, давлении, соотношении компонентов и т.д.) связаны периодическими зависимостями с фундаментальными свойствами химических элементов, входящих в их состав. При этом предполагается, что многочисленные, известные к настоящему времени, неорганические вещества подчиняются этим зависимостям. В связи с этим задача сводится к поиску закономерностей на основе анализа информации об уже исследованных веществах. Технологию разработки эмпирических критериев легко пояснить с использованием представлений о пространстве свойств химических элементов, входящих в состав химических веществ. Каждое вещество представлено в этом пространстве точкой, координаты которой определяются значениями свойств элементов, входящих в состав вещества. Процесс создания эмпирических критериев основан на анализе расположения точек, соответствующих изученным веществам различных типов, в пространстве свойств элементов и поиске поверхностей, разделяющих классы (классификационных правил). Последние позволяют отделить в пространстве свойств элементов области химических веществ одного типа от областей веществ другого типа (например, разделить точки, соответствующие соединениям с кристаллической структурой перовскита от точек, относящихся к соединениям со структурами ильменита, арагонита, кальцита, ватерита и т.д.). В случае простейших эмпирических критериев анализ расположения точек, соответствующих химическим объектам, осуществляется в двух- или трехмерных пространствах свойств элементов. Как правило, подобная классификация является грубой, т.к. свойства химических соединений, особенно многокомпонентных, зависят от многих свойств элементов. Поэтому естественным развитием такого подхода был переход к многомерным классифицирующим закономерностям. Разработка последних возможна только с применением компьютеров и специальных программ поиска закономерностей в больших объемах данных.
В настоящей диссертации разработан подход к компьютерному конструированию сложных неорганических соединений, который использует методы is. искусственного интеллекта для анализа информации баз данных по свойствам неорганических веществ.
Впервые методы искусственного интеллекта использовали для прогноза новых двойных неорганических фаз Е.М.Савицкий с соавторами [12, 81]. Работы, проводимые в ИМЕТ с середины 60-х годов, стали естественным продолжением исследований по применению искусственного интеллекта в химии, начатых в конце пятидесятых годов, с самых первых шагов этого направления информатики. Уже тогда стало ясно, что новый компьютерный подход очень перспективен для решения плохо формализуемых задач химии. Первые применения были связаны с органической химией и обработкой спектральной информации [2, 154, 155]. В 1965 г. в Станфордском университете Buchanan, Feigenbaum и Lederberg начали разработку одной из первых экспертных систем - DENDRAL, предназначенной для анализа спектральных данных об органических соединениях. В 1990 г. за работы по созданию принципов компьютерного дизайна органических соединений E.Corey получил Нобелевскую премию по химии [156].
Савицкий с соавторами использовали очень простые алгоритмы распознавания образов [157, 158], которые позволяли осуществлять прогноз только двойных соединений. Особенности алгоритмов [157, 158], обрабатывающих массивы целочисленных значений без пропусков в значениях, ограничили набор свойств элементов, используемых для описания двойных систем, только количеством электронов на электронных оболочках изолированных атомов. При переходе к более сложным соединениям: тройным, четверным и т.д. резко возрастало время анализа данных и требовался большой объем оперативной памяти ЭВМ. Вычислительная машина «Минск-22», используемая группой Савицкого, не обеспечивала такие возможности, поэтому все пионерские работы по конструированию неорганических фаз с применением алгоритма [157, 158] ограничились прогнозом двойных соединений, причем классифицирующие правила включали только информацию об электронном строении изолированных атомов. К сожалению, работы ИМЕТ по конструированию двойных соединений не получили дальнейшего развития в плане совершенствования программно-аппаратных средств, поэтому уже в начале восьмидесятые годов, после смерти Е.М.Савицкого, они были прекращены.
Исследования по компьютерному конструированию многокомпонентных соединений, изложенные в настоящей диссертации, были начаты нами в начале 70-х годов в Московском университете и были основаны на другом подходе к анализу химических данных [67, 89, 159]. Было протестировано множество алгоритмов распознавания образов и проанализированы недостатки применяемого в ИМЕТ подхода. На основе этого было предложено использовать при анализе данных ассоциативные сетевые структуры, ускоряющие поиск классифицирующих закономерностей в больших информационных массивах и уменьшающие объем оперативной памяти ЭВМ для их обработки. Поиск существующих к тому времени программ обучения ЭВМ, которые использовали ассоциативные структуры для хранения данных, привел в Институт кибернетики АН Украины, где уже была разработана первая версия программной системы «Анализатор» для ЭВМ БЭСМ-6 [160]. В этой системе для хранения информации применялся особый тип ассоциативных структур - растущие пирамидальные сети, предложенные В.П.Гладуном [160]. Уже первые эксперименты по использованию системы «Анализатор» для прогноза возможности образования тройных соединений [159] показали, что она является эффективным инструментом для решения задач конструирования сложных соединений. При ее использовании снимались ограничения на компонентность соединений и стал возможным поиск многомерных классифицирующих закономерностей, включающих любые свойства химических элементов и/или простых соединений, имеющие качественные (нечисловые), целые, действительные и т.д. значения, а также пропуски в значениях. Как показал тридцатилетний опыт работы с программными комплексами, основанными на растущих пирамидальных сетях, эти системы являются эффективными для применения в химии твердого тела. Предложенный подход, использующий сетевые ассоциативные структуры данных, получил большое распространение при конструировании неорганических веществ и стал уже обязательным атрибутом любой современной работы по применению искусственного интеллекта в химии и материаловедении [63-66, 161-163].
Изложенные в диссертации работы по компьютерному конструированию сложных неорганических соединений, начатые нами в МГУ [ 67, 89, 159 ]> в 1976 г. были продолжены в ИМЕТ под руководством Е.М.Савицкого [67, 80, 87, 88, 90-92, 94-98, 106, 116, 120, 122-126, 138]. Программное обеспечение этих работ осуществлялось силами большой группы высококвалифицированных исследователей Института кибернетики (ИК) АН Украины [160, 164, 165]. Исследования, проводимые в ИМЕТ, позволяли совершенствовать разрабатываемые в ИК системы, а самые последние версии систем искусственного интеллекта обеспечивали прогресс работ по компьютерному конструированию неорганических веществ.
С самого начала исследований по компьютерному дизайну неорганических фаз стало ясно, что для получения качественных результатов необходима разработка и использование баз данных (БД) по свойствам неорганических соединений. Поэтому в настоящей работе изложены результаты разработки БД по неорганическим веществам и материалам. В конце восьмидесятых годов была разработана концепция информационно-прогнозирующих систем, предназначенных для поиска информации об уже известных соединениях и прогноза еще неполученных фаз [14]. Разработка таких систем позже начата в разрых странах [46, 166]. Кроме того, опыт создания БД по свойствам неорганических соединений позволил разработать в рамках Государственной научно-технической программы "Новые материалы" (направление "Полупроводниковые и особочистые материалы") базы данных по свойствам материалов для электроники: БД по фазовым диаграммам систем с полупроводниковыми фазами и БД п* свойствам акустооптических, электрооптических и нелинейно-оптических веществ [167174]. Работы по созданию БД по свойствам электронных материалов проводились под научным руководством проф., д.т.н. В.С.Земскова. В разработке программного обеспечения БД участвовали инженеры-программисты ИМЕТ: В.А.Дударев, В.В.Прокошев, В.В.Хорбенко и Ю.И.Христофоров, а также студенты-дипломники МАТИ и МИЭМ: А.В.Гришаев, Д.П.Мурат, А.В.Столярен-ко. К сбору и оценке достоверности информации БД по материалам для электроники были привлечены специалисты из ведущих ВУЗов и академических институтов России: Р.Х.Акчурин и В.В.Арбенина (МИТХТ), А.А.Буш (МИ-РЭА), В.М.Глазов, Л.М.Павлова и А.С.Пашинкин (МИЭТ), В.А.Долгих, В.П.Зломанов и М.Н.Мамонтов (МГУ), И.С.Ковалева (ИОНХ РАН), В.Л.Кузнецов (ФТИ РАН), В.И.Косяков (ИНХ СО РАН), И.А.Стрельникова и С.Н.Чижевская (ИМЕТ РАН) и другие. Рецензирование собранной информации проводили В.С.Земсков и Л.Е.Шелимова (ИМЕТ РАН). Сверку введенных данных и обработку большей части графической информации провела И.Н.Белокурова (ИМЕТ РАН). Разработанные БД стали информационной основой работ по компьютерному конструированию новых соединений, перспективных для использования в электронике.
2. Актуальность темы
Актуальность темы обусловлена объектами для компьютерного конструирования - это материалы для электроники. Химия и материаловедение этих веществ являются одними ш наиболее динамически развивающихся отраслей высоких технологий. Особенностью использования материалов в электронике является то, что в большинстве случаев они являются главной функциональной частью электронных устройств. Поэтому разработка новых материалов, процессов их получения и обработки в значительной степени определяет прогресс электроники. Автоматизация поиска новых веществ, перспективных для практического использования в качестве материалов электронной техники, позволяет ускорить процесс перехода от одного поколения электронных устройств к другому.
Настоящая диссертационная работа посвящена разработке методов конструирования новых неорганических веществ, основанных на использовании современных информационных технологий. Создание и применение таких методов является одним из актуальных направлений химии и материаловедения, которое в последние годы интенсивно развивается во всем мире.
Исследования по компьютерному конструированию неорганических соединений и разработке БД были поддержаны российскими и зарубежными фондами и организациями: РФФИ (гранты №99-07-90040 и №04-07-90086), Правительством Москвы (гранты №В 117 Программы «Поддержка инфраструктуры науки в г.Москве», №3-4 и 1.2.1 Программы «Инфраструктура и адресная поддержка науки»), International Scientific Foundation (ISF) (гранты MBM000 и МВМ300), European Office of Aerospace Research and Developments (EOARD) (контракты SPC-94-4097, SPC-95-4016, SPC-95-4096, SPC-96-4067 и SPC-00-4014).
3. Положения, выносимые на защиту
1. Подход к компьютерному конструированию сложных неорганических соединений на основе использования баз данных по свойствам неорганических веществ и материалов и методов искусственного интеллекта для поиска зависимостей, связывающих свойства неорганических соединений со свойствами химических элементов, и результаты его применения на примерах соединений, перспективных для разработки новых полупроводниковых, сегнетоэлектриче-ских, пьезоэлектрических, акустооптических, электрооптических, нелинейно-оптических и магнитных материалов.
2. Результаты компьютерного конструирования неорганических соединений, подтверждающие гипотезу о том, что фундаментальные свойства многокомпонентных неорганическлх соединений (возможность образования соединения, тип кристаллической структуры и т.д.) при определенных условиях (температуре, давлении, соотношении компонентов и т.д.) связаны периодическими зависимостями с фундаментальными свойствами химически^ элементов, входящих в их состав. Использование многомерных зависимостей, включающих в качестве переменных множество свойств химических элементов и простых соединений, позволяет получить наилучшие результаты конструирования для еще неполученных фаз.
3. Критерии выбора алгоритмов искусственного интеллекта, которые предназначены для поиска сложных закономерностей в больших объемах информации, и выбор методов для компьютерного конструирования неорганических соединений, основанных на обучении ЭВМ и сетевых структурах данных.
4. Разработка и использование интегрированной распределенной системы БД по свойствам веществ и материалов для повышения достоверности и оперативности компьютерного конструирования неорганических веществ: БД по свойствам неорганических соединений, БД по фазовым диаграммам полупроводниковых систем и БД по свойствам акустооптических, электрооптических и нелинейнооптических веществ.
5. Результаты применения комплексного подхода к автоматизации процесса разработки новых материалов, включающего теоретические методы компьютерного конструирования веществ и расчетно-экспериментальные методы оптимизации технологических процессов, полученные при решение задачи поиска новых сверхпроводников со структурой фаз Шевреля.
4. Практическая значимость работы
1. Компьютерное конструирование неорганических соединений позволяет автоматизировать поиск новых неорганических соединений с заданными свойствами. Полученные прогнозы уменьшают количество исследуемых составов при поиске веществ, перспективных для полупроводниковых, сегнетоэлектри-ческих, пьезоэлектрических, акустооптических, электрооптических, нелиней-нооптических, магнитных и прочих применений.
2. Предложенный кибернетико-статистический подход позволяет не только осуществить прогноз новых соединений, но и найти оптимальные режимы получения и обработки материалов с заданными свойствами.
3. Использование интегрированной системы баз данных, объединяющей БД по свойствам неорганических веществ, БД данных по фазовым диаграммам систем с полупроводниковыми соединениями и БД по свойствам акустооптических, электрооптических и нелинейнооптических веществ, которые содержат информацию, собранную и оцененную специалистами, позволяет сократить затраты на разработку новых неорганических материалов за счет оперативного информационного обслуживания специалистов, уменьшения необоснованного дублирования работ и компьютерной обработки информации с целью конструирования новых соединений с заданными свойствами.
1. Разработка баз данных по материалам для электроники
Заключение
4.1. Компьютерное конструирование неорганических веществ как способ автоматизации поиска новых материалов
В диссертации предложен новый подход к компьютерному конструированию неорганических соединений. Он основан на использовании методов искусственного интеллекта для поиска закономерностей образования соединений в информации баз данных по свойствам веществ и материалов. Проблема состоит в путях поиска таких закономерностей. Наилучшим способом является разработка теоретических моделей, описывающих физическую природу неорганических фаз. Однако современный уровень теоретической физики твердого тела дает только качественную картину процессов, происходящих в системе химических элементов, особенно, если речь идет о конденсированных многокомпонентных веществах.
Второй путь, это тот способ, о котором писал Р.Фейнман [450], когда касался истории создания Д.И.Менделеевым Периодического закона, - «грубое угадывание отношений, определяющих некоторое семейство», которое характерно «для первых схваток с природой, предваряющих открытие какого-то действительно глубокого и очень важного закона». Т.е. речь идет о разработке некоторой классификационной схемы, являющейся первым шагом при формировании любого научного знания. В большинстве естественных наук разработка такой системы понятий (классов), отношений между ними и правил отнесения объектов к тому или иному понятию (классу) носит эмпирический характер. В основе ее лежит анализ опытных данных. С этой точки зрения закономерности, получаемые в результате анализа информации баз данных с использованием программы искусственного интеллекта, являются правилами для классификации физико-химических систем, образованных разными элементами. При этом система понятий (классов) уже разработана специалистами и требуется лишь найти критерии классификации в терминах свойств компонентов физико-химических систем. В принципе не столь важно, какую форму имеет классифицирующее правило: алгебраическая функция, логическое выражение, нейронная или пирамидальная сеть, - главное, чтобы оно правильно разделяло не только известные, но и еще неизученные объекты. Достоверность прогнозирования является основной оценкой качества классифицирующего правила.
Получаемые классифицирующие закономерности не являются фундаментальными законами природы. Они лишь указывают, при каких сочетаниях значений свойств компонентов реализуются те или иные классы физико-химических систем. В этом случае прогнозирование сводится к поиску аналогов нового объекта среди уже изученных. Классифицирующие закономерности жестко связаны с тем набором понятий и теоретических представлений, который используется в настоящее время в химии. Это обстоятельство определяет постановку задач классификации физико-химических систем, выбор свойств компонентов для их описания, интерпретацию полученных результатов, а также неоднозначность и неточность полученных прогнозов. Ведь даже такое ключевое понятие химии как «соединение» является нечетким, как и большинство понятий, сформулированных человеком. Нечеткость («размытость») основных понятий химии и наличие экспериментальных ошибок в обучающих выборках, имеют следствием то, что получаемые правила классификации всегда являются неполными, и прогноз на их основе не может быть абсолютно достоверным.
Предлагаемый подход не является альтернативой методам теоретической физики. Главная задача последних - найти модель, адекватно описывающую некоторую материальную систему. В случае же компьютерного конструирования неорганических соединений с использованием методов искусственного интеллекта решается формальная задача поиска тех значений свойств объектов (физико-химических систем), которые определяют их принадлежность к тому или иному заранее заданному классу. Полная физическая интерпретация полученных закономерностей возможна не всегда. Это является следствием их сложности и не связано с отсутствием физического смысла в обнаруженных классифицирующих правилах. Однако следует отметить, что и многие более простые эмпирические закономерности не нашли пока адекватной физической интерпретации, например, правило Маттиаса для прогноза сверхпроводников со структурой А15 [47] или правило Даркена-Гурри для прогноза взаимной растворимости металлов [48].
Предложенный подход является универсальным. С его помощью нами было осуществлено конструирование тысяч новых неорганических соединений с различным типом химической связи: ионным, ковалентным, интерметаллическим. Помимо указанных выше, были получены прогнозы новых соединений составов: АВХ (X = Al, Si, Ga, Ge, Se, Pd, In, Те) [14, 116, 118], A2BX2 [14] и AxMo6X8 (X = S, Se) [122, 123], AB02 [88], ABX3 (X = F, S, CI, Se, Br, Те, I) [14, 80], ABX4 (X = O, F, CI, Br, I) [67, 90], AB2X4 (X = F, CI, Br, I) [80], A2B2X7 (X -O, S, Se) [14, 94], Ax(S04)y * Bz(S04)w [95], A(N03)x * B(N03)y, ABD04 [95] и т.д. Для большинства этих соединений проведено прогнозирование типа кристаллической структуры при нормальных условиях. С помощью методов обучения ЭВМ оценены некоторые свойства предсказанных соединений, например, критическая температура перехода в сверхпроводящее состояние фаз Шевреля составов АхМо6Х8 (X = S, Se) [122, 123], концентрационные интервалы для компонентов R, R" и в соединениях состава Rx.yR,z.wR,\.mCu04 [127], в которых реализуются различные кристаллические модификации Т-фаз: Т, Т' и Т*-фазы, и т.д.
Важнейший вопрос при создании любой эмпирической классификационной схемы - выбор тех признаков, которые должны быть включены в правило классификации. В простых случаях набор таких признаков невелик и критерии классификации достаточно просты. Например, к полупроводникам относятся фазы, в которых все квантовые состояния валентной зоны заняты и ширина запрещенной зоны при 298 К находится в пределах 0.08 < АЕ < 3.2 эВ [451]. Указанные в этом правиле свойства фаз могут быть определены, и на основе их значений принято решение о принадлежности фазы к классу полупроводников. Проблема поиска разделяющих признаков становится более сложной, когда нужно выбрать набор классифицирующих признаков фаз из свойств их компонентов (химических элементов или более простых соединений). Если не ограничивать набор компонентов, в этом случае для правильной классификации, чаще всего, бывает недостаточно одного-двух классифицирующих признаков. Поэтому многочисленные попытки поиска двухмерных критериев классификации, связывающих свойства соединений со свойствами элементов, очень часто были удачны только для разделения узкой группы фаз (например, для тройных соединений с двумя фиксированными элементами).
Предложенный подход к поиску классифицирующих закономерностей, позволяющих определять принадлежность физико-химических систем к тому или иному классу на основе знания свойств компонентов, предполагает использование множества свойств компонентов. Их количество и перечень, как правило, определяется природой анализируемых объектов. В некоторых случаях, например, при прогнозе двойных, тройных и четверных систем с образованием и без образования соединений при обычных условиях [20] были использованы, практически все известные свойства элементов. Существуют психофизиологические ограничения на возможности человека в поиске закономерностей, которые включают большое количество признаков, связанных сложными логическими отношениями. Поэтому для формирования таких сложных закономерностей предложено использовать специальные программы искусственного интеллекта, автоматизирующие процесс поиска классифицирующих правил и прогнозирования новых веществ. Системный подход как комплексное взаимосвязанное последовательное рассмотрение всех факторов, путей и методов решения приведенных выше задач прогнозирования [452] является основой компьютерного конструирования неорганических соединений.
Возможна ли полная автоматизация процесса конструирования веществ, при котором человек только ставит проблему перед искусственным разумом и на выходе получает искомое вещество? При всей заманчивости такой суперсистемы ее практическая реализация невозможна на современном уровне развития методологии искусственного интеллекта и исследования человеческого разума. Методы искусственного интеллекта в химии - это всего лишь инструмент исследования взаимосвязей химических объектов, который по своей сути мало отличается от других инструментальных средств, широко используемых в современной химии - рентгеновских дифрактометров, приборов для химического анализа и т.д. Различие связано с тем, что аналитический прибор анализирует вещество, а система компьютерного конструирования неорганических материалов анализирует информацию о веществах. И в том, и в другом случае оба инструмента расширяют возможности человека в познании мира.
4.2. Основные направления развития предложенного подхода
Для применения методов компьютерного конструирования неорганических веществ на основе искусственного интеллекта существует два ограничения: необходимость выполнения гипотезы компактности и наличие достаточного количества экспериментально изученных химических систем дпя обучения ЭВМ.
Какие проблемы стоят перед компьютерным конструированием неорганических веществ и какие пути их решения? Первая проблема - это качество экспериментальных данных для компьютерного анализа. Ошибки в обучающих выборках - одна из основных причин неправильных прогнозов. Величина ошибки, как правило, пропорциональна отношению ошибочных объектов к общему объему обучающей выборки. Это связано со спецификой предлагаемого подхода, в котором система искусственного интеллекта ищет вещества, близкие по значениям свойств. Как показывает опыт, в течение 25-?О лет обнаруживаются ошибки в среднем в 10-20 % информации для обучения ЭВМ. Прогресс в методах исследования, более полное изучение физико-химических систем, включающее построение их Р-Т-х-диаграмм, использование более чистых исходных реагентов и т.д. способствуют уточнению экспериментальных данных. В связи с этим создание быстро обновляющихся БД, в которых содержится достоверная и полная информация о веществах и их свойствах, а также дополнительная оценка данных, проводимая специалистом, который конструирует новые вещества, является одним из основных путей решения проблемы. Разрабатываемая в ИМЕТ система баз данных с оцененной информацией частично решает проблему отсеивания явно некачественных данных. Появляется возможность сравнения любых новых сведений о конкретном свойстве с большим объемом уже накопленной информации об этом параметре. Создание интегрированных систем БД в определенных предметных областях еще более расширит возможности сравнения и оценки информации. Одним из интереснух приложений систем искусственного интеллекта для обнаружения ошибок в базах данных может быть поиск физико-химических систем-аналогов, признаковые описания которых совпадают, а принадлежность к классам - разная. Причинами такого разногласия могут быть либо «плохой» выбор или неточная дискретизация свойств компонентов, либо ошибки в экспериментальных данных. В процессе обучения растущих пирамидальных сетей, проводимого по алгоритмам [160, 164, 165], система искусственного интеллекта выводит список таких «противоречивых» объектов. Исследователь должен проанализировать причину разночтений и дать рекомендацию компьютерной системе о статуса «подозрительных» объектов. При этом появляется возможность отсеивания неправильных сведений и в самих БД, из которых отобрана информация для обучения ЭВМ.
Вторая проблема связана с прогнозом количественных свойств соединений. С помощью предложенного метода компьютерного конструирования неорганических соединений удалось достичь хорошего прогнозирования качественных свойств веществ: возможности образования, типа кристаллической структуры и т.д. Значительно более сложная задача - прогноз количественных свойств фаз (например, температуры плавления или кипения, ширины запрещенной зоны и т.д.). В этом случае, как правило, прогнозируется не сама величина свойства, а превышение некоторого порога (порогов) целевого параметра. Наилучшие результаты можно получить, если в качестве порогов указаны естественные границы между классами, в пределах которых соблюдается гипотеза компактности. Одним из путей поиска пороговых значений целевой функции является предобработка информации, которая включает сочетание методов группировки объектов по степени корреляционной связи и кластер-анализа. Такие возможности реализуют, в частности, системы анализа данных, которые объединяют метод экстремальной группировки параметров и автоматической классификации [336, 337]. Тем не менее, следует заметить, что задачи прогноза количественных свойств неорганических веществ требуют не только значительно большего количества объектов для обучения ЭВМ, чем при прогнозе качественных свойств, но и более тщательной постановки задачи. Сравнение с экспериментом прогнозов некоторых количественных свойств: критической температуры перехода в сверхпроводящее состояние [122, 123, 125, 126], области гомогенности [127] и т.д. свидетельствует, что ошибки прогнозирования еще достаточно велики - выше 40 %. Причина высоких ошибок прогноза -очень маленькие объемы обучающих выборок и невыполнение гипотезы компактности за счет «плохих» пороговых значений. Например, при прогнозе температуры перехода в сверхпроводящее состояние фаз Шевреля [122, 123, 125, 126] обучающие выборки включали 44 примера сульфидных и 31 пример селе-нидных фаз. Порог - 4.2 К, был обусловлен лишь технологией охлаждения веществ жидким гелием, а не естественной границей между разными* по Тс классами фаз Шевреля. Решению задачи прогноза количественных свойств неорганических фаз будет способствовать использование больших объемов информации, что непосредственно связано с разработкой баз данных по веществам и материалам.
Одной из трудностей, препятствующих широкому использованию систем компьютерного конструирования неорганических веществ в химической практике, является довольно сложная методика работы с этими системами. Если поиск данных в разработанных в ИМЕТ БД является простой операцией, то подv готовка найденной информации для анализа с использованием системы искусственного интеллекта требует определенной подготовки. Самым перспективным путем решения этой проблемы является разработка информационно-прогнозирующей системы (ИПроС) [3, 4, 14, 21, 22] (рис.40).
ИПроС предназначена для поиска данных об изученных соединениях и прогноза еще неполученных фаз и оценки их свойств. В ее состав входят база данных по свойствам неорганических соединений «Фазы», интегрированная с другими БД по свойствам веществ и материалов, БД по свойствам химических элементов, прогнозирующая подсистема, основанная на системе программ искусственного интеллекта, база знаний, диалоговый процессор и управляющий монитор.
Рис.40. Схема информационно-прогнозирующей системы
В базе знаний (БЗ) хранятся уже полученные закономерности для различных классов неорганических соединений, которые могут использоваться для прогноза фаз и оценки их свойств, если в базе данных нет искомых сведений для конкретной физико-химической системы.
Монитор управляет всем вычислительным процессом и осуществляет интерфейс между всеми функциональными подсистемами, а также теледоступ к системе из сети Интернет. Помимо этого, он следит за тем, чтобы новые экспериментальные данные не противоречили прогнозирующим закономерностям. Такое противоречие он снимает путем переобучения ЭВМ с использованием дополнительных новых данных с последующим занесением обновленной закономерности в БЗ.
Диалоговый процессор организует общение пользователя с информационно-прогнозирующей системой, а также реализацию функций экспертов в данной предметной области. В перспективе предполагается использование лингвистического процессора в программной или программно-аппаратной реализации. 9
Порядок работы ИПроС следующий (рис.40). Например, пользователь запрашивает сведения о существовании соединений определенного состава. Если данные о запрашиваемом соединении есть в БД, то он получает их для ознакомления. Если информации о соединении в БД нет или она неполная, то по директиве пользователя запрашивается БЗ о наличии в ней закономерности, соответствующей искомому свойству для соединений этого типа. Если эта закономерность присутствует, то из БД по свойствам химических элементов поступает соответствующий набор свойств компонентов и проводится прогнозирование нужной характеристики. В том случае, если в БЗ нет нужной закономер ности, тогда в БД проводится поиск примеров для обучения ЭВМ. Эти примеры еще раз оцениваются пользователем с точки зрения их достоверности и представительности и, если выборка достаточна для обучения, то последовательно срабатывают подсистемы обучения и прогнозирования. Полученный прогноз выдается пользователю, а сформированная классифицирующая закономерность пополняет БЗ. Этот пример - самая простая задача, которую сможет решить информационно-прогнозирующая система. Более сложная задача, например, -прогноз возможных фаз разного состава в тройной или более сложной системе и оценка их свойств. Если предыдущая задача еще сможет быть решена в реальном времени, то последняя потребует значительных временных затрат.
Принципы, положенное в основу разрабатываемой информационно-прогнозирующей системы, были успешно проверены ранее на макете системы, реализованном на ЭВМ 2-ого поколения БЭСМ-6 [118].
В чем отличие информационно-прогнозирующей системы отлшироко известных экспертных систем [453]? Как известно, последние также предназначены для решения очень сложных задач в узких предметных областях на основе использования больших объемов высококачественных специальных знаний. Знания извлекаются из самых разнообразных источников: публикаций, экспертов-специалистов и т.д., и представляются в виде правил, фреймов, семантических сетей и других формализмов искусственного интеллекта. Существенной особенностью экспертных систем является наличие в их составе подсистемы объяснения. Она описывает функционирование системы в сжатой форме, удобной для восприятия человеком. Подсистема объяснений отвечает„ча вопросы пользователя "как" и "почему" принято то или иное решение при альтернативном выборе. В отличие от экспертных систем, в ИПроС используется необычная процедура получения знаний от экспертов, и подсистема объяснений носит рудиментарный характер. Как показывает наш опыт, любая попытка получить от химика достаточно исчерпывающий ответ о причинах образования фаз того или иного типа, о природе каких-либо свойств соединений и т.п. вызывает значительные трудности. Для него гораздо естественнее провести оценку достоверности данных о существовании конкретного соединения или значений свойств фазы. Учитывая специфику данной предметной области, было решено отказаться от идеи использования знаний химика для формулировки правил образования неорганических веществ с заданными свойствами и ограничиться его опытом для экспертной оценки данных для обучения ЭВМ. Поэтому и блок объяснений информационно-прогнозирующей системы, отвечая на вопрос пользователя о природе того или иного прогноза, сможет указать лишь интервалы изменения свойств компонентов, определяющие принадлежность фазы к определенному классу, и указать аналоги прогнозируемого соединения среди обучающих примеров.
Отличительной особенностью систем искусственного интеллекта является их способность к автоматическому поиску закономерностей и их использованию для прогноза. Следовательно, экспертные системы являются системами со «слабым» интеллектом, потому что они только используют знания (закономерности), полученные от эксперта или из других источников. Применяемые в настоящем исследовании системы искусственного интеллекта [161», 164, 165] способны к самостоятельному поиску закономерностей. По идеологии они близки к новому типу систем искусственного интеллекта, которые получили название партнерских [165, 301].
В заключение следует отметить, что путь автоматизации научных исследований - от баз данных до систем конструирования веществ и материалов повторяет исторический путь познания: от сбора и обработки исходных эмпирических данных до обобщения опытных фактов и построения на этой основе научных теорий, отображающих фундаментальные отношения и связи исследуемых процессов и явлений. Создание и применение систем искусственного интеллекта позволяет говорить о появлении нового вида моделирования - моделирования познавательной деятельности [453], инженерии знаний. Этот тип моделирования будет играть особую роль в тех областях науки и техники, в которых математическое моделирование и вычислительный эксперимент часто дают плохие результаты (химия, материаловедение и т.д.).
289