Применение методов теории распознавания образов для анализа колебательно-вращательных спектров тема автореферата и диссертации по физике, 01.04.05 ВАК РФ

Щербаков, Анатолий Петрович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Томск МЕСТО ЗАЩИТЫ
1997 ГОД ЗАЩИТЫ
   
01.04.05 КОД ВАК РФ
Автореферат по физике на тему «Применение методов теории распознавания образов для анализа колебательно-вращательных спектров»
 
Автореферат диссертации на тему "Применение методов теории распознавания образов для анализа колебательно-вращательных спектров"

РОССИЙСКАЯ АКАДЕМИЯ НАУК

ИНСТИТУТ ОПТИКИ АТМОСФЕРЫ

Р Г 5 ОД

На правах рукописи

ЩЕРБАКОВ Анатолий Петрович

ПРИМЕНЕНИЕ МЕТОДОВ ТЕОРИИ РАСПОЗНАВАНИЯ ОБРАЗОВ ДЛЯ АНАЛИЗА КОЛЕБАТЕЛЬНО-ВРАЩАТЕЛЬНЫХ СПЕКТРОВ.

01.04.05 - оптика

Автореферат ¡¡у.ссертацки на соискание ученой степени кандидата физико-математических наук.

Томск - 1997

Работа выполнена в Институте оптики атмосферы СО РАН. Научные руководители:

д.ф.-м.н. СИНИЦА Леонид Никифорович д.ф.-м.н. БЫКОВ Александр Дмитриевич

Официальные оппоненты:

д.ф.-м.н. СТАРИКОВ Виталий Иванович к.ф.-м.н. ЧЕРЕПАНОВ Виктор Николаевич

Ведущая организация:

Научно-технический центр химической информатики при Новосибирском институте органической химии.

Защита состоится 1997 года в часов

на заселаниии диссертационного совета Д-200.38.01 при Институте оптики атмосферы СО РАН по адресу: 6 34055, Томск-55, пр.Академический 1.

С диссертацией можно ознакомиться в библиотеке Института оптики атмосферы СО РАН.

Автореферат разослан СьЛс^Огп^ 1997 г.

Ученый секретарь диссертационного совета

Д.200.38.01, д.ф.-м.н. В.В.Веретенников

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Колебательно-вращательные спектры представляют уникальный источник информации о различных свойствах молекул и межмэлекулярных процессах, происходящих в газах. В настоящее время измерения полоя;ен1ги центров линий в спектрах производятся с точностью 10-— 10 — 6 см"-, измерения интенсивностей изолированных и достаточно сильных линий - с точностью 1-3%, имеются примеры работ, в которых козфициенты уширения и сдвига линий измерены с точностью 1-10%.

Теоретический анализ спектров позволяет определить ЕнутрмклеГ'Гулярнуа летенциальнуг энергию, дипольный момент, их зависимость от колебательных координат, восстановить непосредственно из эксперимента целый ряд других молекулярных характеристик.

Спектры поглощения атмосферных газов, в частности водяного пара, изучены более или менее подробно в области Х>1 мкм. В то же время многие линии в видимой области не идентифицированы. Для

значительного числа линий предложенная идентификация сомнительна. Использование спектроскопических данных с необоснованней или неподтвержденной точными расчетами идентификацией может приводить к неверной интерпретации измерений, проводимых в атмосфере.

Многоатомные молекулы - водяной пар, метан, озон, представляющие интерес для атмосферных приложений, обладают сложными спектрам-! поглощения, содержащими тысячи или даже десятки тысяч линий. Анализ таких спектров, идентификация линий б них- трудоемкий процесс и, как заметил P.Jensen [1], "время, необходимое для регистрации спектра, становится пренебрежимо малым по сравнению со временем, затрачиваемым на его теоретический анализ". В связи с этим появляется необходимость разработки средств автоматизации, которые позволили бы быстро и эффективно работать с такими спектрам!, проводить идентификацию линий, решать обратные задачи, создавать необходимые базы данных.

В данной работе отнесение линий рассматривается как отдельная задача, которая состоит в "распознавании" переходов при наличии только приближенных теоретических оценок

спектроскопических постоянных. В типичной ситуации специалист, проводя идентификацию линий, обращается большей частью к интуиции и предыдущему опыту. Например, одним из методов, применяемых для анализа, является метод комбинационных разностей. Как правило, в спектре оказывается несколько десятков комбинационных разностей, похожих на правильные. Истинная комбинационная разность угадывается спектроскопистом при одновременном учете ряда признаков, в частности, по соотношению ичтенсивностей линий, величине отклонения измеренных частот и интенсивностей от расчетных, точности выполнения комбинационного правила, по качеству решения обратной задачи после включения новых уровней и т.д. Такая задача является типичной задачей распознавания, поэтому вполне естественно применить для ее решения уже хорошо разработанные методы теории распознавания образов и математической статистики.

В .задачу данной диссертационной работа входит разработка программных средств, использующих методы распознавания, обеспечивающих компьютерную поддержку анализа спектров высокого разрешения и облегчающих идентификацию линий, получение конкретных данных о высоковозбужденных колебательно-вращательных состояниях молекулы воды.

Актуальность такого исследования обусловлена, прежде всего, необходимостью применения высокоточных спектроскопических данных для решения задач астрофизики, оптики атмосферы, физики пламен. В свою очередь, процесс извлечения информации из спектров высокого разрешения, содержащих тысячи линий, нуждается в развитии средств полной и широкой автоматизации. Потребность в исследовании спектров поглощения водяного пара связана, как это хорошо известно, с приложениями в атмосферной оптике, производстве сверхчистых веществ и т.д.

Научная новизна работы заключается в следующем:

1. Методы распознавания образов впервые применены для создания системы автоматической идентификации линий в колебательно-вращательных спектрах.

2. Проведен анализ спектра поглощения Нз^О около 0.8 мкм. Идентифицированы линии полос , 2у^+3\'2, Зуз+2уз, определены уровни энергии высоковозбужденных колебательных состояний (230), (032), (051).

3. Проведен анализ спектра поглощения изотопной модификации

Н2^0 в диапазоне 11300-13600 см--'-, определены уровни энергии, принадлежащие 7 колебательным состояниям, относящимся к высоким полиадам 4v и 4v+S.

4. Решены обратные задачи, определены вращательные, центробежные, резонансные постоянные состояний второй декады Н21бО, параметры, определяющие дипольные моменты переходов.

Полученные из спектров данные помещены на 123 страницах приложений.

Наууяое и практическое значение результатов работы состоит в следующем:

1. Результаты исследования спектров поглощения в ближней инфракрасной области позволяют уточнить данные современных банков спектроскопической информации HITRAN и GEISA, используемых для решения широкого круга задач.

2. Получены конкретные данные об энергетическом спектре высоковозбужденных колебательных состояний Н^О, необходимые для восстановления потенциальной функции молекулы и расчетов пропускания лазерного излучения атмосферой.

3. Созданная экспертная система может быть использована для анализа колебательно-вращательных спектров широкого класса трехатомных молекул симметрии C2v и cs • Применение экспертной системы позволяет на порядки сократить время, затрачиваемое на идентификацию слетров, и гарантировать исследователя от ошибок, неизбежных при работе вручную.

Исследования в данном направлении поддержаны Российским Фондом Фундаментальных Исследований по гранту N 96-07-89321.

Достоверность полученных результатов обеспечивается - совпадением вычисленных и полученных из экперзслента центров к интенсивностей линий,

согласием результатов, полученных для основной изотопной модификации и изотопной модификации H2lö0.

Устойчивость и корректность функционирования системы автоматической интерпретации линий подтверждена многочисленными тестами на хорошо изученном материале и длительной интенсивной эксплуатацией.

Основные результаты работы приведены в 4 статьях и докладывались на 1-м и 2-м Межреспубликанских симпозиумах по оптике атмосферы и океана (Томск, 1993, 1996), на 14 и 15-ом Международных коллоквиумах (Прага, 1994, 1996), Международном симпозиуме по инфракрасной спектроскопии ¡Дижон,1995), Международном симпозиуме по молекулярной спектроскопии высокого разрешения (Санкт-Петербург,1996), Международной конференции ASA Work Shop ( Реймс, 1996).

На аащияу выносятся следующие положения:

1. Задача поиска и идентификации линий в спектрах может быть формализована в терминах языка теории распознавания образов. Использование методов теории распознавания образов позволяет создавать системы автоматической идентификации и поиска линий в молекулярных спектрах высокого разрешения, имеющие достаточную гибкость и эффективность.

2. Резонансные взаимодействия в колебательно- вращательном энергетическом спектре состояний второй декады имеют весьма сложный характер, обусловливая перераспределение интенсивностей, ведущее к появлению линий слабых полос. При анализе спектра поглощения водяного пара в области 11600-12750 см-1 необходимо учитывать резонансное взаимодействие с высоковозбужденными изгибными состояниями (080) и (230), (160) и (112). Поглощение Hg^O в области 0.6-0.9 мкм обусловлено наличием трех систем полос {(051),(230),(131), (032),(310),(211),(112),(013)}, {(320),(211), (202), (301) , (400) , (103) }, ((321), (212) и (311)}.

КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ В первой главе приведен краткий обзор методов вычисления колебательно-вращательных (KB) уровней энергии и результатов анализа спектров водяного пара. Обсуждаются новые методы расчета KB уровней нежестких молекул, использующие технику суммирования расходяютхся рядов теории возмущений и позволяющие учесть сильный центробежный эффект, проявляющийся в высоких KB состояниях.

Обзор литературных данных по спектрам водяного пара указывает на явную недостаточность обработки высокоточных экспериментальных данных в ближней ИК и видимой областях.

Поэтому представляется актуальной разработка средств для такого анализа, в частности, программ, облегчающих работу со спектрами, их теоретическую интерпретацию.

Б этом же разделе проводится обзор литературы по использованию средств компьютерной попержки в задачах химии и спектроскопии. Здесь также обсуждаются перспективы применения методов теории распознавания образов в колебательно-вращательной спектроскопии высокого разрешения.

Вторая глава посвящена задаче идентификации линий КВ спектров многоатомных молекул - одной 113 основных задач теоретического анализа спектров. Идея заключается в том, чтобы использовать хорошо разработанные методы теории распознавания образов для обоснования автоматизации отнесения линий к тем или иным квантовым переходам. Необходимость автоматизации, создания програмных средств поддержки идентификации обусловлены резко возросшими возможностями эксперимента - использование, например, автоматизированных Фурье-спектрометров позволяет регистрировать спектры а аироккх диапазонах, содержащих тысячи и десятки тысяч спектральных элементов.

В разделе 2.1 приводятся основные понятия теории распознавания образов: пространство описаний X, пространство решений 11= {ll1.U2.U3,...} , т.е. совокупность возможных классификаций объектов, пространство ситуаций Л = {Л1Д2.Л3,...}, включающее все возможные ситуации, которые возникают в действительности. Решить задачу распознавания образов означает построить отображение

и(х>: X —> и , ¡1)

наилучшее в некотором, зараннее определенном смысле, например, в смысле близости к отображению и*(х), создаваемому учителем. Решение задачи определяется используемым критерием качества, а

также тлеющейся априорной информацией. Так, если известно полное вероятностное описание этих пространств, можно построить Байесово решение. Чаше всего з задачах распознавания образов не известны даже параметрические семейства совместных распределений на пространствах X и Л, поэтому приходится проводить оценку либо совместных плотностей распределения Х,Л, либо оценивать сразу решающее правило, которое есть не что иное, как разделяющая образы поверхность в пространстве описаний X. Эти оба подхода

используют один и тот же класс процедур, и известны в литературе как "вероятностный" и "детерминисткий".

Для простоты, в дальнейшем речь будет идти о разделяющих функциях f(x) в случае двух классов анализируемых объектов. Предположим, что существует некоторая искомая функция f*(х), и задача заключается в построении разделяющей функции f(x), ближайшей к f* (х). Согласно теории распознавания образов вводится функционал расстояния между функциями в виде: J = Mx{Q(f(x),f*(x))} , (2)

где Mx{F(x)}=|F(x)p(x)dx - матожидание F(x) по х, Q(x,y) - некая X

функция (большинство функционалов можно представить в таком виде, Q(x,y)=(x-y)2 даст среднеквадратичное расстояние и т.д.). Функция f(х) ищется в виде разложения

Г(х)=£с^(х), О)

1=0

где щ(х) - полная ортонормированная система функций.

Построение функции f(х), минимизирующей функционал J, таким образом, сводится к нахождению коэфициентов с^ и проводится при помощи методов потенциальных функций (МПФ) и стохастической аппроксимации {2,3]. Эти методы позволяют восстановить функцию f(x), используя обучающую последовательность {х[1],f*(х[1]), х[2], f*(хf2]),..., х[nj,f*(х[n])I, где x[n] -объекты обучающей последовательности, f*(х[n]) - ответы учителя.

Процедура стохастической аппроксимации для этой задачи имеет вид:

c[n +1] = с[п]+у"г[п + l]VcQ(f (x[n +1], f *(х[п +1]) (4)

Т - знак транспонирования, компоненты вектора у - числовые последовательности. В [2,3] приведены условия сходимости процедуры ив [2] необходимые доказательства. Процедура МПФ имеет вид:

f[n +l](x) = f[n](x)+y[n + ¡]К.(х[п +1], x) . (5)

Здесь у числовая последовательность, и К(х,у) называется потенциальной функцией и удовлетворяет следующим условиям:

1) К(х,х)>0

2) К(х,у)<А

3) К(х,у) = К(у,х)

4) К(х,у)<К(х,х)

Условия для последовательности у[п] приведены в [2,3]. Данный алгоритм называется машинной реализацией МПФ. При выборе К(х,у) в виде

K(x,y) = 2TÍV¡(x)v.(» (7)

i

получается процедура, которая имеет такой же вид, как и метод стохастической аппроксимации и называется "перцептронной" реализацией МПС1.

Процедура (5) имеет очевидный смысл. При очередной ([п+1]) ошибке находится поправка к разделяющей функции f(xí около данной точки х("л+э] признакового пространства так, чтобы функция принимала правильное значение.

При вероятностном подходе (оценка условных плотностей распределения р(х|Х)), процедура (5) перейдет в известную в матстатистике, "ядерую" оценку плотности (оценка Розенблатта-Парзена).

В разделе 2.2 обсуждается постановка задачи и описано применение

методов распознавания для идентификации КЗ линий.

В задаче идентификации KB линий предполагалось, что используемые признаки являются стохастически независимыми. Для ее решения необходимо, во-первых, использовать точное комбинационное правиле как независящее от модельных представлений, во-вторых, необходимо использовать информацию о параметрах линий, содержащуюся в математической модели (вращательных, центробежных постоянны?:, параметрах эффективного дипольного момента) . Задача в этом случае сведется к распознаванию "истинных"' комбинационных разностей. Применение такого подхода позволяет упростить распознавание и ввести вполне естественное (со спектроскопической точки зрения) признаковое пространство. "Распознавание" комбинационных разностей необходимо "усилить", производя уточнение спектроскопических постоянных при нахождении каждого нового уровня энергии.

Наличие "распознавания" при идентификации представляется весьма существенным. Следует заметить, что специалист зачастую предпочитает не объяснять, почему он принимает то или иное отнесение линий или, по крайней мере, не формулирует однозначные правила, а предпочитает показывать их на примере. В литературе какое-либо объяснение идентификации, как правило, не приводится, в ряде работ имеются только ссылки на конкретные примеры. В то

же время применение методов теории распознавания позволяет построить количественное критерии "похожести" распознаваемых объектов на "правильные" и тем самом обосновать отнесение линий.

Использование методов и языка теории распознавания образов позволяет свести задачу идентификация линий в КВ спектрах к решаемой стандартными методами. Более того, применение втих методов позволяет создать алгоритма автоматической идентификации линий.

Требуемое решающее правило может меняться от спектра к спектру, поскольку может меняться точность измерений параметров линий, степень зашумленности спектров, что накладывает

определенные требования на используемые алгоритмы идентификации.

Для обеспечения необходимой гибкости процедура идентификации предпочтительно применить адаптивные или обучаемые алгоритмы теории распознавания образов. В то же время применение ¡этих методов неизбежно, поскольку правила идентификации весьма сложные - их можно правильно показать только на примерах, т.е. при помощи обучающей последовательности.

Применение методов распознавания требует выполнения определенных специфических условий. Одним из необходимых моментов является достаточная информативность признаков, составляющих пространство описаний X, т.е. достаточность содержащейся в них информации для распознавания обьектов, принадлежащих различным классам. В частности, информативность может быть связана с компактностью образов [3] в X. Понятие компактности включает два основных свойства. Первое достаточная гладкость разделяющих поверхностей между классами для того, чтобы их можно было аппроксимировать рядом (3) с меньшим числом слагаемых. Второе свойство - информативность (в указанном выше смысле) и стохастическая независимость используемых признаков. Также следует заметить, что если разделяющие поверхности хорошо аппроксимируются разложением (3), но имеют слишком "вытянутую" форму, то это обычно плохо сказывается на скорости сходимости процесса обучения.

Будем называть "набором" группу линий, приближенно удовлетворяющих комбинационному правилу. Как уже отмечалось, в спектре для каждого искомого уровня энергии можно найти

несколько "похожих" наборов, из которых спектроскопист по некоторым признакам, а также руководствуясь опытом, выбирает правильный. Каждый набор характеризуется определенными свойствами. Например, отклонением от расчета по частоте, по интенсивности, точностью выполнения комбинационого правила и т.д. Кроме того, каждая из линий характеризуется определенным количеством спектроскопических параметров - значением центра, интенсивности, параметрами формы контура, его асимметрией. Поскольку при оценках наборов мы должны учитывать парные соотношения между спектроскопическими параметрами, то можно сделать вывод, что общее число признаков достаточно велико и задача состоит в выборе информативных комбинаций этих признаков. Отметим, что использование таких параметров линий, как коэффициенты уширения или сдвига давлением, нецелесообразно, поскольку, во-первых, они определяются в настоящее время недостаточно точно и, во-вторых, их измерения проводятся редко. Основными данными, которые необходимо использовать для построения признакового пространства, являются значения частот линий, интенсивностей и их соответствие вычисленным значениям.

В процессе анализа спектров воды в различных спектральных диапазонах, спектров изотопных модификаций Н9О были выявлены следующие комбинации спектроскопических параметров, вычисляемые для каждой отдельной линии в наборе, которые целесообразно использовать при распознавании :

1) отклонение экспериментальной частоты линии от расчетной:

Х0=1п(1 + К'«р-Лха,с|хк»)хк^ (8)

Этот признак указывает, насколько далеко данная линия расположена относительно ее ожидаемого положения.

2) отклонение экспериментальной интенсивности линии от расчетной :

X, = 5п(1 -ь!бсхР-Бса!с[ х Ц1) х к{ (9)

Этот признак указывает насколько сильно интенсивность данной линии отличается от ожидаемой.

3) отклонение энергии верхнего состояния, вычисленной из измеренного центра линии, от энергии, вычисленной как среднее по всему набору

х2 = 1п(1 +

Е«Р-Е"Р

к2)хк1 (10)

Этот признак оценивает точность выполнения комбинационного правила для конкретной линии.

4) отклонение экспериментальной интенсивности линии от средней по всему набору расчетной интенсивности :

Хз = 1п(1 +

__ -calc

xk^)xki

(11)

5) пропорциональность измеренных и расчетных интенсивностей линий:

Х4 = 1 , (12)

где - коэффициент корреляции между вычисленными и

найденными интенсивностями по проверяемому набору. Выборочный коэффициент корреляции для некоторых двух случайных величин х,у можно вычислить по формуле

пМ

где - элементы выборок этих величин.

Это признак указывает, насколько данный набор "похож" (подобен) по интенсивностям на вычисленный.

б) отношение суммарной интенсивности всех найденных линий к вычисленной суммарной интенсивности линий:

Х5 = 1п

1 + 1п

Is"*

Is'

.calc

^

Xk§

хЦ

(13)

Этот признак позволяет различать одинаковые комбинационные разности различных полос.

7) точность соблюдения комбинационного правила для всей группы

=

п-

-Е"РУ х юоо

(14)

Компоненты 5), 6), 7) используются для каждой линии отдельно, но характеризует весь набор целиком и получаются одинаковыми для всех линий в наборе.

"Правильный" набор выбирается по наличию в нем линии с максимальным (среди всех наборов) положительным показателем разделяющей функции f(х).

При практической реализации проверялась информативность признаков на примере спектра Н2О в области 1.4 мкм (первая гексада взаимодействующих колебательных состояний),

Идентификация линий в этой области известна из недавней (1994 год) работы американского спектроскописта Р.Toca [4], она также подтверждена решением обратных задач. При тестировании системы после обучения и при хорошем воспроизведении интенсивности линий вероятность ошибки составила 0.03. При этом были исправлены ошибки в идентификации, а следовательно и в экспериментальных значениях уровней энергии, приведенных в [4],~ в целом 10% от общего числа найденых уровней оказались неверными. Обнаружение ошибки явлтатся типичным результатом ручной обработки спектра, поскольку большинство из этих уровней находятся по "хорошим" комбинационным разностям.

Логарифмы в (8)-(13) использовались для сужения диапазонов разброса величин. Константы K¡ подбираются так,чтобы диапазоны были сосредоточены на отрезке, на котором определены базисные функции (для функций Эрмита примерно [-10,+10] , поскольку в данном интервале сосредоточены наибольшие по модулю значения этих функций). Такой выбор коэффициентов обеспечивает в определенной степени компактность отображения классов в признаковом пространстве.

Функции у[п] в (4) были взятк в виде

f , f*(x[n + l])-f(xM])

7Í ' <15>

I

f+s если f(x,c)<0 и линия правильная

f*W = i (16)

1-е если f(x,c)>0 и линия неправильная

с ~ малая величина, была выбрана £=0.01. Выражение (15)

срабатывает так, что после шага обучения п+1 перцептрон

показывает для х[п+1] то, что показал учитель - f(x[n+l]) = f*(x[n+l])

(для данного случая f(xfn+ l],c) = s(x[n + l]) i, указывая, что х лежит не на самой разделяющей поверхности, а вблизи от нее. Базисные функции на пространстве X=R7 'семимерное евклидово пространство) есть всевозможные произведения вида

%(*)= П7 ПШ ' (17>

х2 / /2i+'

где Ч^(х) = Njexp{——}Н[(х), НДд:)- полиномы Эрмита, N, = «~[Г

нормировочный множитель. Множители т)х, стоящие в выражении (7), взяты равными 1.

При тестировании системы на примере спектра HjO в области 1.4 мкм из [4] была получена зависимость вероятности ошибки от длины обучающей последовательности (см. рис.1).

Рис,1 Зависимость вероятности ошибки от длины обучающей последовательности: А - используются все 7 признаков, Б -используются только отклонения по частоте и по интенсивности (8),(9), Б - предполагаемая кривая при использовании признаков (8)-(14) с добавлением малоинформативных признаков.

В разделе 2.3 описывается применение методов теории распознавания образов в задаче поиска пиков на кривой спектральной зависимости поглощения или пропускания.

Б настоящее время в литературе имеется достаточно большое количество статей, посвященных способам получения точных характеристик линий путем подгонки контуров по методу наименьших квадратов. Однако эти процедуры используются "вручную" для большинства линий, так как до сих пор не решена на достаточном уровне задача автоматического поиска минимумов (максимумов),

соответствующих спектральным линиям. Существующие алгоритмы недостаточно эффективны и неустойчивы к шумам спектра. В [1] содержится описание задачи и метод ее решения, основанный на сравнении значений первой и второй производных от спектральной кривой с некоторыми пороговыми значениями. В то же время методы теории распознавания образоЕ позволяют легко анализировать одновременно достаточно длинный ряд точек участка кривой, проверяемой на наличие линии и, таким образом, позволяют использовать всю имеющуюся на этом участке информацию.

Для решения задачи на»«-; был применен перцептрон Розенблатта [3] , разработанная процедура была использована в автоматизированной программе, обслуживающей внутрирезонаторный лазерный спектрометр с лазером на стекле с неодимом, и применялась для получения списков линий спектров Н2О, СН4 и СО2. В качестве примера эффективности метода отметим, что для спектра СО2 программа позволила найти и определить по методу наименьших квадратов центры и коэффициенты поглощения более тысячи линий за несколько часов без участия пользователя.

В разделе 2.4 описана разработанная автором экспертная система, позволяющая автоматически проводить отнесение линий в спектрах.

Система, способна как в автоматическом , так и "шаговом" ;пслу-аптоматическом, когда система осуществляет поддержку принятия решения спектроскопистом) режимах проводить идентификацию линий в колебательно- вращательных спектрах и определять необходимые спектроскопические характеристики. Она использует, в отличие от аналогичных (например С3]) программ, алгоритмы теории распознавания образов, обучение распознаванию, что позволяет достичь необходимой гибкости, а также дает возможность применения различных способов идентификации как с использованием комбинационных правил для анализа сильных полос, так и для идентификации слабых, "одиночных" линий, для которых метод комбинационных разностей неприменим.

Разработанная система имеет развитые средства диалога с пользователем и обширный спектроскопический сервис, включающий все самые современные модельные представления, начиная с традиционного гамильтониана Уотсона [6], который до сих пор активно используется и хорошо работает для тяжелых молекул.

Система включает также гамильтониан, использующий аппроксимации Паде-Бореля [7] и, наконец, метод производящих функций [8] . Программный пакет автоматически учитывает дипольные правила отбора при вычислении частот и интенсивностей переходов ( в настоящем варианте они могут задаваться для молекул типов Cs и C2v) • Имеются встроенные средства управления решением обратной спектроскопической задачи ¡подгонка спектроскопических постоянных гамильтониана по полученным из спектра уровням энергии) с использованием процедуры подгонки, имеющейся у пользователя. База знаний системы формируется в процессе обучения и содержит информацию о признаках, необходимую для распознавания комбинационных разностей.

Результаты идентификации и найденные уровни энергии накапливаются в специализированных банках данных. В любой момент можно отложить и возобновить работу, провести корректировку полученных данных. Результаты выводятся из банков в виде готовых стандартных таблиц. Разработанная экспертная система широко применялась для анализа спектров H2S, HDO, D2O, и Н2^0.

В третьей главе представлены результаты анализа спектров Н21б0 в области 11600-12700 см-1, Нг180 в области 11303-13609 см-1 и спектра Hj^O в области 13800-16000 см-1 - исследованого впервые. Для анализа использовалась экспертная система, описанная в предыдущем разделе.

Спектры паров воды при естественном содержании изотопов и спектры обогащенной изотопом воды бьши зарегистрированы в

Национальной Солнечной Обсерватории США (Kitt Peak) на Фурье спектрометре высокого разрешения. На рис.2 и 3 приведены "обзорные" спектры и отмечены найденные полосы. Впервые определены уровни высоковозбужденных состояний (032), (230), (051) спектроскопические постоянные второй декады: 104

вращательных, центробежных, резонансных постоянных

воспроизводят 484 вращательных уровня со средней точностью 0.034 см"1. Найдены параметры дипольного момента, описывающие интенсивности линий со средней точностью 3.9%. Исправлены ошибки идентификации линий, приведенной в работе [9] (около 20% уровней).

кн 1.0

o.e 0,6 0,4 0,2

0,0

11000 11500 12000 12500 13000 13500

v,CM

Рис 2. Спектр Нт'^О в области 0.8 мкм .

Использование экспертной системы значительно облегчило анализ спектра - в ванном случае спектр содержал более трех тысяч линий, которые могут относиться к 43 полосам. Наличие автоматизированной системы позволяет легко оценивать различные варианты идентификации к ~ь:0ирать наилучшие из них.

При подгонке вращательные и центробежные постоянные "темных"' состояний (051), (150), (070) и (080) фиксировались. При этом трудно оценить точность фиксированных параметров, которые сильно влияют на волновые функции и, следовательно,на вычисленные интенсивности. Поэтому удовлетворительная подгонка интенсивностей является дополнительным критерием достоверности полученных результатов.

Линии полос 5v2+V3, vl+^v2' 7v2 , Sv2 слишком слабые и в спектре не наблюдаются, поэтому все параметры v'uk лля V= (051) , (150! , (070) и (080) были взяты равными нулю. 3 то же время интенсивности четырех линий, образованных переходами на вращательное состояние ;853](С51), хорошо воспроизводятся расчетом. Присутствие этих линий в спектре объясняется резонансным перераспределением интенсивностей между переходами на [853](051) и линиями сильной полосы 2V^+V2+V3. Такой же

эффект наблюдается для полосы (230)-(000), для переходов на [836] и [744], которые имеют сильное

V.CM1

Рис. 3. Спектр Нг'^О в области 0.6-0.9 мкм.

смешивание (15% и 42% соответственно) с переходами полосы (211)-(ООО). Интенсивности переходов на уровни сравнительно слабых полос [964] (131), [10463(131), [1029] (112), [643](032) и [642](032) также значительно увеличились за счет резонансного перераспределения, что хорошо согласуется с теоретическими оценками. Обнаружен HEL-резонанс ([10]) между уровнями Ка=2 состояния (080), принадлежашего более высокой полиаде 4v, и уровнями (230).

При анализе спектров поглощения H21S0 найдено 17 новых полос, в результате идентификации определены 512 новых уровней энергии.

Для состояний второй декады Нз^О, как и в случае основной изотопной модификации, обнаружена сложная картина резонансных взаимодействий. В частности, в некоторых случаях волновая функция представляла собой суперпозицию из примерно равных по величине вкладов от трех или даже четырех колебательных состояний.

Таблица 1. Фрагмент идентификации спеуггра лог-лошаки* н216о в облаете 11600__12700 из 6али даниих, созданной экспертной системой, _

Гг^.оЬв. АЬяогр!. Хп1:епв, \ГГВ »У* Ка' Кс' ч1"КапКс" 1са1с.

(ст-1) (ст-2/аШ) (сге-г/а-Ьа)

11610 6052 7 00Е-03 2 94Е-06 (131) 8 0 8 9 0 9 2 0е-06

11637.8253 1 00Е-02 4 21Е-06 <131) 7 1 7 в 1 8 3 7е-06

11650 1362 6 00Е-03 2 52Е-06 (230) 3 1 2 4 2 3 1 4е-06

11660 0117 4 ООЕ-ОЗ 1 68Е-06 (131) 6 2 4 7 2 5 1 бе-06

11661 1874 1 60Ё-02 6 75Е-06 <131) 6 0 6 7 0 7 6 Зе-06

11663 1393 5 ООЕ-ОЗ •> 105-06 (131) 6 1 6 7 1 7 2 1е~06

116СЗ 9911 1 20Е-02 5 05Е-06 (131) 6 1 5 7 1 6 3 0е-06

11664 €686 7 00Б-03 г 94Е-06 (131) 7 2 6 8 2 7 1 8е-06

11667 1246 8 ООЕ-ОЗ 3 36Е-06 (230) 4 1 4 5 0 5 3 бе-ОЕ

11675 8122 1 О0Е-02 4 21Е-06 (230! 3 0 3 4 1 4 3 5 е-06

11221 0070 в ООЕ-ОЗ Э ЗСЕ-05 (131) 5 1 4 6 1 5 1 Зе-06

11604 0513 1 20Е-02 5 05Е-06 (131) 5 0 5 6 0 6 3 2е-06

11684 «899 6 ООЕ-ОЗ 2 52Е-06 (131) 6 2 5 7 2 6 1 Зе-06

(230) 5 0 5 5 1 4 7 8е-07

11685 8079 6 ООЕ-ОЗ 2 52Е-06 (131) 5 2 3 6 2 4 1 6е-06

11685 9371 7 ООЕ-ОЗ 2 94Е-06 (230) 1 1 0 2 2 1 2 1е-06

11687 5709 2 60Е-02 1 10Е-05 (131) 5 1 5 6 1 б 1. 0е-05

11692 1683 6 ООЕ-ОЗ 2 52Е-06 (230) 3 1 3 4 0 4 1 4е-0б

11693 2081 6 ООЕ-ОЗ 2 52Е-06 (230) 2 0 2 3 1 3 1 2с-06

11696 5656 7 ООЕ-ОЗ 2 94Е-06 (131) 6 3 3 7 3 4 2 1е-06

Таблица 2. "Экспериментальные" уровни энергии (см""-*-) состоянии (211),

(013),( 131 >,( 112) ГЕ- сценка оиибки определения уровня, о-с - (ЕоЬБ~Еса1с> х

1С00, N - число линий, пслальзоваксихся в определении уровня._

(211! (013) (131) (112)

) КаКс ЕоЬ$ ИЕ N о-с ЕоЫ ОЕ N о-с ЕоЬ* ОЕ N о-с ЕоЪ5 ОЪ N о-с

0 0 0 12151.25*8 1 0 12565.007) 1 0 11813.2072 1 0 12407.6621 1 0

1 0 1 12173.7645 0 1 2 -3 ¡2588 1558 0.2 2 1 11836 4559 0.1 2 5 12430.5229 0.4 2

1 1 1 12187 8160 0 1 2 0 12600 5751 0.2 2 6 11859.1186 0.4 2 25 [2444 0944 0.4 2 -3

1 1 0 12193 3457 0 2 2 4 12606.2633 0.6 2 7 11865.2874 0 1 2 26 (2449 6463 0 1 2 -5

2 0 2 12218 9849 0.1 4 17 12632 8672 0 1 2 2 11881.7988 0 4 2 10 12474.8501 0.1 2

1 2 12227 8807 0.2 3 <; 12641.2050 0.2 3 10 11899.4080 0.3 3 32 12484.2628 0.1 2 1

2 I 1 12244.3999 0.14 13 12658.2371 0.5 3 11 11917.8484 0.3 3 29 12500.8894 0.4 3 -3

2 2 1 12285.3660 0.3 3 -4 12695 1010 0 7 2 -6 11983 9709 0.5 2 -24 12541 6849 0.1 4 6

2 2 0 12286.7251 0.1 3 -3 12696.6511 02 2 -4 11985,0654 0.2 2 -22 12543 0516 0.3 3 6

3 0 3 12282.1606 0.1 4 15 12696.7370 0.2 2 -3 11947.2153 0.5 2 9 12538 38970.2 3

3 1 3 12287.2482 0.3 4 9 12701.2342 0.2 3 и 11959.1959 0.1 3 36 12543.7075 0.2 2 7

3 1 2 12319.8576 0.3 4 20 12734.9195 0.13 11 11995.73170.5 2 15 12576 6520 0.1 4 -3

3 г 2 12353.7312 0.3 4 10 12764.6611 0.2 4 6 12053.7520 0.4 3 0 12610.2776 0 6 3 19

3 2 1 12360.0040 0.2 4 15 12771.7102 0.2 3 9 12058.9565 04 3 0 12616.5896 0.3 3 17

з 3 1 12435.3352 0 2 -24 12839 8482 0.2 2 -19 12174.5155 0.1 2 -56 12691.4289 0.1 2 -19

я з о 12435,5540 0.1 2 -23 12840 12800 1 2 -19 12174.6383110.3 2 -53 12691.7141 0.2 2 -27

4 0 4 12362.8627 0.2 4 10 12777.5016 0.2 3 17 12030 6201 0 I 2 О 12619.7531 0.6 2

4 ] 4 12365.2829 0.1 3 10 12779.9342 0 3 2 9 12037 87)3 0.3 2 31 12621.7420 06 3 7

4 1 3 12418.0845 0.4 4 >9 12834 47580 2 2 2 12097.3294 0.1 2 -76 12675.3671 0.3 2 -7

4 2 3 12443.7673 0.4 4 17 12856.0053 0.5 3 11 12145.8192 0.5 2 6 12700.5296 1.2 3 25

4 2 2 12460.1759 0.5 5 18 12874.1058 0.4 4 11 12160.0697 0.7 3 0 12717.0581 0.9 2 19

4 3 2 12528.7574 0.4 5 -1 12935.3747 1.0 3 -1 12269.6019 0.3 2 -11 12785.4574 0.1 4 -12

4 3 1 12530.20600.2 4 -1 12937.1887 0.2 3 4 12270,4387 0.3 3 0 12786.6033 0.1 3 -8

Вследствие этого имело место резонансное перераспределение интенсивностей, приводящее к появлению в спектре линий слабых полос. Резонансные возмущения также проявились в инверсии некоторых вращательных уровней, так уровень (211)[818] из-за сложного взаимодействия с состояниями (131), (230), (310) оказался сдвинут на 1 и "инвертирован" по отношению к

(211) [808]. Для корректного вычисления вращательных уровней состояний (230) и (131), как и в случае Н21^0, мы вынуждены были учесть взаимодействия с состоянием (080), формально принадлежащим полиаде 4v - так называемые KEL-резонансы [10] . Аналогичные взаимодействия учтены для (310), (112) и (160).

В результате анализа спектра поглощения Н2180 около 0.66 мкм найдено 10 новых полос поглощения, 257 новых экпериментальных уровней энергии.

Заключение.

Основные результаты работы заключаются в следующем:

1. Создана экспертная система, позволяющая в автоматическом режиме проводить идентификацию линий в спектрах. Данная экспертная система содержит необходимую вычислительную базу для идентификации линий молекул типа асимметричного волчка. Кроме традиционной модели - эффективного гамильтониана Уотсона, данная система использует и новые методы - аппроксимации Паде-Бореля, метод производящих функций. Кроме того, возможна итерационная процедура идентификации, единственно применимая для слабых полос. Система осуществляет поддержку идентификации, автоматически готовит необходимые базы данных.

2. Экспертная система применена для анализа КВ-спектров молекул и Н2*®0, образованных переходами на высоковозбуаденные колебательные состояния, при этом:

а) Проведен новый анализ спектра поглощения вода в области 0.8 мкм, определены вращательные и центробежные постоянные, параметры дипольного момента, позволяющие рассчитать спектр на уровне, близком к точности эксперимента.

б) Впервые осуществлен анализ спектра изотопной модификации Н2180 в широком спектральном диапазоне вплоть до 16000 см~1, определены вращательные уровни энергии 17 колебательных состояний.

Полученные данные составляю? большой объем таблиц (123 страницы? с идентификацией линий в спектрах к с уровнями энергии, помеиеных в Приложениях 2-4. Представленная информация о спектральных характеристиках водяного пара необходима для применения в атмосферной оптике, для восстановления параметров потенциальной функции и дипольного момента. Эти данные также могут быть использованы при исследовании поведения квантовых систем в условиях сильного возбуждения.

Из результатов paîoœ можно сделать следующие еыбсды:

1. Процесс принятия решений при идентификации КВ-линий может быть формализован в терминах теории распознавания образов. Это позволяет создавать програмные средства поддержки интерпретации или системы автоматической интерпретации спектров.

Эффективная работа с современными спектрами, содержащими тысячи линий, может быть обеспечена только при компьютерной поддержке, которая ускоряет или автоматизирует принятие решений при идентификации, а также обеспечивает накопление получаемой информации в банках данных б упорядоченном виде.

2. Анализ КЗ спектров, образованных переходами на Ексоковозбуждекные состояния, невозможен без соответствующего решения обратных задач. Предсказательные расчеты центров и интенсивностей линий, представляют единственную возможность дать обоснованную интерпретацию спектров.

3. При анализе спектров поглощения молекул и Н2^®0 обнаружено резонансное взаимодействие между колебательными состояниями, принадлежащими различным полиадам. Следовательно, последующий анализ KB энергетического спектра воды подразумевает совместное рассмотрение всех высоких полиад, с одновременным решением обратной спектроскопической задачи.

ЛИТЕРАТУРА

1. Per Jensen. The Giessen Programm Package for processing spectral data from 13RUKER IFS 120 HR interferometer using an IBM compatible personal computer. Justus Leibig University Glessen. January 1990.

2. М.А.Аизерман. Э.И.БраверманЛИ.Розоноэр, Метод потенциальных функций в задачах обучения машин. М.Наука 1970.

3. Л.Л.Левин, Введение в теорию распознавания образов.ЛГомск, 1982/.

4. R.A. Toth, Extensive measurements of f^'^O line frequencies and strengths: 5750 to 7965 era"1. //Applied Optics, vol. 33, No. 21 (1994).

5. S. Urban and J.Behrend, A Software Package for Assignment of Vibration -Rotation Bands of Asymmetric Top Molecuies.Proc. Forteen Colloqium on Hight Resolution Molecular Spectroscopy, 1995,p. B30.

6. Watson J.K.G., Determination of centrifugal distortion coefficients of asymmetric top molecules. //J.Chem.Phys.- 46, 1935-1948 (1967)

7. O.L.Polyanskii, One-Dimensional Approximation of Effective Rotational Hamiltonian of the Ground state of the Water Molecule. //J.Mol.Spectrosc. 112,79 (1985)

8. V.I.Starikov, S.A.Tashkun, and Vl.G.Tymrev, Description of Vibration-Rotation Energies of Nonrigid Triatomic Molecules Using Generating Function Method. //J.Mol.Spectrosc. 151,130-147 (1992).

9. RA. Toth, Measurements of Н21бО Line Positions and Strengths: 11 600 to 12 861 cm"1. //J.Mol.Spectrosc. 166,176-183(1994).

10. Быков А.Д.,Шумейко О.В..Синица Л.Н., Новый резонанс в молекуле Н2О. //Оптика атмосферы.-1990,-Т.З, N10.-с. J115-1120

Основные результаты изложены в следующих публикациях:

1. A.Bykov, O.Naumenko, T.Petrova, A.Scherbakov, L.Sinitsa. Intracavity laser spectroscopy of water vapor isotopic species. // SPIE Proceedings, Vol. 2797, p. 236-242 (1996).

2. J.-M.Flaud, C.Camy-Peyret, J.P.Chevilard, A.Bykov, A.Scherbakov, B.Voronin, T.Petrova. L.Sinitsa. H2180 spectrum between 143000 and 15500 cm-1. // SPIE Proceedings, Vol. 3090, p. 233-234 (1997).

3. J.-M.Flaud, C.Camy-Peyret, J.P.Chevilard, A.Bykov, O.Naumenko, T.Petrova. A.Scherbakov, L-Sinitsa. The high-resolution spectrum of water vapor between 113000 and 13200 cm-1. II SPIE Proceedings, Vol. 3090, p. 227-232 (1997).

4. A.Bykov, O.Naumenko, T.Petrova, A.Scherbakov, L.Sinitsa, J.-Y.Mandin, C.Camy-Peyret, J.-M.Flaud. The second decade of H2^0: Line positions and energy levels. // J.Mol.Spectrosc.,-Vol. 172, p. 243-253(1995).

5. J.-M.Flaud, C.Camy-Peyret., A.Bykov, O.Naumenko, T.Petrova, A.Scherbakov, L.Sinitsa. The high-resolution spectrum of water vapor between 113000 and 13200 cm-1. //ASA Workshop Proceedings, p. 95-98, Reims, 1997.

6. J.-M.Flaud, C.Camy-Peyret, J.P.Chevilard, A.Bykov. A.Scherbakov, B.Voronin, T.Petrova, L.Sinitsa. H2!80 spectrum between 143000 and 15500 cm-1. II Abstract on 12-International symposium and school on high-resolution molecular spectroscopy, HighRus-96, Petergof, 1996, p.36.

7. J.-M.Flaud, C.Camy-Peyret, J.P.Chevilard. A.Bykov, O.Naumenko, T.Petrova. A.Scherbakov, LSinitsa. The high-resolution spectrum of water vapor between ! 13000 and 13200 cm-J. // Abstract on 12-International symposium and school on high-resolution molecular spectroscopy, HighRus-96, Petergof, 1996, p.50.

8. J.-M.Flaud. C.Camy-Peyret, J.P.Chevilard, A.Bykov, B.Voronin, T.Petrova, LSinitsa, A.Scherbakov. Analysis of the spectrum in 0.7 цгп region.// Abstracts of 14 International Conference on high Resolution Molecular Spectroscopy. Prague 1996, p. 126.

9. J.-M.Flaud. C.Camy-Peyret, J.P.Chevilard, A.Bykov, O.Naumenko. T.Petrova, A.Scherbakov and L-Smifsa. Spectroscopic parameters of the H2*60 second decade. // Abstracts of 14 International Conference on high Resolution Molecular Spectroscopy. Prague 1996, p. 228.

10. А.П.Щербаков. Применение методов теории распознавания образов для анализа спектров. // 2-й Межреспубликанский симпозиум по оптике атмосферы и океана. - Томск - 1995. стр. 45-46.

П. А.П.Щербаков. Применение методов теории распознавания образов для идентификации линий в колебательно-вращательных спектрах. // Оптика атмосферы и океана, т. 10.- N. 8, 1997. (в печати)

12. J.-M.Flaud, C.Camy-Peyret. J.P.Chevilard, A.Bykov, O.Naumenko, A.Scherbakov, T.Petrova, L.Sinitsa. The second decade of J^'^O molecule // J. Mol.Spectrosc. 183, p. 300-309(1997)

13. J.-M.Flaud, C.Camy-Peyret. A.Bykov. O.Naumenko, T.Petrovav, A.Scherbakov, L.Sinitsa. The water vapor line strengths between 11600 and 12700 cm"'. // J.Mol.Spectrosc. (в печати)