Методы минимаксной интерпретации измерений тема автореферата и диссертации по математике, 01.01.03 ВАК РФ
Кириллов, Константин Викторович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1999
ГОД ЗАЩИТЫ
|
|
01.01.03
КОД ВАК РФ
|
||
|
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
_имени М.В. ЛОМОНОСОВА_
ФИЗИЧЕСКИЙ ФАКУЛЬТЕТ Кафедра компьютерных методов физики
На правах рукописи УДК 519.2:534
Кириллов Константин Викторович
МЕТОДЫ МИНИМАКСНОЙ ИНТЕРПРЕТАЦИИ ИЗМЕРЕНИЙ
01.01.03. - математическая физика
ДИССЕРТАЦИЯ
на соискание ученой степени кандидата физико-математических наук
Научный руководитель: доктор физико-математических наук,
профессор Чуличков Алексей Иванович
Москва - 1999
СОДЕРЖАНИЕ
ВВЕДЕНИЕ .......................................... 4
Глава 1. Теоретико-вероятностные методы анализа и интерпретации экспериментальных данных .................... 16
§1. Задача интерпретации измерений ..................... 16
§2. Редукция для модели [А,2(] схемы измерений .......... 19
§3. Редукция для моделей [и [А,ГД0,1](] схемы измерений ............................................... 21
§4. Эффективный ранг модели измерений ................. 23
Глава 2. Минимаксные методы интерпретации измерений при нечеткой исходной информации ...................... 26
§1. Основные положения теории возможностей ............ 26
§2. Оценивание в теории возможностей ................... 33
§3. Задача интерпретации измерений в теоретико-возможностной
постановке ......................................... 35
§4. Минимаксная интерпретация измерений в случае отсутствия
априорной нечеткой информации о входном сигнале...... 39
§5. Минимаксная интерпретация измерений при наличии априорной нечеткой информации о входном сигнале ........... 43
§6. Эффективный ранг теоретико-возможностной схемы измере ний ............................................... 47
Глава 3. Минимаксные методы оптимального оценивания в ряде физических задач .................................. 65
§1. Задача интерпретации экспериментальных данных, полученных с помощью измерительных преобразователей второго
порядка ............................................ 65
§2. Задача определения сечения фотоядерной реакции по экспериментальным данным выхода фотоядерного процесса ...... 76
§3. Задача определения спектра гравитационно-капиллярных волн
по данным радиометрических наблюдений .............. 85
ЗАКЛЮЧЕНИЕ ............................................97
ЛИТЕРАТУРА ....................................... 100
ВВЕДЕНИЕ
Во многих современных физических исследованиях важную роль играет задача оптимального оценивания параметров физической системы на основе экспериментальных данных измерительных приборов.
Основная проблема, возникающая при проведении экспериментальных исследований, состоит в том, что процесс измерения всегда сопровождается некоторой принципиально неустранимой погрешностью и получение абсолютно точных экспериментальных данных о системе невозможно. Кроме этого, во многих случаях свойства системы оказывается искаженными вследствие взаимодействия изучаемой физической системы с измерительным прибором, приводящего к тому, что параметры системы, в которую помещен посторонний объект измерительный прибор, могут значительно отличаться от интересующих исследователя параметров системы в естественном состоянии, невозмущенном измерением.
Современные технологии интерпретации эксперимента, использующие ЭВМ как составную часть измерительного прибора в качестве инструмента для обработки данных экспериментальных исследований, позволяют эффективно решать задачи оптимального оценивания параметров физических систем и уменьшения искажающего влияния на результаты интерпретации измерения процессов и явлений, сопровождающих измерение и допускающих математическое описание.
Часто на практике в качестве математической модели системы, содержащей измерительный прибор, используется линейная схема измерений [1,2]
% = А/ + у, (В.1)
где £ - искаженный шумом у выходной сигнал прибора А, на вход которого подан сигнал / от изучаемой физической системы. В
математической модели схемы измерения (В.1) считается, что / ¿г еЯп, А/ еЯп, где Яп и Кт- линейные евклидовы
пространства размерностей п < оо и т < оо соответственно, ->ЛЙ)~ линейный оператор, действующий из Кт в Яп,
моделирующий действие измерительного прибора А. Обозначения
для прибора А и его математической модели совпадают.
Исследователя интересует либо сам сигнал /<=Ят, либо, в более общем случае, некоторая линейная функция и/ <=Як от /, задаваемая известным линейным оператором и е Кт -» Кк.
Сигнал и/, в частности, может определять характеристики объекта в «естественном» состоянии, невозмущенном измерением. В этом случае оператор и можно рассматривать как модель идеального измерительного прибора, взаимодействующего с объектом и средой так же, как и прибор А, на вход которого подается такой же сигнал /, но на выходе действует сигнал и/,
дающий интересующие исследователя значения параметров объекта в состоянии, невозмущенном измерением. Например, при 11 = 1, где /- единичный оператор, говорят об идеальном приборе, который не искажает входной сигнал /.
Задача интерпретации измерения состоит в том, чтобы по известному результату измерения £, заданной модели прибора А,
ошибки измерения у и, возможно, априорной информации о
классе входных сигналов /, получить наиболее точную оценку
интересующих исследователя параметров системы, то есть сигнала Ц/ на выходе идеального прибора и.
Существуют несколько подходов к решению задачи интерпретации измерений. Наиболее полно к настоящему времени разработана теория линейных измерительно-вычислительных систем (ИБС) [1,2], основанная на применении стохастической модели измерений (В.1). На выходе ИБС, представляющей собой измерительный прибор в комплексе с вычислительным устройством, предназначенным для решения задачи интерпретации экспериментальных данных, исследователь получает оценку интересующих его параметров объекта, обладающую наименьшим значением среднеквадратичной погрешности оценивания. Методы, основанные на понятии эффективного ранга модели измерения [3], дают ответы на вопрос о предельных возможностях измерительного прибора и количестве информации, которое может быть получено с гарантированной точностью.
Актуальность темы.
В ряде случаев, полное описание информации о характеристиках и свойствах физической системы с помощью стохастических методов не представляется возможным. В стохастическом подходе основными характеристиками события является понятие вероятности как частоты его наступления и математического ожидания как среднего количества исходов эксперимента, при которых происходит это событие.
Часто на практике не удается построить адекватную стохастическую модель измерений, то есть задать математические
ожидания и ковариационные операторы входящих в модель случайных элементов.
Иногда формулировка стохастической модели измерений затруднена из-за уникальности эксперимента, т.е. тогда, когда он проводится один единственный раз. В этом случае такие параметры, как математическое ожидание или ковариационный оператор измеряемых сигналов или случайных параметров, оказываются бессмысленными, т.к. их наблюдение возможно лишь по большому (вообще говоря, бесконечному) числу реализаций.
В этой ситуации обычно приходится прибегать к «мысленному» эксперименту, повторяющемуся достаточно большое количество раз, для того, чтобы применить на практике оценки, полученные в рамках стохастических моделей. Трудности такого подхода достаточно очевидны.
В то же время, в процессе измерений и анализа полученных экспериментальных данных, исследователь часто располагает различной качественной информацией, основанной на его знаниях и представлениях о системе как эксперта в конкретной области физики и на предыдущем опыте исследования данной системы. Эта информация, как правило, не может быть корректно представлена в количественных стохастических терминах и использована для улучшения качества интерпретации.
В диссертации исследуются минимаксные методы оптимального оценивания параметров физических систем по результатам измерений, основанных на математическом аппарате теории возможностей [4-12], с помощью которого исходная качественная информация о системе и экспертные представления исследователя могут быть описаны количественно и использованы
при решении задачи интерпретации данных физического эксперимента.
В отличие от теории вероятностей, в теории возможностей нет строгой связи возможности события с частотой исхода эксперимента и для описания качественной информации используется понятие возможности как сравнительной характеристики различных событий, означающей, какое событие в большей степени возможно и какое в меньшей. Качественная информация о более возможных и менее возможных значениях вектора £,
принимающего значения на некотором множестве X, задается распределением возможностей - функцией ц4 (х): X -> [0,1], которая
для каждого хеХ является характеристикой возможности того, что вектор £ примет конкретное значение £ = х [6]. При этом, если ц4(х) = 1, то равенство Е, = х вполне возможно, и если ц4(х) = о, то равенство £ = х невозможно. Промежуточные значения функции м4(х) интерпретируются следующим образом: чем ближе /и4(х) к единице, тем более возможным является равенство В, = х.
Аппарат теории возможностей обладает свойством инвариантности, означающим сохранение всех определений и выводов при любом не изменяющем порядок преобразовании шкалы возможности. Это означает, что численная величина возможности одного события имеет значение только по отношению к величине возможности другого события и служит для сравнения возможностей наступления этих событий. Иными словами, величина /и4(х) служит только для того, чтобы указать, что при /^(х,) > мЧх), равенство £ = х, более возможно, чем равенство ¿г = х. В рамках теории возможностей не интересуются тем, «насколько» одно значение вектора £ более возможно, чем
другое, т.к. изменением шкалы возможностей можно изменить величину ^ (х{) - ^ (х), но нельзя изменить порядок, т.е. знак разности ц4(хх)~(х).
Оценивание в теории возможностей основано на принципе минимизации возможности ошибки, возникающей при использовании в качестве оценки параметров объекта тех или иных конкретных значений [9,10]. Минимаксные методы оптимального оценивания, построенные с помощью аппарата теории возможностей, позволяют во многих случаях более полно и адекватно отразить свойства системы и априорные представления исследователя и на основании менее определенных, качественных исходных данных, получить аналогичные, а в ряде случаев и более точные результаты интерпретации по сравнению с теоретико-вероятностными методами [1,2].
Основы теории оценивания и принятия решений в рамках теории возможностей заложены в работе [9]. В ней поставлены и решены задачи интерпретации измерения в ситуации, когда распределения возможностей нечетких элементов в схеме измерений (В.1) заданы в виде функций, зависящих от нормы (энергии) шума у и входного сигнала /.
В диссертации этот подход обобщен и распространен на случай, когда в некоторых ортонормированных базисах координаты шума у и сигнала / являются независимыми в
теоретико-возможностном смысле и каждая координата обладает известным распределением возможностей.
Во многих практических случаях, попытка оценить весь сигнал и/ приводит к тому, что его оценка оказывается сильно
зашумленной, однако оценка проекции и/ на подпространство
размерности, меньшей, чем к, поражена шумом в меньшей степени [2,3]. Интерес представляет такое подпространство фиксированной размерности к<т, оценка проекции цу на которое
в наименьшей степени поражена шумом, а также зависимость размерности проекции сигнала и/ от величины заданной
погрешности оценивания. Для решения этой проблемы в работе [3] введено понятие эффективного ранга линейной схемы измерений со случайной погрешностью.
В диссертации разработан аналогичный подход к эффективному рангу линейной схемы измерений, модель которой задана в терминах теории возможностей. Введено понятие погрешности оценивания нечеткого элемента как функции максимальной величины неточности оценивания в зависимости от допустимого уровня возможности, определено понятие эффективного ранга теоретико-возможностной модели измерений как максимальной размерности проекции нечеткого вектора, допускающей оценивание с гарантированной точностью.
Найдены подпространства размерностей к<т, обладающие следующим свойством: погрешность оценивания нечеткого элемента и/ на это подпространство наименьшая среди всех
подпространств данной размерности. Исследован случай, когда распределение возможностей нечеткого элемента дается функцией , зависящей от нормы аргумента, а также случай независимых в
теоретико-возможностном смысле координат нечеткого вектора и/, записанных в некотором ортонормированном базисе пространства Як, при известных распределениях возможностей
каждой координаты.
Разработанные в диссертации методы оценивания применены для решения задач интерпретации ряда физических экспериментов.
Цель работы.
Основными целями работы являются:
• создание новых методов интерпретации экспериментальных данных при нечетких ограничениях на возможные значения координат шума и входного сигнала измерительного прибора
• исследование проблемы определения к -мерного подпространства, обладающего следующим свойством: оценка проекции нечеткого элемента на это подпространство обладает наибольшей точностью оценивания среди всех подпространств данной размерности
• исследование с помощью разработанных методов ряда практических задач интерпретации измерений
• сравнение результатов использования новых методов с результатами известных теоретико-вероятностных методов, позволяющее судить о возможности применения нового подхода к решению задач интерпретации измерений.
Научная новизна и практическая ценность.
В работе впервые решена задача оптимального оценивания вектора входного сигнала по результатам измерения вектора В, п0
схеме (В.1) в случае, когда координаты векторов шума V и сигнала / в заданных ортонормированных базисах независимы в
теоретико-возможностном смысле и известно распределение
возможностей каждой координаты. Разработаны методы решения практических задач оптимального оценивания параметров физической системы по результатам измерений с использованием стандартных алгоритмов решения задачи линейного программирования.
Получено решение задачи выбора А:-мерного подпространства, проекция на которое нечеткого вектора оценивается с наименьшей погрешностью среди всех подпространств заданной размерности. Оценивание этой проекции позволяет существенно улучшить результаты интерпретации во многих практических задачах при нечеткой исходной информации о физической системе. Введено понятие эффективного ранга теоретико-возможностной схемы измерений как максимальной размерности составляющей, допускающей оценивание с гарантированной точностью.
Поставлены, решены и исследованы задачи интерпретации экспериментальных данных в ряде практических задач:
- в задаче нахождения входного сигнала измерительного преобразователя второго порядка по результатам измерений смещения колебательной системы от положения равновесия;
- в задаче нахождения сечения фотоядерной реакции по данным выхода фотоядерного процесса;
- в задаче нахождения спектра гравитационно-капиллярных волн по данным радиометрических наблюдений.
Проведенное сравнение результатов известных теоретико-вероятностных методов и предложенных в работе новых минимаксных методов оптимального оценивания на примерах рассмотренных физических задач, показало, что разработанные
методы обеспечивают высокое качество интерпретации и могут применяться для решения практических задач интерпретации измерений.
Разработано программное обеспечение, реализующее предложенные в работе алгоритмы, которое может быть использовано на практике при проведении экспериментальных исследований различных физических систем.
Содержание диссертации.
Диссертация состоит из трех глав, введения, заключения и списка литературы.
В первой главе приведен обзор существующих теоретико-вероятностных методов интерпретации экспериментальных данных. Дана математическая постановка задачи интерпретации в линейной схеме измерений. Приведено решение задачи интерпретации для модели схемы измерений с известным ковариационным оператором шума при отсутствии априорной информации о входном сигнале и для модели с априорно известными ковариационными операторами шума и входного сигнала. Описано понятие эффективного ранга модели измерений как максимальной размерности составляющей, оценка которой может быть получена с гарантированной точностью.
Во второй главе решаются новые задачи оптимального оценивания параметров объекта в теоретико-возможностной схеме измерений при нечетких ограничениях на независимые относи