Бейсовское экспертное оценивание сложных систем в условиях дефицита информации тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Даль, Кирилл Юрьевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1995
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
РГБ Ой
слнЬФ-гШ^е^бургский государственный
УНИВЕРСИТЕТ
На правах рукописи
Даль Кирилл Юрьевич
БАЙЕСОВСКОЕ ЭКСПЕРТНОЕ ОЦЕНИВАНИЕ СЛОЖНЫХ СИСТЕМ В УСЛОВИЯХ ДЕФИЦИТА ИНФОРМАЦИИ
Специальность 01.01.09 - Математическая кибернетика
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Санкт-Петербург 1995
Работа выполнена в Санкт-Петербургском Государственном Университете
Научный руководитель: доктор физико-математических наук,
профессор Хованов Н.В.
Официальные оппоненты: доктор физико-математических паук,
профессор Шмыров A.C.
кандидат физико-математических наук, доцент Рожков H.H.
Ведущая организация: НИИ информатики и автоматизации РАН
(Санкт- Петербург)
Защита состоится "_"_ 1995 года в_часов на заседании диссертационного Совета К-063.57.16 но защите диссертации на соискание ученой степени кандидита физико-математических наук в Санкт-Петербургском Университете по адресу: 199004, Санкт-Петербург, 10-я линия В.О., д.ЗЗ, ауд.88.
С диссертацией можно ознакомится в библиотеке им. А.М.Горького Санкт-Петербургского Университета.
Автореферат разослан "_"_ 1995 года
Ученый секретарь диссертационного Совета, доктор физико-математических наук
Горьковой В.Ф.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Одной из актуальных проблем математической кибернетики является задача оцепивания вероятностей альтернатив поведения сложных систем в условиях неопределенности, то есть, в условиях, когда имеется дефицит информации о точных числовых значениях параметров, определяющих работу системы и предопределяющих возможные варианты ее развития.
К классу таких проблем относятся, например, задачи синтеза статистической, "интервальной" и априорной информации о совместном распределении; вопросы выбора априорной функции распределения в байесовской статистике, задачи оценки с использованием "ординальной" (порядковой) информации и т.д.
Цель работы состоит в разработке общей схемы оценивания в условиях неопределенности вероятностей альтернатив развития сложпых систем как па основе комбинаций трех типов информации 1и Ь и /3 (где 1\ — статистическая "частотная" информация; /2 — "интервальная" экспертная информация; /3 — априорная информация о совместном распределении случайных величин), так и па основе ординальной (порядковой) информации /0 и в использовании этой схемы для решения ряда актуальных задач математической кибернетики, связал пых с веточным заданием вероятностей событий.
Научная новизна. На основе байесовского подхода получено доказательство теоремы об инвариантности масштабированного бета-распределения.
Доказала теорема об инвариантности распределения Дирихле, заданного па пересечении (т - 1)-мерного симплекса с (ш - 1)-
мерным параллелепипедом [¿?Г, х•• • х относительно
байесовского преобразования для случая согласованных интервалов. Получены следствия из данной теоремы, касающиеся оценивания вероятностей событий и точности этих оценок.
Введены в рассмотрение так называемые масштабированные бета-функции, изучены их основные свойства и получен ряд формул для их приближенного вычисления.
.Доказана теорема, позволяющая получить апостериорные распределения для усеченного априорного распределения.
Получен ряд новых конкретных вычислительных формул для оценок вероятностей наступления альтернатив развития сложных систем.
Теоретическое и практическое значение. Разработанные схемы оценивания в условиях неопределенности вероятностей альтернатив развития сложных систем, ряд теорем, а так же их следствия могут быть использованы при решении задач экспертного оценивания, в байесовской статистике и других отраслях теоретической и прикладной математики.
Полученные вычислительные формулы легко реализуются на ЭВМ и могут найти практическое применение при построении экспертных систем при решении различных задач математической кибернетики, связанных с использованием неточно заданных вероятностей наступления событий.
Достоверность полученных результатов обеспечивается корректной постановкой задач, логической последовательностью рассуждений, обоснованным применением математического аппарата, совпадением в частных случаях с теоретическими и экспериментальными результатами других авторов.
Апробация работы. Основные результаты диссертации докла-
дывались па ежегодных научных конференциях факультета прикладной математики - процессов управления Санкт-Петербургского Государственного Университета (1991-1994), Международной конференции "CAD/CAM, Robotics and factories of the future" (СПб, 1993), на Международном конгрессе "CSAM'93" (Спб, 1993), на Международной копферепции "Interval '94" (Спб, 1994), па Международном семинаре "Mathematical methods and tools in computer simulation" (СПб, 1994), па Межреспубликанской копферепции "Актуальнее проблемы прочпости" (Новгород, 1994).
Публикации. Основные результаты диссертации опубликованы в работах [1-6].
Структура и объем работы. Диссертация состоит га введения, трех глав, каждая из которых содержит по три параграфа, заключения м списка литературы. Объем работы составляет 136 страпиц, из них 126 страниц занимает основной текст. Список литературы включает 112 наименований.
СОДЕРЖАНИЕ РАБОТЫ
Во Введении ставится задача разработки общей схемы оценивания п условиях неопределенности вероятностей альтернатив развития сложных систем как па основе комбинаций трех типов информации ii, /2, /3, так и с использованием ординальной информации 10 и описывается структура диссертации.
В первом параграфе гл.1 рассматриваются различные комбинации трех типов информации I\,h,h< для случая оценивания вероятности 0 одной из двух альтерпатив. Основная модель основана па идее "рандомизации" параметра 0, п результате чего
этот параметр превращается в случайную величину 0, имеющую априорное бета-распределение. На основании теоремы Байеса получены оценки, имеющие вид математических ожиданий априорных (в) и апостериорных (в*) случайных величин, моделирующих неопределенность задания вероятности наступления события А\. Точность данных оценок определяется соответствующими дисперсиями. Кроме того, вводится понятие масштабированного распределения и указываются основные его свойства.
Доказывается теорема 1.1, согласно которой, если случайная вероятность в события А\ имеет априорное масштабированное на отрезке бета-распределение с параметрами и то
апостериорное распределение этой случайной вероятности есть масштабированное бета-распределепие с параметрами + т и 1«2 + « — гп, сосредоточенное на том же интервале.
Знание апостериорной плотности случайной вероятности $* позволяет найти математическое ожидание МО* ( используемое в качестве искомой оценки вероятности события Л}, и стандартное отклонение Б9* — у/Бв*, определяющее точность этой оценки.
Отдельно приводятся соображения относительно выбора априорного распределения в условиях дефицита информации.
Второй параграф гл.1 посвящен распространению результатов, полученных ранее, на случай оценивания вероятностей многих событий.
Неопределенность задания вероятностей в данном случае моделируется при помощи случайных величин, имеющих совместное распределения Дирихле. Для учета интервальной информации типа вводится понятие так называемых согласованных интервалов. Для данного случая доказывается теорема 1. 2, согласно которой, из того, что вектор в = (#1,...,0т-1) случайных
вероятностей событий Ль. ■ •, Лт_! имеет априорное распределение Дирихле с вектором параметров V = («л, - •.,!>„), сосредоточенное па пересечении (т - 1)-мерпого симплекса с (т - 1)-мерпым параллелепипедом ,0+] х • • • х [следует, что апостериорное распределение этого случайного вектора есть суженное распределение Дирихле с вектором параметров и + г? = = (VI + пь...,ит-\ + пт_]), сосредоточенное па том же множестве точек.
Знание апостериорной плотности случайной вероятности 6>* позволяет пайтн математическое ожидапие МО', используемое и качестве искомой оценки вероятности события Л,-, и стандартное отклонение Яв' = Ш', определяющее точпость этой оценки.
Как и в §1, здесь особо рассматривается случай полного или частичного отсутствия информации о параметрах априорного распределения.
Полученные результаты дают один из возможных вариантов общего решения поставленной задачи построения оценок вероятностей событий Ах,...,Ат с использованием различных наборов типов информации 1и13,1з • (1\,1з),(Ь,1э)ЛЬ,Ь,1з)-
В третьем параграфе гл.1 рассматриваются частные случаи масштабированного бета-распределения, представляющие собой пе только теоретический, но и определенный практический интерес. Особенно подробно исследуется ситуация с отсутствием информации о параметрах априорного распределения, моделируется при помощи априорного равномерного распределения вектора 0 — (вх,...,9т) па соответствующей подоблас'ги единичного симплекса.
Первый параграф гл.Н носит, в основном, вспомогательный характер. В нем подробно рассмотрены свойства масштабирован-
пых бета-функций (они будут использованы в дальнейшем) и выведен ряд формул для их приближенного вычисления при разных значепия параметров а также для случая симметричного
интервала Представлено разложение масштабирован-
ных бета-функций в гипергеометрические ряды; получена оценка данных функций сверху.
Отдельно рассматриваются основные свойства интеграла, который часто используется в практических вычислениях априорных я апостериорных характеристик усеченных бета-распределений. Приводятся приближенные формулы вычисления этого интеграла для различных значений 6-, в+ ,т, п, ^, и его оценка на основании обобщенной теоремы о среднем.
'Второй параграф гл.II посвящен использованию в вышеизложенной схеме усеченного распределения. Доказывается теорема 2. 1 о нешпзариаптпости усеченного распределения относительно байесовского преобразования. На основапии результатов, полученных в §1 гл.II, рассматриваются различные частные случаи, представляющие определенный практический интерес.
В третьем параграфе гл.П рассматривается использование ординальной информации 70, задаваемой системой неравенств для вероятностей 01,...,бт альтернатив А1,...,Ат. Приводятся соображения относительно некоторых преимуществ использования данного типа информации при оценивании вероятностей наступления событий. Получены явные формулы для определения математических ожиданий и дисперсий рандомизированных вероятностей 61,..., вт.
Третья глава посвящена доказательству ряда так называемых "теорем о дисперсии", общий смысл которых состоит в утверждении, что дисперсия апостериорной случайной величины умень
шается, если относительная частота m/n события попадает в априорпо задаваемый интервал [0_, 0+] для возможных значений вероятности этого события.
Первый параграф гл.Ш содержит доказательство "теоремы о дисперсии" для одномерного случая при использовании масштабированных бета-фупкций. В данном параграфе теорема 3. 1 доказывается для двух случаев, когда п > 1,тт» 1,1/,/т -* —»• 0, (m/n = I? = 0(1)) m/n -> 0; и когда п > 1, а т — произвольно.
Для упрощения доказательства теоремы 3. 1 исследуются свойства функции типа (р(х) = г'п(1 — a^1-^1*.
Второй параграф гл.Ш посвящеп распространению результатов, полученных ранее, па случай многих событий. В данном параграфе доказывается теорема "о дисперсии" для случая, когда о > 1, а п, — произвольно.
В третьем параграфе гл.Ш доказывается "теорема о дисперсии" для усеченного распределения для з&жпого частного случая, когда параметры V\ — Vi ~ при условии, что п 1,ш > » иит » f2,m/n = t? = 0(1).
В Заключении приведен список основных результатов диссертации, выносимых на защиту:
1. Разработана общая схема оценивания в условиях неопределенности вероятностей альтернатив развития сложных систем при использовании различных комбинаций трех типов информации Ii, Ij и h (где Ii — статистическая "частотная" информация; 12 — "интервальная" экспертная информация; 1ц'— априорная информация о совместном распределении случайных величин).
2. Доказана теорема об нпвариаптпости масштабированного бета-распределения относительно байесовского преобразования
для одномерного случая. Получены следствия из данной теоремы, касающиеся оценивания вероятности наступления события и точности этой оценки (см. §1 гл.1).
3. Доказана теорема об инвариантности распределения Дирихле, заданного на пересечении (ш — 1)-мерного симплекса с (т-1)-мерным параллелепипедом , 0^) х • • • х м, относительно байесовского преобразования для случая согласованных интервалов. Получены следствия из данной теоремы, касающиеся оценивания вероятностей событий и точности этих оценок (см. §2 гл.1).
4. Подробно рассмотрены свойства масштабированных бета-функций и получен рад формул для их приближенного вычисления при разных значениях параметров 0_, а так же для случая симметричного интервала (¿>-,0+] (см. §1 гл.И).
5. Доказала теорема, позволяющая получить апостериорные распределения для усеченного априорного распределения и рассмотрены важные частные случаи (см. §2 гл.II).
6. Разработана общая схема оценивания вероятности наступления событий при использовании ординальной информации 1С. Получены формулы для определения математических ожиданий и дисперсий оцениваемых вероятностей.
7. Доказав ряд теорем, позволяющих оценить влияние согласованности статистической информации 1\ и экспертной интервальной информации 1г на дисперсию рандомизированных оценок вероятностей альтернатив развития сложных систем (см.§1~ 3 гл.Ш).
Публикации автора по теме диссертации
1. Даль K.IO. (с соавт.) Байесовская оценка доли популяции
»
при интервальных ограничениях. // Математические проблемы экологии. Тезисы докладов 4-й школы. Душанбе. 1991. - с. 69
2. Даль К. Ю. Байесовская опенка надежности сложных объектов с использованием интервальной информации // XXX Межреспубликанский семипар "Актуальные проблемы прочности". Новгород. 1994. с. 131-136
3. Dahl С.У., 1993. Statistical analysis of reliability of software units under conditions of information dificient. // International Conference on CAD/CAM, Robotics and factories of the future. Abstracts. St.Petersburg. V2, p.576-578
4. Dabi C.Y. (coauth.), 1S93. Bayessian estimation of variants probabilities of the complicated systems control with using of interval information // International Congress on Computer Systems and Applied Mathematics CSAM'93. Abstracts. St. Petersburg, p.84
5. Dahl C.Y. (coauth.), 1994. Bayessian synthesis of statistical data and expert interval information on probabilities of events // International Conference on Interval and Computer-Algebraic Methods in Science and Engineering INTERVAL'94. St.Petersburg, p.74-75
6. Dahl C.Y. (coauth.), 1994. Applied DSS for multicriteria estimation under uncertainty: from "ASPID-3" to "GINGER"// International Workshop on Mathematical Methods and Tools in Computer Simulation. Preprint. St.Petersburg, p.71-72
Типография 'ГШ 3ак.35. Тир. 100. £0.03.95.