Управляемые стохастические системы с распределёнными параметрами тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Мельник, Сергей Анатольевич АВТОР
кандидат физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Донецк МЕСТО ЗАЩИТЫ
1983 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Диссертация по математике на тему «Управляемые стохастические системы с распределёнными параметрами»
 
 
Текст научной работы диссертации и автореферата по математике, кандидат физико-математических наук, Мельник, Сергей Анатольевич, Донецк

У

МИНИСТЕРСТВО ВЫСШЕГО И СИДНЕГО МЩШОГО ОБРАЗОВАНИЯ УССР ДОНЕЦКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

МЕДЪНИК СЕРГЕЙ АНАТОЛЬЕВИЧ

УПРАВЛЯЕМ®; СТСКАСТИЧЕСКШЕ СИСТЕМЫ

С

РАСПРЕШЁННЫШ ПАРАМЕТРАМИ 01.01.05 - теория вероятности а

ДИССЕРТАДИЯ на соиежание учёной степени, кандидата фи зи ко-мате матачеснах наук

Научный руководитель - доктор фшзако-математических наук, в р а $ е е е о | И.И.Гяхман

Д онецк - 1983

На правах рукопши

математическая статистика

ОГЛАВЛЕНИЕ'......................

ВВЕДЕНИЕ.......................................... 4

Глава I, ПРЕдащМШЫЕ СЭДЕНШ....................... 15

1.1. Формула Ито для квадрата нормы элемента банахова пространства ..................... 15

1.2. Теорема существования и единственности решения с т охаствчеекого эволюционного уравнения в банаховом пространстве ............. 19

Глава 2. КШМО-РАЗНОСТНЫЕ МЕТОДЫ А1ШШСИШШ РЕШЕНИЙ

З&ШШФНШ: (лщаштсш дшфешшмыщс

УРЖНЕНИЙ ............;......................... 21

2.1. Метод конечных разностей для эволюционных

с.д.у* в гильбертовом пространстве ........ 21

2.2Р. Конечно-разностная аппроксимация решения с .д.у. в частных: производных параболического типа ..............29

2.3. Гладкость решения ©.д.у. н частных производных параболического типа............... 62

Глава 3. ПОСТРСШ® £ -ОПТИШУШЫХ УПРАВЛЕНИЙ ДНЯ

НЕЛИНЕЙНЫХ! СИСТЕМ.............................. 78

3.1. Задача управления......................... 78

3.2. Непрерывная зависимость решения эволюционного уравнения в банаховом пространстве

от управления ,».......................................81

3.3. Построение £-оптимальных управлений

методом конечных разностей................ 84

3.4. Построение ¿-оптимальных управлений

методом проектирования.................... 91

- з -

Глава 4. СШ1ШЗАІШ ЛЙНЕЙНСЙ СТСКАОТЖСКОЙ СИСТЕМЫ

С РАСПРЕЩЕШЁННШй ІШАЖГРАЩ................... 96

ЗАКЛЮЧЕНИЕ ....................................................................125

ЛИТЕРАТУРА......................................126

ВВЕДЕНИЕ

Теория оптимального управления в настоящее Бремя является одной т наиболее бурно развивающихся областей математики. Это обусловлено широким іфугом практических задач, где она находит применение. Стабилизация орбиты летательного аппарата, выбор оптимальной формы крыла самолёта, ранеты, очертания контура здания, управление процессом нагрева тела с целью минимизации энергетических затрат или поддержания некоторого заданного режима температуры, ряд задач теории упругости - таков далеко не полный перечень практических задач, приведших к необходимости создания математической теории оптимального управления.

Привлечение математического аппарата к изучению эволюции некоторой системы обычно начинается с построения математической модели изучаемого объекта. Б тех случаях, когда система непрерывно эволюционирует во времени, такой моделью является дифференциальное уравнение относительно вектора фазового состояния. Если состояние управляемого объекта в каждый конкретный момент времени можно задать вектором в конечномерном пространстве, то систему называют конечномерной и её математической моделью является обыкновенное дифференциальное уравнение. Если же параметры системы непрерывно распределены в пространстве, то её называют бесконечномерной или системой с распределёнными параметрами и математической моделью для неё является уравнение в частных производных. Вопросам управления такими системами посвящён ряд фундаментальных работ [I],[2],[15],[23],[25]. В них излажены и математически обоснованы методы оптимального управления основными из которых являются принцип максимума Понтрягина и принцип динамического программирования. В книге [8] на большом количестве при-

I I

I мероб продемонстрирована методика применения аппарата теории оп-

тимального управления к решению прикладных задач.

Существенным свойством всех названные выше систем является возможность на основе математической модели вполне определённо предсказать их поведение в любой момент времени. Особый интерес вызывают системы, наведение которых не может быть одисанно с паяной определённостью. К ним относятся, например, объекты, эволюционирующие во времени и подверженные случайным возмущениям. Существуют два подхода к изучению таких систем. Первый - рассмотрение всевозможных: вероятностных характеристик, второй - изучение вероятностными и функциональными методами эволюции самих случайных процессов. Для практики естественно рассматривать случайные процессы, поведение которых описывается стохастическими дифференциальными уравнениями (с.д.у.) , напоминающими по виду обыкновенные диф ференциальные уравнения или уравнения в частных производных, правые части которых зависят от случайных возмущений.

Теория оптимального управления конечномерными стохастическими системами к настоящему времени довольно глубоко разработана. Её описанию посвящены монографии [б! ,[1б],[19] ,[з?3 в которых рассматривались вопросы оптимального управления решениями как линейных, так и нелинейных с.д.у. с лишгицевыми коэффициентами. Основными направлениями в этой области являются: применение принципа динамического программирования, доказательство различных признаков оптимальности и аппроксимация исходных систем менее сложными.

Принцип динамического программирования применим при управлении марковскими процессами, в результате выбор оптимального управления сводится к решению нелинейного дифференциального урав-

|

нения параболического или эллиптического типа. Первая трудность при этом для задач с непрерывным временем связана с обоснованием уравнений динамического программирования, так как оптимальное управление из-за разрывного характера может привести к неединственности решения с.д.у. Вторая, бояее существенная, трудность связана с решением полученного уравнения Белямана. С ростом размерности задачи возможность решения этих уравнений резко падает.

Основные результаты, касающиеся необходимых признаков оптимальности, представлены в [5] и [93* Однако, как отмечено в И, применение этих методов на практике натолкнулось на рад существенных трудностей.

При исследовании различных вопросов, касающихся процес&ов с непрерывным временем, полезным оказывается метод конечных разностей. Важность этого метода особенно возрастает в связи с использованием при решении задач ЭВМ. Для конечномерных стохастических систем этот метод изложен, например, в [&], [б], И. Во всех работах в этом направлении коэффициенты уравнения должны удовлетворять условию Липшица по фазовой переменной. Зто обусловлено тем, что до недавнего времени для нелинейных уравнений теоремы существования и единственности так называемых сильных решений были доказаны лишь в случае липшивдвых коэффициентов. В начале семидесятых годов А.Бенсуссаном [40] бшга начата программа исследования эволюционных уравнений в коэффициентами, удовлетворяющими менее ограничительным условиям. Обобщая результаты подученные Ж.-ЛЛионеом [22], А.Бенсуссан и Р.Темам в статье [41] рассмотрели эволюционное с.д.у. в банаховом пространстве с коэрцитивным монотонным оператором сноса и диффузией, не зависящей от фазовой переменной. Затем ЕЛ.Розовскоь^у [зз] удалось доказать существование и единственность решения задачи Копш для уравнения параболического типа, при этом в коэффициент диффузии

могла входить фазовая переменная, а в работе [17] вопрос существования■ был решён для нелинейной задачи Кошм, причём в диффузию мог входить и градиент решения» Всестороннее исследование указанного вопроса для с.д.у. в банаховом пространстве проведено в диссертации Э.Пащу [48] результаты которого были обобщены в работе [18]. Авторам удалось избавиться от условия Липшица на оператор диффузии и исследовать рад свойств решения.

В данной диссертационной работе рассмотрены некоторые методы построения б-оптимальных управлений для монотонных стохастических систем с распределёнными параметрами.

Вопросы управления стохастическими системам с распределёнными параметрами изучались рядом советских и зарубежных учёных. Наиболее полно исследованы линейные системы с квадратичным критерием качества. В книге [35] рассмотрена задача управления решением линейного уравнения параболического типа коэффициенты которого зависят от случайного параметра, являющегося марковским процессом. Г.Е.Колосовым [14] для уравнений того же типа со слу^ чайной правой частью и не квадратичным критерием качества подучено уравнение Беллмана. Серия работ М. Шал ара и Д.Виберга [49] ,[5'0], [52] посвящена изучению уравнений, не разрешённых относительно производной по времени, с коэффициентами, не зависящими от времени, В этих работах рассмотрена задача управления по неполным наблюдениям. Доказан принцип отделения, получены уравнения для оценки состояния системы и оптимальной цены управления, а также, явная форма для управления. Бшьшое внимание авторы уделили численному решению полученных: уравнений. Шел ар и Виберг применили метод разложения по собственным функциям оператора, стоящего в главной части уравнения. Эффективность мет еда продемонстрирована на примере. Вопросы оптимальной фильтраций рассмотрены в

книге |40] * Г.Кушнер [44] обобщил на уравнения параболического типа со случайной правой частью метод построения £-оптимального управления обратной связи, который для обыкновенных с.д.у. изложен в книгах [б], [7]. Наиболее общие результаты для линейной стохастической системы получены Н.У.Ахмедом [39]. Им рассмотрена задача управления решением уравнения в гильбертовом пространстве

¿ф)=[ даца) + Е>«Ш)]с!Ь егсоа

с квадратичным функционалом стоимости. Установлено существование оптимального управления и необходимое условие оптимальности. Несколько ранее необходимое условие оптимальности в форме принципа максимума для уравнений параболического и гиперболического типов получено А.Т.Лукьяновым и В.С.Нероновым [24*1.

Как у Еуягнера, так и у Ах мзда диффузионная часть не должна содержать фазовую переменную. Таким образом из рассмотрения исключены системы с внутренними шумами. Б главе 4 настоящей работы дано обобщение результатов К^гашера на уравнения, содержащие в диффузионном члене фазовую переменную. Полученное в результате уравнение имеет вид:

+[саС4:, з ) К С+, х, эь) Й у ) с! % = Е X, у У

а

Вопрос разрешимоом подобных уравнений изучался и ранее.

Наиболее близкое по виду уравнение рассматривал Р.Темам в статье [51]

- + РША - А*РС±)+ ФСК«)- ЬСО,

где Ф - аналитическая функция, А - коэрцитивный оператор. Однако наличие слагаемого, возникшего из-за внутренних шумов системы, не позволяет применить результаты Темама.

В лемме 4.2 доказано существование и единственность решения уравнения Ееллмана. Одновременно получен алгоритм его численного решения и явное выражение дая оптимального управления. Б отличие от конечномерного случая в рассматриваемой системе не должно быть шумов в канале управления. Это вызвано тем, что при наличии указанных шумов не удаётся в явном виде отыскать управление, минимизирующее функционал стоимости.

Нелинейные стохастические системы с распределёнными параметрами изучены в значительно меньшей степени. Перспективными путями их исследования представляются: построение уравнения Ееллмана (которое в рассматриваемом случае оказывается довольно сложным) с последующим приближённым его решением и аппроксимация самой системы менее сложными. В данной работе избран второй путь.

Возможность применения метода конечных разностей к решению задач оптимального управления нелинейными эволюционными стохастическими системами с распределёнными параметрами рассматривается в главе 2 данной работы. Для стохастических эволюционных уравнений в гильбертовом пространстве с липишцевыми коэффициентами этот метод изложен в статье М.А.Карабаша [12] . Ю.М. Ермольев и Т.И.Царенко применяли его к уравнениям Дарбу также с лишшце-выми коэффициентами [101, [п! , [за"]. Идея метода состоит в следующем. В качестве аппроксимирующей модели для с.д.у. берётся по-

- то -

следовательность случайных величин, построенная по конечно-разностным аппроксимациям решения исходного уравнения. Для этой последовательности оптимальное управление строится одним из способов, описанных в [б], [42] , [45], а затем доказывается, что при достаточно мелком разбиении олтишльные цены управления дискретной моделью и самим процессом отличаются на произвольно малое число. При этом ключевую роль играют два факта: непрерывная зависимость решения с.д.у. от управления и равномерная относительно управления сходимость аппроксимаций к решению. Теорема о непрерывной зависимости решэния эволюционного с.д.у. в банаховом пространстве доказывается в §3.2. Неявная конечно-разностная схема для с.д.у. в банаховом пространстве с монотонным оператором сноса и диффузией, не зависящей от фазовой переменной предложена в [4і]. Оцнако в теории оптимального управления такая схема малоэффективна, так как не даёт хорошего алгоритма построения аппроксимирующей последовательности.

Явная конечно-разностная схема для уравнения в гильбертовом пространстве изучена в §2,1. Б этом случае коэффициенты должны быть ограниченными операторами, удовлетворяющими условиям коэрцитивное ти и монотонности. Уравнения в частных производных не удовлетворяют этому требованию. Для них явная конечно-разносная схема с дксіфетизацией по времени и пространству рассмотрена в §2.2. Как выяснилось скорость сходимости таких приближений к решению зависит от степени его гладкости. Поэтому, чтобы добиться равномерной относительно управления сходимости, потребовалось устдновить зависимость между глацкостыо коэффициентов уравнения и его ре [.пением, что и сделано в §2.3. При этом использованы идеи работы Ю.М»Дубинекого [7]. В [іе] аналогичный вопрос решён иным методом для линейной задачи Коти.

В рассматриваемой схеме остаётся открытым вопрос: насколько мелким должно быть разбиение, чтобы обеспечить необходимую точность? Эта неопределённость возникает из-за того, что неизвестна скорость сходимости к управлениям их ступенчатых аппроксимаций.

При решении прикладных задач теории оптимального управления системами с распределёнными параметрами часто используется следующий метод. Исходную систему уравнений в частных производных с соответствующими граничными условиями заменяют подходящим образом подобранной системой М обкновенныЕ дифференциальных уравнений. В итоге получается задача об оптимальном управлении процессом, который описывается системой М обыкновенных дифференциальных уравнений. Её решение берётся в качестве А/-то приближения исходной задачи. Для уточнения полученного результата увеличивают И/ , Тем самым исходная задача не решается точно, а дрхя построения её приближённых решений используют аппарат теории оптимального управления конечномерными системами. Для линейного гиперболического уравнения со случайной правой частью и квадратичным критерием качества проекционный метод рассматривался в статье [з].

Проекционный метод рещеяия задачи оптимального управления для эволюционного с.д.у. в банаховом пространстве изложен в §3.1. Его преимущество перед описанными вшде методами состоит в том, что сходимость явных конечноразностных аппроксимаций к решению удалось показать лишь для гильбертовых пространств. Проекционный же метод действует в банаховом пространстве. Оцин из его недостатков состоит в том, что во многих задачах процесс аппроксимации оптимального управления Ы^С^Х) с помощью функций Ц.^ ?£) является неустойчивым относительно погрешностей в промежуточных вычислениях. Суть этого явления состоит в следующем» Пусть бес-

конечномерная управляемая система каким-либо способом аппроксимируется конечномерными системами и для определения С: помощью аппроксимирующих систем получаем И/-ое приближение и; с*,х) . Однако практически при каждом // можно определить лишь приближённо. Это означает, что вместо И Ct sc)

* Л - Л* ^ ^

// \ С Л' Cr /у

получаются управления (Г (i XJ t О ft SCO * гДе О - величина, получаемая в результате погрешностей в промежуточных вычислениях. При этом оказывается, что с возрастанием № малые погрешности в промежуточных вычислениях приводят к значительному

У -Ч

X) , т.е. IL QbjXs вычисляется с большими погрешностями. Тем не менее, как отмечал H.H.Красовский : "Вообще задача аппроксимации управляемых систем с распределёнными параметрами подходящими конечномерными системами представляется весьма вакной проблемой, разрешение которой открыло бы новые эффективные пути и для теоретического исследования и для конкретного численного решения".

Описание современного состояния и перспектив развития теории оптимального управления стохастическими системами с распределёнными параметрами дано в обзоре [53].

Диссертация состоит из введения, четырёх глав и заключения.

Во введении дан краткий обзор результатов по теории управляемых систем, охарактеризованы рассматривае