Оптимальное управление линейной системой со случайными коэффициентами и квадратичным критерием качества

Якубенко, Илья Павлович

Оптимальное управление линейной системой со случайными коэффициентами и квадратичным критерием качества тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Якубенко, Илья Павлович АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Воронеж МЕСТО ЗАЩИТЫ

2015 ГОД ЗАЩИТЫ

01.01.02 КОД ВАК РФ

Автореферат по математике на тему «Оптимальное управление линейной системой со случайными коэффициентами и квадратичным критерием качества»

Автореферат диссертации на тему "Оптимальное управление линейной системой со случайными коэффициентами и квадратичным критерием качества"

На правах рукописи

Якубенко Илья Павлович

Оптимальное управление линейной системой со случайными коэффициентами и квадратичным критерием качества

01.01.02 - дифференциальные уравнения, динамические системы и оптимальное

управление

2 У АПР 2015

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

005568129

Воронеж - 2015

005568129

Работа выполнена в Воронежском государственном университете. Научный руководитель: доктор физико-математических наук, профессор Задорожний Владимир Григорьевич.

Официальные оппоненты: Боровских Алексей Владиславович доктор физико-математических наук,

Московский государственный университет имени М. В. Ломоносова, кафедра дифференциальных уравнений, профессор.

Корнев Сергей Викторович

кандидат физико-математических наук, Воронежский государственный педагогический университет, кафедра высшей математики, доцент. Ведущая организация: Саратовский государственный университет

Защита состоится «23» июня 2015 г. в 16 часов 30 минут на заседании диссертационного совета Д 212.038.22 при ФГБОУ ВПО «Воронежский государственный университет» по адресу 394006, Воронеж, Университетская пл. 1, ауд. 314.

С диссертацией можно ознакомиться в научной библиотеке Воронежског государственного университета, а так же на сайт http://www.science.vsu.ru/disserinfo&cand=2757

Автореферат разослан «/)~» апреля 2015 года Ученый секретарь Диссертационного совета доктор физико-математических наук, профессор

Гликлих Ю. Е.

Общая характеристика работы

Актуальность темы. Работа посвящена задачам оптимального управления динамическими системами. Управляемые системы изобилуют в химической промышленности, экономике, биологии и физических задачах. Этому направлению посвящено огромное количество публикаций, особую роль в задачах оптимального управления играет принцип максимума JI.C. Понтрягина и метод динамического программирования.

Реальные управляемые процессы зависят от влияния внешних факторов (это является скорее правилом, чем исключением). В некоторых случаях таким влиянием можно пренебречь, однако иногда это может приводить к ощутимым последствиям. Зачастую влияние внешних факторов можно моделировать случайными процессами. К настоящему времени большое развитие получила теория стохастических дифференциальных уравнений, разработке которой посвящены труды А. Н. Колмогорова, Р. JI. Стратоновича, В. С. Пугачёва, К. Ито, И. И. Гихмана, А. В. Скорохода, А. Н. Ширяева, П. Ланжевена, А. С. Монина, А. М. Яглома и многих других.

Изучаются и задачи оптимального управления системами, описываемыми стохастическими дифференциальными уравнениями, а также дифференциальными уравнениями, коэффициенты которых являются случайными процессами (М. Ю. Афанасьев, Ф. JI. Черноусько). Наиболее изученными, при этом являются задачи, описываемые линейными стохастическими дифференциальными уравнениями с квадратичным критерием качества управления (Ф. Л. Черноусько, J. Y. S. Lüh, М. Р. Lukas, W. М. Wonham). Задачи, описываемые дифференциальными уравнениями коэффициенты, которых являются случайными процессами, изучены меньше, хотя многие реальные процессы описываются именно такими уравнениями. Для практики важно знать хотя бы первые две моментные функции оптимального управления и оптимальной траектории, именно этой задаче и посвящена

настоящая работа, раскрывающая новые области применения подходов рассматриваемых В. Г. Задорожним.

Цель работы. Целью работы является нахождение статистических характеристик оптимального управления и оптимальной траектории динамической системы, описываемой линейным дифференциальным уравнением первого порядка, коэффициенты которого являются случайными процессами с квадратичным критерием качества управления.

Методы исследования. В работе используются теория дифференциальных уравнений, функционального анализа и теории случайных процессов. Задача нахождения первых моментных функций оптимального управления и оптимальной траектории сводится к детерминированной задаче минимизации квадратичного функционала. Для решения интегральных уравнений Фредгольма применяется численный метод, основанный на сведении к задаче с вырожденным ядром. Расчёты проводятся в системе автоматизированного проектирования МаШсас!.

Научная новизна. В диссертационной работе получены следующие новые результаты:

1. Рассматривается новый квадратичный критерий качества, зависящий от квадратов первой и второй моментных функций оптимального управления и оптимальной траектории.

2. Коэффициенты линейного дифференциального уравнения являются случайным процессами общего вида (не являются функциями, возмущенными белым шумом).

3. Условия оптимальности в виде интегральных уравнений Фредгольма первого рода для математического ожидания оптимального управления.

4. Условия оптимальности в виде интегральных уравнений Фредгольма первого рода для второй моментной функции оптимального управления.

5. Численный метод нахождения математического ожидания решений дифференциальных уравнений со случайными коэффициентами.

Практическая и теоретическая значимость. Рассматриваются новые постановки задачи оптимизации для систем со случайно изменяющейся структурой. Получены новые условия оптимальности первой и второй моментных функций оптимального управления и оптимальной траектории линейной системы с квадратичным критерием качества управления. Рассмотрены конкретные примеры динамических систем, позволяющие сравнить результаты оптимального управления полученными различными способами. На практике исследуемые модели применимы для управления химическими процессами, в медицине для расчёта средних значений объемов принимаемых медикаментов и др. Условия оптимальности можно излагать в качестве специальных курсов для студентов по курсам оптимального управления.

Апробация результатов. Основные результаты диссертации докладывались на международных научных конференциях «Всероссийское совещание по проблемам управления» (Москва, 2014 г.), «Вопросы науки: Естественно-научные исследования и технический прогресс» (Воронеж, 2014 г. -2015 г.), «Моделирование энергоинформационных процессов» (Воронеж, 2014 г.), а также на научных семинарах проф. Задорожнего В. Г. и проф. Каменского М. И.

Публикации. Результаты исследований опубликованы в работах: [1] - [11]. Работы [4], [5], [6] опубликованы в журналах из перечня рецензируемых научных журналов и изданий, рекомендованных ВАК Минобрнауки РФ. В совместных работах [2] - [5] научному руководителю принадлежат постановки задач.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, списка использованной литературы, приложения и занимает 130 страниц. Библиография содержит 62 наименования. Нумерация формул состоит из трех чисел: первое число - номер главы, второе число - номер параграфа, третье - номер формулы в этом параграфе. Нумерация формул в автореферате соответствует нумерации в диссертации.

Содержание диссертации. Первая глава посвящена случайным процессам и их характеристикам. Даются определение вариационной производной и ее основные свойства, приводятся определения понятий характеристического функционала и моментной функции.

Пусть £(г,со) - случайный скалярнозначный процесс с выборочными функциями из функционального пространства X. В дальнейшем случайный процесс обозначается просто е(г). Пусть V- банахово пространство функций

С и V*- сопряженное пространство функций, причем значение уе У'на

элементе 1>е V определяется соотношением у(и) = где у, - некоторая

функция и интеграл понимается в смысле Лебега.

Определение. Характеристическим функционалом процесса £(г)

называется выражение ^(у) = М(ехр(/|£(.?)у(.у)г&)), где ХсУ'.аМ обозначает

математическое ожидание, вычисленное по функции распределения процесса

т.

Определение. Моментной функцией порядка к> О случайного процесса называют М(е

Далее рассматриваются задачи Коши для линейного однородного и неоднородного уравнения с обычными и вариационными производными. Ставится задача о нахождении математического ожидания решения скалярного дифференциального уравнения первого порядка

х = е(0х + /(.0, 14

х(10) = Х0,

где х(Г)е К, ге [г0,/,] = 7", задано, х0- случайная величина, е, / - случайные процессы, причем х0 не зависит от е и /. Случайные процессы е и / заданы характеристическим функционалом

а)=М ехр|^| [£(.ф(.у) + /МйХ»]^

где М —математическое ожидание по функции распределения £,/ .

Теорема. Пусть у,ае Ц(Т) и характеристический функционал (р\ ¿1(Т')х11(7') —>С имеет непрерывные в окрестности точки (0,0)

8<р(ь,(й) 82<р{ь,а) вариационные производные —-——, —--—тогда

мхЦ)=Мх0<р{— М-Ж*,'),о) ^ (14 4)

,„ )

где

Приводятся формулы и для второй моментной функции решения дифференциального уравнения.

Далее в работе рассматриваются численные подходы к поиску статистических характеристик решений дифференциальных уравнений со случайными коэффициентами.

Общий случай численного метода нахождения математического ожидания для систем дифференциальных уравнений

х=/(1,х,£), (1.6.3)

х(.*о) = хо, (1.6.4)

где х = (дг,, х,,.., х„ ),/ = (/,, /2 ,-,/„), г е [*0 ,г0 + Т], £ = £(г) - вектор случайных процессов £ = (£,(0,£-2(Г),..,£1(0) .

Приводится процесс, позволяющий получить в момент времени г{ приближение к математическому ожиданию решения задачи (1.6.3), (1.6.4)

МхЦк, е1 (г4), е2 (1к ),..,£, (/4)) = | ,у,,у2,..., у,) • ре ((1, (у,, уг,..., у, У1ухауг..Ау,.

Во второй главе рассматриваются задачи нахождения статистических характеристик оптимального управления линейными системами с квадратичным критерием качества.

Рассматривается задача оптимального управления вида

1'' 1

J{x(t), u(t)) = - J и2 (s )ds+ - cx2 (/,) inf, (2.1.1) 2 0 2

•*(0) = *0, (2.1.2)

x(t) = £(t)x+u(t), (2.1.3) где x(t)- фазовая траектория, u(t)- управление, £(t) - случайный процесс. Для сравнения результатов рассматривается и задача, где случайный процесс £(t) заменен на случайную величину

1'' 1

3 (x(i), и(Г)) = -\u\s)ds + -cx2(t,) -> inf, (2.1.14) 2 0 2

x(t) = ec+u(t), (2.1.15)

х(Р) = х0. (2.1.16)

Для практики интерес представляют важнейшие характеристики оптимального управления и оптимальной траектории - их математические ожидания, поэтому рассматривается новая задача

1 'b 1 j{x(t),u(t)) = -)(Mu(s))2ds + -c(Mx(ti))2 ->inf, (2.1.4)

о 2

х(0) = х0 , (2.1.5)

x(t) = e(t)x + u(t). (2.1.6)

о нахождении оптимального математического ожидания управления и оптимального математического ожидания фазовой траектории. Рассмотрены примеры задач для нормального и равномерного закона распределения случайной величины £. Изучаются следующие случаи:

1. Задача (2.1.14) - (2.1.16), когда в качестве случайной величины в формулах

стоит ее математическое ожидание.

2. Задача (2.1.14)-(2.1.16).

3. Задача (2.1.4)-(2.1.6).

Первая задача детерминированная. Однако полученные формулы позволяют выписать математические ожидания оптимального управления и фазовой траектории.

Во второй задаче мы показываем, что математические ожидания оптимального управления и фазовой траектории можно вычислить при помощи пакета прикладных программ.

В третьей задаче мы рассматриваем критерий качества, который зависит от квадратов математических ожиданий управления и фазовой траектории, и находим статистические характеристики.

Если случайный процесс £(0 имеет две реализации, то рассмотренные выше задачи решаются точно и выражаются через реализации. Снова рассматриваются три варианта:

1. Задача (2.1.1) - (2.1.3), где в исходной задаче выражение случайного процесса заменено его математическим ожиданием (вместо случайного процесса рассмотрена функция равная математическому ожиданию случайного процесса) т. е. формулы (2.1.17) и (2.1.18) содержат математическое ожидание.

2. Задача (2.1.1) - (2.1.3) с указанным случайным процессом решается точно, причем оптимальное управление зависит от случайного процесса £(О.

В этом случае мы вычисляем значение функционала качества (2.1.4).

3. Решаем задачу (2.1.4) - (2.1.6) используя характеристический функционал для £(0 (здесь мы находим сразу математическое ожидание Мм(?) и Мх(/)).

Сравнение результатов показывает, что значение критерия качества (2.1.4) во втором случае близко к значению в третьем случае и несколько меньше.

Третья глава посвящена нахождению второй моментной функции оптимального управления системы со случайными коэффициентами.

Рассматривается линейная управляемая система, описываемая уравнением

— = е(г)х + и(0, (3.1.1)

где М, и:М—»К. управление, £(/)-случайный процесс с заданным начальным условием

х(10) = М(х0). (3.1.2)

Требуется найти малое управление и(0> которое обеспечивает близость к нулю х(г) на заданном промежутке времени [г0,Г]. Поскольку е(г) является случайным процессом, то управление и(/) также будет случайным процессом. Наибольший интерес представляют собой первые две моментные функции случайного процесса м(г). Если будут малы М(н(г)), М(м(г)м(г)) и М(х(ф, М(х(г)х(т)), то этого может быть и достаточно для прикладной задачи. Таким образом, естественной является следующая задача.

При заданном случайном процессе е(г) и математическом ожидании М{ха) требуется найти моментные функции М(ы(0) и М(и(г)и(г)), при которых функционал

1 т

I = -/[А, {¿)М2 (*(*)) + В, {¿)М2 («(*))№ +

2 'о 1 тт

+ -\\[А1Ь1,*2)М\х(!хМ*1)) + В2(*[,51)М2(и(*1)и{*гт*1сЬг + (3.1.3)

'о'о

+ ^-М2(.х(Т)) + Ц-М2(хг(ТУ) 2 2

принимает наименьшее значение.

Здесь > О, Д,0) > 0, заданные непрерывные функции, А2(г,,$2) >> 0, заданные симметричные по непрерывные функции, с, > 0,с2 > 0 - заданные числа.

Мы считаем, что случайный процесс е(г) задан своим характеристическим функционалом, который определяется по формуле

<ре (у) = М(ехр(г|е(5)у(5)^)),

'о

где ve L,[í0,T], а управление u(t) выбирается случайным образом и не зависит от

т.

Пусть сначала Аг = в2 = 0, с2 = 0. Тогда критерий качества имеет вид

1 Тг Г

/, = - (s)M1 (x(s)) + В, (s)M2 <u(s))]ds + (х(Т)) (3.2.1)

2'0 2

и не зависит от M(u(t)u(T)). Будем искать M(u(t)), при котором функционал /,

принимает минимальное значение.

В точке минимума функционала вариационная производная обращается в

нуль. Найдем вариационную производную.

Лемма. Вариационная производная функционала /, равна

т ,

J A (s)[M (ха )<ре (-iz(!„, S)) + (~iz(h, s))M (u(h))dh]<pr (-¿z(t, s))ds +

(3.2.3)

+ Bl{tW{u(t)) + cM(xB)pe(-iX(t0,T))pt(4z(t,T)) + cpc(-№

Теорема. Математическое ожидание M(u(<)) задачи (3.1.1), (3.1.2), (3.2.1) является решением уравнения Фредгольма второго рода

В, (t)-' J Л, (s)M(x0)<ре(~iz(ta, S))<pe (-iza, s))ds + M(«(/)) +

+С, в, (г)м (дг0 (ЧггС о Т))^ (-iz(t, Т))+

] Л, (s)f£ (-iz(t, S))<pt (-iX(h, , Л > t (1.2A)

■hr +

. 1

+ c, <pc (-iz(t, T))<pt {-iz(h, T))]M (u(h))dh = 0. Таким образом, для нахождения м («(<)) нужно решить детерминированное уравнение Фредгольма (3.2.4). Далее, для нахождения второй моментной функции оптимального управления положим в функционале I коэффициентыAi,Bi и с, равными нулю, тогда критерий качества / примет вид

, гг

I2 = -JJ[A2(s1,s2)M2(*(s1)x(s2)) + B2(j1,j2)M3(M(s1)u(s2))]ds1íís2 +^-М2(х2(Г)). (3.3.1) 2<0<0 2

-в, (/)-'}[•

Будем искать М(и(/)и(г)), которое доставляет минимум функционалу /,. Вторая моментная функция решения задачи (3.1.1), (3.1.2) имеет вид М (*(*)*(*)) = М(хга )<рс (~1Х(!а, - 1х(1а, 0) ■+

/ 5

+ М (х0)[ | <р£ (-¡Х(т, 0 - а(10, ¡))М (и(т)У1т + ^<р£ 5) - ¿х(г0,1))М (и(т)У1т] -

'о 'о

/ I

+1 <рс (-¿х(т, 5) - 1))М (и(т)и^)У1т.

'о '»

Подставив это выражение в функционал /2, получим

т т

= Т Я[^ ^ Xм (^0 (-'ЖСо.-У.) -'Ж - ^ )) +

'о'о

'I »2

+ М Сдг0) [| (-#(*-, ) - №. ))м (и + / <Ре я2) - . * I)) М (и ] +

'о 'о

+ +В2(^2)М2(«(5,)Н(52))]<&,Л2 + (3-3.2)

\М{х1 )<рс (-Их00,7)) + 2Л/ (х0)} (рс {-1х(г,Т) -¿х(10,Т))М(и(т)У1т +

+ ^

Г т

'и '<1

Для удобства вычислений введем следующие обозначения

= М (х2)^ (-#('„ #('„, *2))+М (ха-)[\<рс{-1х(т, 5-,) - #(/0,52 ))М (и(т)>/г+

аг

+ -Г,) - 'ХОо. ))м ("(Г)^г],

>.1

V = М (*02 )р,(-21*(/0, Г)) + 2М (д: 0) | Л Г) - , Г))М (и(г)>/т, р(£г) = <Р£(ЧХ(Т,Т)-1Х(^Т)).

¡2 + + <11 'и <o 'о

T Т

+ Вг (s,, i2 )М2 («(i, )и( j2 ))ds,ds2 +—w + jj p^,t)M(u(r)u^))d^drf

или с заменой выражения м (и(г)н(^)) на у(т,£),

Irr S|l!

h = 2 J jv)[/(*. *2 )■+ J J i. + s2 (5,, j2 )y1 (г,

ro fo 'o 'o

(3.3.3)

Далее доказываются основные лемма и теорема.

Лемма. Вариационная производная ^2^ функционала (3.3.3) равна

TT s,s2

¡¡Msl,s2)[f(sl,s2) + jjg(ju,s2,Ti,slMTi,/i)drf7j]g(g,s2,T,sl)ds1ds2 +

i Т 'о 'о

Г Т

+ Д2(£ г)у(£ г) + c2[V + J J рС", T})y(M,T])djudTj]p(£ г).

'о'о

Теорема. Вторая моментная функция М(и(г)и(г)) задачи (3.1.1), (3.1.2), (3.3.1) является решением уравнения Фредгольма второго рода

М (и(г)и(&) + В2-' (£ т)\ \ А2 (5,, 5, )[М(х02 )<ре {-1%,^ - ¡Х,2) + {г

•о <о

J Т

+ В{х (£ т)—с2(ре Нх^т - ¡Хг.т )№(х02)<р£ {-Их,а) + 2Мхй |<ре Нх,а7 - ¡ХгХ)Ми(г№] +

\ <Ре ~ )<Ре ~ IXг,ч №„Г)>Т

\ <рс (->Хм,<г - Сг,.,, )<Ре НХ^2 - 1хг.н , 7 < г

(кг,ц<1;

|<Рг~ 1Хп.н )<РС-¡Хг.;, . »7 < + С2<рс (-1Х(.т - 'Хг.т)4>г(~'ХРТ - 'Хч.т)М(ц{Ц)и{ф)(1^Т] = 0.

(3.3.4)

Четвертая глава посвящена численным расчётам статистических характеристик и их анализу. Сначала описывается используемый квадратурный метод решения уравнения Фредгольма, затем приводятся выкладки из пакета прикладного программного обеспечения МаЛсас! с примером графика второй моментной функции управления для конкретной задачи.

Автор выражает искреннюю благодарность своему научному руководителю доктору физико-математических наук профессору Задорожнему Владимиру Григорьевичу за постановку задачи, руководство и постоянное внимание к работе.

Публикации автора по теме диссертации

1. Якубенко, И. П. Об одном методе численного интегрирования дифференциальных уравнений / И. П. Якубенко, А. Н. Головко // Черноземный альманах научных исследований. - 2007,- № 2(6). - С. 26-31.

2. Задорожний, В. Г. Нахождение оптимального управления для линейной стохастической системы с квадратичным критерием качества / В. Г. Задорожний, И. П. Якубенко // Вестник факультета прикладной математики, информатики и механики. - 2010. - Вып. 8. - С. 169-175.

3. Задорожний, В. Г. Модели управления производством при случайно изменяющихся факторах / В. Г. Задорожний, И. П. Якубенко // Современная экономика: проблемы и решения. - 2011. - №9(21). - С. 138-144.

4. Задорожний, В. Г. Об оптимальном управлении линейной системой со случайными коэффициентами / В. Г. Задорожний, И. П. Якубенко // Вестник воронежского государственного университета. Серия Физика. Математика. -2012. -№ 1.-С. 126-134.

5. Задорожний, В. Г. Моментные функции оптимального управления линейной системой со случайными коэффициентами / В. Г. Задорожний, И. П. Якубенко // Труды XII Всероссийского совещания по проблемам управления (ВСПУ 2014). -М.: изд-во ИЛУ РАН. - С. 9530-9538.

6. Якубенко, И. П. О задаче поиска второй моментной функции оптимального управления системы со случайными коэффициентами / И. П. Якубенко // Межвузовский сб. Теория и практика актуальных исследований в гуманитарных, правовых и экономических направлениях. - 2014. - С. 223-225.

7. Якубенко, И. П. Оптимальное управление и первая моментная функция управления линейной системой с квадратичным критерием качества / И. П. Якубенко // Естественно-научные исследования и технический прогресс. Сборник статей по материалам Всероссийской научно-практической конференции

(15 декабря 2014 г. Воронеж). - 2014. - № 4(11). - С. 92.

8. Якубенко, И. П. Постановка задачи оптимального управления линейной системы с квадратичным критерием качества со случайным процессом [Электронный ресурс] / И. П. Якубенко // Моделирование энергоинформационных процессов: Сборник материалов III международной научно-практической интернет-

конференции (22-24.12.2014). - Режим доступа: http://www.vsuet.ru/science/conference.asp.

9. Якубенко, И. П. Подходы к поиску оптимального управления линейной системой с квадратичным критерием качества / И. П. Якубенко // Вестник факультета прикладной математики, информатики и механики. — 2015. - Вып. 10. - С. 277291.

10. Якубенко, И. П. Алгоритм поиска приближенного математического ожидания дифференциальных уравнений / И. П. Якубенко // Вопросы науки: Естественнонаучные исследования и технический прогресс. Сборник статей по материалам III Международной научно-практической конференции (26 февраля 2015 г. Воронеж). - 2015. -Т. 2. - С. 6-8.

11. Якубенко, И. П. Расчёт первых моментных функций траектории и управления линейной системой с квадратичным критерием качества с применением Mathcad / И. П. Якубенко // Вопросы науки: Естественно-научные исследования и технический прогресс. Сборник статей по материалам III Международной научно-практической конференции (26 февраля 2015 г. Воронеж). - 2015. - Т. 2. - С. 913.

Работы [3], [4], [5] опубликованы в журналах из перечня рецензируемых научных журналов и изданий, рекомендованных ВАК Минобрнауки РФ.

Подписано в печать 15.04.2015 г. Формат 60x84 1/16. Печать электрографическая. Усл. печ. л. 0,93. Тираж 120 экз. Заказ №11 Отпечатано в типографии «Новопресс». г. Воронеж, В. Невского 13