Оптимизация линейных систем управления с фазовыми ограничениями тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Карасева, Галина Леонидовна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Минск МЕСТО ЗАЩИТЫ
1998 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Оптимизация линейных систем управления с фазовыми ограничениями»
 
Автореферат диссертации на тему "Оптимизация линейных систем управления с фазовыми ограничениями"

/

Национальная Академия наук Беларуси Институт математики

УДК 517.977.5

Карасева Галина Леонидовна

ОПТИМИЗАЦИЯ ЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ

01.01.09-математическая кибернетика

Автореферат диссертации йа соискание ученой степени кандидата физико-математических наук

Минск 1998

Работа выполнена в Белорусском государственном университете

Научные руководители - доктор физико - математических наук,

профессор Рафаил Габасов

- доктор физико-математических наук Костюкова Ольга Ивановна

Официальные оппоненты - доктор физико-математических наук,

профессор

Гороховик Валентин Викентьевич

- кандидат физико-математических наук, доцент

Горячкин Владимир Викторович

Оппонирующая организация - Институт космических исследовани;

Национальной академии и Национального космического агенства Украины ( Киев )

Защита состоится "27" февраля 1998 года в 15 часов на заседаю совета по защите диссертаций Д 01.02.02 в Институте математик НАН Беларуси по адресу: г. Минск, ул. Сурганова, 11.

С диссертацией можно ознакомиться в библиотеке Института мат матики

Автореферат разослан " Я» января 1998 года

Ученый секретарь совета по защите диссертации

Астровский А.И.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

1. Актуальность темы диссертации.

В диссертационной работе исследуются следующие линейные за-1ачи оптимального управления с фазовыми ограничениями: задача ; фазовыми ограничениями и терминальным ограничением на конец траектории; задача с фазовыми ограничениями и нефиксированным 1ачальным состоянием; задача минимизации максимального укло-хения траектории линейной системы и задача с фазовыми ограничениями в классе многомерных управлений. Существует большое число прикладных проблем, в которых математические модели имеют вид перечисленных выше задач. Это и проблема управления хозяйством, и проблема планирования технологических процессов производства, и проблема автоматического регулирования. Поэтому исследование задач оптимального управления с фазовыми ограничениями (доказательство необходимых и достаточных условий оптимальности, идентификация структуры решения задачи, построение алгоритма решения) является актуальным вопросом.

Задачи с фазовыми ограничениями исследовались в работах Р.В.Гамкрелидзе, А.Я.Лубовшгкого, А.А.Милютина, В.А.Троицкого, Л.В.Нойштадта, В.И.Плотникова, А.Б.Куржанского, Ю.С.Оси-пова, А.Л.Иоффе, В.М.Тихомирова, Х.Халкина, А.С.Матвеева, В.АЛкубовича, А.М.Тер-Крикорова, Ф.Л.Черноусько, В.Б.Колма-новского, А.В.Арутюнова, С.М.Асеева, А.В.Дмитрука. Новый подход к решению задач с фазовыми ограничениями предложен в работах Р.Габасова, Ф.М.Кирилловой и обобщен О.И.Костюковой.

Несмотря на большие успехи, достигнутые в области разработки методов решения задач оптимального управления с фазовыми ограничениями, нужно признать, что эта работа далека от завершения. Одним из способов повышения эффективности численных методов (который принят в данной работе) является учет специфики решаемой задачи. В диссертации показывается, что за счет усложнения логической структуры метода можно уменьшить затраты вычислительного времени и требования к объему оперативной памяти.

2. Связь с крупными научными программами и темами.

Диссертационная работа выполнена по темам важнейших научно-исследовательских работ в области естественных наук кафедры методов оптимального управления Белорусского государственного университета:

— "Качественная и конструктивная теория оптимизации стохас тических и динамических систем (математическое моделировали« алгоритмы оценивания состояний, синтез оптимальных систем, ш •годы решения негладких экстремальных задач и их приложения)' № 01910056832, 50.41 (Республиканская программа в области мак матики, математического моделирования;

— "Качественные, асимптотические и численные методы исследс в алия и оптимизации динамических систем", 27.31.17 (Приказ ВГ^ № 216-Д от 19.03.96 г. Программа АНВ "Математические стру! туры" (19), "Алгоритм" (20));

— "Оптимизация непрерывных и дискретных процессов в режим реального времени", 27.03.17. (Республиканская программа в оЕ ласти математического моделирования).

3. Цель и задачи исследования.

Пелью данной диссертационной работы является решение перс численных ранее линейных задач с фазовыми ограничениями мете дами конструктивной теории оптимального управления. При ис следовании применялся подход, разработанный на кафедре методо оптимального управления Белорусского государственного универ ситета и в отделе теории процессов управления Института мате^ атики АН Беларуси. В задачи исследования входило:

— формулировка двух типов критерия оптимальности, их дс казательство, определенеяие связи между ними, обоснование ал горитма построения оптимального управления линейной задачи фазовыми ограничениями и терминальным ограничением на коне траектории;

— обоснование критерия оптимальности и разработка алгорш ма решения линейной задачи с фазовыми ограничениями и нефикск рованным начальным состоянием;

— доказательство двух форм критерия оптимальности и построй ние алгоритма оптимального управления в задаче минимизации ма! симального уклонения траектории линейной системы;

— разработка теории и алгоритма оптимального управления дл линейной задачи с фазовыми ограничениями в классе многомерны управлений.

4. Научная новизна полученных результатов.

В диссертации исследованы новые задачи оптимального управ ления с фазовыми ограничениями. Лля каждой из них сформулирс ваны и доказаны две формы критерия оптимальности и установлен

связь между ними, предложен алгоритм и сформулированы условия невырожденности решения, гарантирующие конечность предложенного алгоритма, разработаны вычислительные процедуры, позволяющие легко осуществить программную реализацию метода. Предложенные методы являются точными, релаксационными, сходящимися к оптимальному решению.

, При исследовании задач применялся единый подход, но с максимальным учетом специфики каждой решаемой задачи.

5. Практическая значимость полученных результатов.

Диссертационная работа носит теоретический характер. Задачи, исследованные в ней, являются математическими моделями ряда практических проблем принятия решений в конкретных социально-экономических, технических и других системах. Поэтому полученные теоретические результаты могут найти применение в указанных областях.

6. Экономическая значимость полученных результатов.

Выполненная работа имеет практическое значение. Экономический эффект от использования полученных результатов решения рассмотренных задач на данном этапе не определен.

7. Основные положения диссертации, выносимые на защиту.

На защиту выносятся следующие результаты:

— доказательство двух форм критерия оптимальности, обоснование алгоритма и разработка процедур построения оптимального управления линейной задачи с фазовыми ограничениями и терминальным ограничением на конец траектории;

— формулировка критерия оптимальности, построение алгоритма решения линейной задачи с фазовыми ограничениями и нефиксированным начальным состоянием;

— разработка теории и метода решения задачи минимизации максимального уклонения траектории линейной системы;

— формулировка критерия оптимальности, обоснование алгоритма построения оптимального управления линейной задачи с фазовыми ограничениями в классе многомерных управлений.

8. Личный вклад соискателя.

Основные результаты, изложенные в диссертации, получены лично автором. Из двух совместно опубликованных работ в диссертацию включены второй раздел препринта [116] и второй параграф

статьи [117], которые принадлежат лично автору.

9. Апробация результатов диссертации.

По теме диссертации сделаны доклады на Международной конференции "Актуальные проблемы информатики" (г.Минск, 1992) Международной конференции "Проблемы Алгебры и кибернетики' (г.Гомель, 1995), Белорусском конгрессе по теоретической и прикладной кибернетике (г.Минск, 1995), Международной конференции "Актуальные проблемы информатики" (г.Минск, 1996), VII Белорусской математической конференции (г.Минск, 1996).

Результаты диссертации обсуждались на объединенном семинаре по конструктивным, методам оптимизации кафедры методов оптимального управления Велгосуниверситета и отдела теории процессов управления Института математики НАН Беларуси (руководители - профессор Р.Габасов, член-корр. НАН РВ Ф.М.Кириллова),

10. О лу бликов анность результатов.

Результаты диссертации опубликованы в 4 статьях, в материалах и 5 тезисах научных конференций.

11. Структура и объем диссертации.

Диссертация состоит из введения, общей характеристики работы, пяти глав, списка использованных источников. Объем диссертации 109 страниц, объем списка использованных источников (120 наименований) - 9 страниц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Основной целью диссертации является исследование задач оптимального управления с фазовыми ограничениями: доказательство критериев оптимальности; обоснование алгоритма построения оптимального управления; разработка вычислительных процедур, позволяющих осуществить программную реализацию метода.

При исследовании применялся единый подход, но с максимальным учетом специфики каждой решаемой задачи.

Диссертация состоит из введения, пяти глав и списка используемых источников.

В первой главе дается краткий исторический очерк развития качественной и конструктивной теорий для задач оптимального управления с фазовыми ограничениями. Описаны основные методы по

теме исследования, созданные за предшествующие годы, обоснована необходимость разработки новых, более эффективных алгоритмов.

Вторая глава диссертации посвящена исследованию задачи оптимального управления с фазовыми ограничениями и терминальным ограничением на конец траектории:

7(и) = с'г(Г) —> шах, х = Ах + Ъщ х(0) = х0, Нх{г') = д, (1)

а,(г) <с1'х^) <а*{г), |и(*)|<1, *€Г =[(),*•], гёй», ней, с,М £ Я", А £ Лпхп, Н £ Я"1*", гапк Н = т < п,

Введем обозначения: и(>) = (и(г), I £ Т), х(-) = * £ Т),

которые используются в дальнейшем.

Определения допустимого, оптимального и субоптимального управлений и соответствующих им траекторий вводятся стандартно.

Будем считать, что для задачи (1) выполняются соотношения:

¿'Ьф О, Л.(0) < ¿'х0 < «'(0)

и основные ограничения задачи (1) удовлетворяют условию Слей-тера, т.е. существует такое <5, что для любого Ад £ Лт, || Ад ||< 5, найдется такое управление «(•), что вдоль него и соответствующей ему траектории х(-) выполняются соотношения:

|ы(0| < 1, < < а*(г), г € Г; Нх(г') = д + Ад.

Исследуется управляемость основных ограничений задачи (1). На отрезке Т выделяется подмножество Тоа С Т, состоящее из отрезков Т{ = [г,-,г'], г,- < т' < т,>1, г £ N = {1, • • • ,р}. Вводятся понятия опоры и опорной совокупности. Доказано

Утверждение. Динамическая система является управляемой относительно терминальных и фазовых ограничений на отрезках Т,-, I £ М, тогда и только тогда, когда существует опора ограничений.

Рассмотривается допустимое управление и(-) и соответствующая ему траектория х(-). Используя эти управление и траекторию, строятся множества:

Го = {г £ т: ¿'3(0 = в,(0 V «•(«)} = и Тг,

¡ел

П = [г,-, г1'], т<т<< т{+1, I £ N = {1,..., По};

ЛГ+ = {г £ N : = а*(*), * € I}}, N- = N\ ЛГ+;

К = {» £ : т,- < И}, = {г £ : г,- < г'}, N. = ЫГ и ^ К = \ ЛГ+, = \ ЛТ", Ти = Т\ и Тс.

¿еЛГ.

Допустимое управление называется регулярным, если щ < оо к множество Тк = € У Т< : |м(2)| = 1} состоит из конечного числа

точек: Т* = {г/,] = 1,?}, д < оо.

Формула приращения критерия качества задачи (1) имеет вид:

Ы{и) = [ ф'{фАи{г) & + +

Г, . у

Здесь Дж(г) = = й(*) - Ды(*) = ¿'Да;(0, * € Т.

функция £ Г, - решение сопряженной системы:

= л, * е т„ л(<) = а = (е - ъ^/а'ь)А, г е г{, * е я,.

Доказаны критерии оптимальности для задачи (1). Критерий оптимальности 1. Пусть в задаче (1) выполняется условие Слейтера. Тогда для оптимальности регулярного управления в задаче (1) необходима и достаточно существования такого вектора и — (у;щ,г € -/V), что вдоль соответствующего ему решения системы (3) и управления и(-) выполняются следующие соотношения:

ф'{г)Ьи{1) = тахф'(1)Ъи, % € Тг; М<1

Ф'(т')Ъ Г > О, г е _ _ 1р'(п+0)Ъ ( > 0, « € , .

¿•ъ \<.о, ¿бДг; й'ь \<о, х&к-, ™

Г > о, « € Я, » € ЛГ+, _ Г > О, ¿6 лу, й'Ь \ < о, г е Г{, I € л^г; I < о, ¡6 лг0_.

Рассмотрим систему:

-XV-<*£(*), <р,(?) = с'-у'Н1 (5)

Ч> (Те) = Ч> 0« + 0) - ¿и.-» »' € (т') = р (г'" + 0) - Л/, » €

Система (5) является классической сопряженной системой задачи (1). Доказан критерий оптимальности в терминах системы (5).

Критерий оптимальности 2. Пусть в задаче (1) выполняется условие Слейтера. Тогда для оптимальности регулярного управления в

задаче (1) необходимо и достаточно существования таких кусочно-непрерывной функции £(£), 2 € Т, вектора у, чисел г;,-, г 6 г/, >' € € ЛГ«, что вдоль соответствующего им решения <р(-) системы (5) и управления и(-) выполняются следующие соотношения:

<р'{г)Ьи&) = тах<р'Ц)Ьи, г 6 Г; = тах - г € Г;

и{в.'х(тЛ — тах ил, » € Я; и'<1'х(т1) = тах иЧ, » € ¿V,.

На основании критерия оптимальности 2 доказано Следствие 1. Пусть - оптимальное управление. Если и°(г,— -0) # ы°(т.- + 0) - 0) ф и°(г'' + 0)), г 6 то и? = 0 (гЛ' = 0).

Показано, что между параметрами систем (3) и (5) существует взаимно однозначное соответствие, которое выражается формулами

V* = ф'(т*)Ь/<1'Ь, = ф'(п + 0)Ъ/с1'Ъ, £бЛГ.; VI = « е

№ = о, «€ г,; = -V- '{?)аь/<1'ь, I е 1-,» е

и,- = и,- + т}(т,- + 0), г 6 Д,,; г;,- = и,-, » 6

= #>(<). М) = ?>(*)+«ЭДО. *ет{>

r](t)___Г_+J

г

¿з, íет;-, ¡6д.

Введем понятие структуры и определяющих элементов. Пусть х°(-) - оптимальные управление и траектория. Для обозначения соответствующих им множеств (2) будем использовать верхний индекс "0", например, Тд, Т°, и т.д. Построим множество

Г(.) = 0 € Г \ У Т? : - 0) + «°(< + 0)1/2 < 1}.

В дальнейшем предполагается, что оптимальное управление и°(-) таково, что тезТ^ = 0. Построим множества и параметры:

Ь. = Л?, и = {* € N° : и°(тР - 0) = и°(т<° + 0)}, Ь = Ь. и^о! Ьн = {» е Ь, : и°(тР - 0) ф ий{т? + 0)}, Ьв = {» € Ь, : и°(т°'' - 0) ф и°(т0'' + 0)}, р = \Ь\;

(rf < roi < т?+1, » = Ï^TÏ; r°° = 0), ¿о = 0, если r°? < t', e0 = 1, если r0p = f;

ki = u°(Toi + 0), » = 0w = d'x\r?), i = ГГр; (6)

{<?-, J = Ш = {< r°+l[: u°(i - 0) # tt°(t + 0»,

*?y < t°J+l> j = 1.PJ - 1; г = Q,p — £q. Совокупность

S = {p, A, L, X„ X0, ХЛ, As, p.-, Ai, » = 0,P - 4r> Pi, » = I7p> (7)

назовем структурой задачи (1), а совокупность

= Oij,J = ï7p<;i = 0,p-£a;r?,i б X;roi,i e X,; û?, t e X;y0} (8)

- определяющими элементами системы (1).

Из условия оптимальности (4), следствия 1 и ограничений задачи (1) следует, что совокупность (8) является решением системы нелинейных уравнений:

Gl{e) = HX(6,f)-g = 0,

Ог(в) = п) - m rO, « € X) = 0,

ЗД) = (d'x{6, tï - 0) - /?(<?, г4), » 6 Х\ХД; .

d т>' + 0) - ¿(0, r1'), i 6 ХДХ*) = 0,

(?<(*) = (v i.j)b, i = Ï7P7; * = O,P-4>) = o, GW) = (и,- - n +• o)6/d'6, » e хл) = о, Ge(fl) = (^'(0,т')6/с*'6, г eLR) = 0. Здесь ^ € T, - траектории систем:

X = + MM), x(0) = î> = -А'{в,г)ф, = с - ff'y,

^(г,- - 0) = ^(tï + 0) - d v,-, t 6 X.

жÎ) = A, i € Г \ ¡J [г,-, r1]; = Â, i € [т;,T1'], t e X.;

ieL.

= /?(*, *)/<*'й, t € [r.-.r1], » б X,; w(ô,t) = (-1)'*,-, t e[i,v,i,7+ij, i = oTp?, » = o,p - £0; 0(0, t) = Mi • <*(*), i € [7|,т'], i€X..

(9)

- (10) (И)

Уравнения (9) назовем уравнениями доводки.

Совокупности (7) и (9) доставляют конечномерную, полную информацию о решении задачи (1). Зная параметры 5, 0°, можно однозначно восстановить решение задачи (1). Таким образом, проблема поиска решения задачи (1) сводится к построению конечного набора параметров.

Предлагается следующая схема построения конструктивного алгоритма.

Алгоритм составим из двух процедур: процедуры формирования и анализа решения опорных задач (ФАРОЗ) и процедуры доводки.

С помощью первой процедуры находим приближенное решение задачи (1). Для этого выбердем параметр М и построим М - аппроксимацию исходной задачи, которая рассматривается в классе кусочно-постоянных управлений с фазовыми ограничениями в дискретные моменты времени. По ее решению идентифицируем структуру (7) и вычисляем приближенные значения определяющих элементов. Далее, используя процедуру доводки, находим точные (со сколь угодно высокой точностью) значения определяющих элементов. Поиск точных значений определяющих элементов осуществляется путем решения системы уравнений доводки (9) методом Ньютона.

Пусть уравнения доводки имеют решение. Построим траектории систем (8), (9) и проверим соотношения:

г0' <ь°а<г°2<---< г°{р. < т,°+1, г = оТр;

. а(*) - ¿'Ах0{1)№'Ъ\ < 1, т ■ фНфАЪ/й'Ъ > 0, «_€ [гР,то;], г € £.;

■ф°'{1)Ъ• 1)' > о, ге ¿=67^; ¿ = 0,Р-£0; (12)

Если (12) выполняются, то управление:

и°{1) = ш{в\1), *£Г\ и ДОЛ

(13)

«°(<) = (« • ¿(0 - ¿'Ахв(*))/<Ю, г € [тР,то;[, г € Ь„

является оптимальным в задаче (1).

Предположим, что не удалось построить решение уравнений доводки либо решение построено, но на нем нарушаются соотношения (11). В этом случае считаем, что начальная информация для второй процедуры была грубой. Для уточнения этой информации вновь возвращаемся к первой процедуре, заменив параметр М на 2М.

Для задачи (1) сформулированы условия невырожденности реп: ения, гарантирующие конечность предложенного алгоритма.

В третьей главе исследуется задача:

J{xо,и) = с'х(^) —► тах, х = Ах + Ьи, аг(0) = € X = {х € Л" : вх = /, < х < (14

вФ(0 < < а*(<), |»(«)| <1, « € Г = [0,«*].

Задача (14) отличается от задачи (1) тем, что начальное состоя ние жо не фиксировано, а принадлежит множеству X.

Понятия допустимого, оптимального, субоптимального управле ний, начального состояния и соответствующих им траекторий ввс дятся стандартно.

Условие Слейтера для задачи (14) формулируется следуюпшэ образом: существуют такие допустимое управление и(-) и началь ное состояние хо , что на соответствующей им траектории х(-) фа зовые ограничения пассивны: а*(0 < с1'х{1) < £*'(£), I € Т.

Используя допустимые управление, начальное состояние и сооа ветствующую им траекторию, построим множества типа (2) и мне жества:

^ = Л ■. ®0у = <*]}, = О' € /: х0,- = <*.,•}, ./о = -П- (1£

По аналогии с задачей (1) вводится понятие регулярного упраь ления.

Рассмотрим систему:

ф = -А!{1)ф, ф(Г) = с; (

ф(тi-G) = ф{тi+ Q)-dvi, г 6 И] Аг = ф{0) + С7.

Справедлив следующий

Критерий оптимальности. Пусть в задаче (14) выполняется уI ловие Слейтера. Тогда для оптимальности регулярного управление начального состояния в задаче (14) необходимо и достаточно сущесл вования такого вектора V = (и,-, г & N1 у), что вдоль соответству щего ему решения системы (16) выполняются соотношения:

Ф'(г)Ьи{г) = тахф '(г)Ьи, г е гн;

М<1

Ф'{т*)Ь г>0, I € _ Ф4ъ + 0)Ь Г >0, ,

«м \<°» »е-^г; ¿'Ь \<0, >' едг;

Ф'ЮАфЪ Г > о, * е я, £ € Г > О, ¡6

й'Ь 1 < о, * 6 Т{, £ € N'1 ' \ < О, г € Л^;

Д*/ > О, » 6 .7+, Дх;- < О, £ € .Г, Дх, = о,»е

Пусть и°(-), Жр, а;°(-) - оптимальные управление, начальное состояние и траектория. Построим соответствующие им множества и параметры (2), (7), (15). По аналогии с задачей (1) введем понятия структуры и определяющих элементов задачи (14). Совокупность

Я = {р,е0,Ь,Ь,,10,Ьн,Ь11>р1,к1^ = = 17(18)

назовем структурой, а совокупность

9° = б Л; = ТГрГ;г =

определяющими элементами задачи (14).

Общая схема алгоритма решения задачи (14) аналогична приведенной в главе 2.

М - задача строится очевидным образом. По решению М - задачи определяется структура (18) и вычисляются приближенные значения определяющих элементов (19). Точные значения ( со сколь угодно высокой точностью) определяющих элементов находим путем решения уравнений доводки методом Ньютона. Для задачи (14) уравнения доводки имеют вид:

<?!(*) = (¿'х(М) - №), »'€£)= О,

= ¿?Хо - / = О,

<7з(0) = (<*'*(*,т.- - 0) - 4(0, г,-), £ е ¿\£д;

. Г'" + 0) - ¿(0, г4), » € ¿ДХл) = о;

<?4(0) = (0/(6,0) + j 6 /о) = 0, 05(0) = Ш » = О,;»-/0) = О,

С?в(б) = (Ъ—Ф'{0,п + 0)Ь/<1'Ь, I € £л) = 0, = {ф'{9,т<)Ь/а% г е Ьн) = 0,

где х(М)1 - траектории систем:

* = л'(0,Ох+М*>О, (20)

х(0) = Хо = (Хо; = го/,7 £ ./о, Хоу = € Хо/ = <= 7~), ф = -А'(<М)^> 0 (О = с, ^ - 0) = ф(п + 0) - ¿VI, г е (21)

Если выполняются соотношения (12) и

> о, je J+; А% < О, j € J-, (22)

то решение задачи (14) восстановим по формулам (13) и начальному состоянию системы (20).

В случае, если уравнения доводки не удалось решить или решение построено, но на нем нарушаются соотношения (12), (22), тс возвращаемся к первой процедуре, заменив параметр М на 2М.

Глава 3 завершается формулировкой условий невырожденности решения, гарантирующих конечность предложенного алгоритма построения оптимального управления и начального состояния задачи (14).

В главе 4 исследуется задача минимизации максимального уклонения линейной системы:

m^cjd'a(i)| —> min,

as = Ах + Ьи, я(0) = х0, Яз(Г) = д, |u(i)| < 1, t е Т = [0,f*]; (23]

xeRa,ueR, А е Ä*xn Я € Rmxa] гапкН = m < п, b,deRn.

Формально, задача (23) записала без фазовых ограничений, но имеет негладкий критерий качества. Она эквивалентна задаче оптимального управления с фазовыми ограничениями:

J(a,u) = —а —* max,

Cr,И

х = Ах + Ьи, з(0) = го, Ex(t') = д, (24)

\d'x{t)\<a, |u(t)|<l, t ET — [0,i*].

Определения допустимого, оптимального, субоптимального управлений и соответствующих им траекторий вводятся стандартно.

Будем считать, что ограничения задачи (23) удовлетворяют условию Слейтера: существует такое 6, что для любого Ад € Rm II Ар ||< <5, найдется такое управление tt(-), что вдоль него и соответствующей ему траектории х(-) выполняются соотношения:

|»(<)| < 1, < € Г; Нх{?) = д + Ад.

Пусть ц(.), я(-) - допустиое управление и соответствующая ещ траектория. Построим множества:

To = {teT: |d'i(i)| = а} = (J Tu

ieN

Г; = [r;,r'], Т,-<т'" <Ti+1, г е JV= {1,---,По>;

N+ = {i 6 N : d's(t) - а = 0, t 6 Г;}, N~ = N\ N+,

К = .{»' € N+ : т; < г'}, i^r = {г € N~ : n < т£}, N+ = \ N+, ЛГ0~ = ЛГ \ iV-, iV, = U iVo = iV0+ и Nq , TH = T \ (J Tai.

iew.

Определение регулярного управления вводится по аналогии с задачей (1).

Рассмотрим систему (5) при условии, что вектор с равен нулю. Справедлив

Критерий оптимальности. Пусть в задаче (24) выполняется условие Слейтера. Тогда для оптимальность регулярного управления в задаче (24) необходимо и достаточно существования таких кусочно-непрерывной функции £(t),£ 6 Т, вектора, у € Rm, чисел v,-, » € N; г/, г 6 что вдоль соответствующего им решения системы (5) (с = 0) выполняются соотношения:

/ша+;Е>|+£И=1,

у >"eiv. ie-tf..

cp'(t)bu{t) = max <p'(t)bu, i € T; -£(t)d'x(t) = max-£(4)7, i € Г;

M<1 W<«

Vid'x(ri) = шахи,"у, t € iV0; v'd'x(T') = maxu'7, t € JV0».

М<<* l7i<«

Сформулирован и доказан критерий оптимальности в терминах системы (3) при условии, что вектор с равен нулю.

Критерий оптимальности. Пусть в задаче (24) выполняется условие Слейтера. Тогда для оптимальности регулярного управления в задаче (23) необходимо и достаточно существования такого вектора i/ = (y;t7;,i € N), что вдоль соответствующего ему решения ф(-) системы (3) (с = 0 ) и управления «(•) выполняются следующие соотношения:

0; i>'{t)bu(t) — maxip'{t)bu, t € Тн;

ieiv,

Ф'(т:)Ь Г > 0, i € iV+, _ _ ф '[г; + Q)b Г > 0, i € N+, d'à \<0, i € /С; Ui d'b \<Q, ieNr;

Ф'ЮА(г)Ь Г > 0, t e Ti, i e iv+, f > o, i € iv0+,

d'b t<0, teîl-, t€iV-; 1 \ < 0, t € Nq.

Поскольку решение системы (3) при с = 0 однородно относительно вектора V , а условия оптимальности однородны относительно ф^), £ €Е Т, то можно считать, что сумма |и,|, г € Л^ равна 1.

Структура решения задачи (24) совпадает с видом структуры (7) задачи (1). Совокупность (8) дополним параметром а0, который равен значению критерия качества на оптимальном управлении. В результате получим вектор определяющих элементов задачи (24):

0° = = = 0,р-4>;т?,г 6 £;т°\» б г € X; у0}.

Уравнения (8) дополним уравнением: С7(6) = £ щ ■ — 1 =0.

геь

Получим уравнения доводки задачи (24).

Схема алгоритма построения оптимального управления задачи (24) совпадает с разработанной ранее.

В главе 5 исследуется задача с фазовыми ограничениями в классе многомерных управлений:

Ли) = с'х{1*) —>■ шах, К ' ' (25)

х = Ах + Ви, х(0) = яо, ¿'ж(*) < а(0, |ы(*)1 < 1, < £ Т = [0, **];

и(<) = (В1(0,.... «,(*)), гет,х= х(г) е пп, л е я.ахп, в е гпхг, г > 1; с, с16 г71, а(<) е с2, гет.

Задача (24) отличается от рассмотренных ранее тем, что в ней управление является г -мерным вектором.

Определения допустимого, оптимальньного субоптимального управлений и соответствующих им траекторий вводятся стандартно.

Делается предположение, что с2'Ь; ф 0* » = 1,г; и ограничения задачи (24) удовлетворяют условию типа Слейтера: существует такое управление й(-) , < £ !Г, что вдоль соответствующей ему траектории х(-) выполняется неравенство тах(^'а:(4) — а(<)) < 0.

Рассмотрим допустимое управление и(-) и соответствующую ему траекторию ж(-). Введем искусственную компоненту ио(0 = - а(4) < 0 , I € Т . Наряду с исходным векторным управлением исследуется расширенное векторное управление (и,(4), 5 = 0,г) , t ЕТ . Критическим значением для компоненты «о(£) , < е Г, полагается значение, равное нулю, критическими значениями для компонент «¿(¿), » = 1,г, 2 € Г, полагаются значения,равные ±1. Вводятся обозначения: / = {1,2,... ,г}, I = 01)/. Отрезок Т разбивается на подотрезки Г; = [г;,т;+1], г; < т;+1, г = 0,т; го = 0, Тт+1 = > таким образом, чтобы для каждого г € {0,1,...,тп} существовало подмножество /(¿) С /, при котором а) компоненты

з € Д/(г), на отрезке I}, принимали критические значения; б) компоненты и,(1), з £ 1(г), на отрезке Т; могли принимать критические значения только в изолированных точках £ € Т;. Вводятся обозначения:

Ь = {0,1,... ,тп}, 10 = ^еЬ: /(») П 0 = 0}, Та = II Я. = £\£0,

¡б£о

Ьоа = {»'<=£: г € £.0,г - 1 6 £0}, Ь,0 = {г 6 Ь :» е - 1 6 Ь„ и (-1)},

{гг„, I/ = 17?;} = {г € нЛТ;: и0(г) = 0}, г €

Допустимое управление и(-) назовем регулярным, если для в € € /(г) равенство |иа(4)| = 1 возможно в конечном числе точек I 6 2} , г = 0, т, и т < оо.

Алгоритм решения задачи (25) основан на принципах, предложенных в предыдущих главах. Рассматривается система:

^(г,- - 0) = + 0) + йщ, гбЬ,0; (26)

■ф(т{„ - 0) = 4- 0) + ¿и,-,/, V = » 6

Критерий оптимальности для задачи (25) формулируется следующим образом.

Критерий оптимальности. Пусть ограничения задачи (25) удовлетворяют, условию Слейтера.Тогда для оптимальности регулярного управления и(-) в задаче (25) необходимо и достаточно существования такого вектора Ш = (57,-, г € Ь,о;й,„,1/ = 1,?,-;» € £*), что вдоль соответствующего ему решения ф(-) системы (26) и управления и(-) выполняются следующие соотношения:

■ ф'(г)в(г)и(г)=тахф'(г)в{{}и, геТ;

Щ^М < О, £ 6 Ь,о, ф 'Ы) (~ < 0, •• 6 Хоо, (27)

^'(т.-) >0, ¡61,, У|1/ < 0, »/ = 1^; 1€Ь„

« 0.(1-1)

V- '(0^(«)с?(0 <о, * е з;, »6 £0.

В условиях (27) отражена специфика решаемой задачи (25). Введем обозначения:

Щл = Т^} = {4€Г\{гР, » = 0,ш + 1>и°(« -0)ф и°(г + 0)};

{§,] = 17^} = {< € М- : и%г - 0) = и°(* + 0)}, £ €

Ь* = {» € Ь.о : и°(гР - 0) ф и»(т? + 0), * € /(»)},

Ь$0 = {» е и о : "2(гР - 0) ф «2(тР + 0), * € 1(г)},

X? = {» 6 : ««(т? - 0) ^ и2(тР + 0), 3 € /(» - 1)}, ь* = и и

(т/?,; = 0,р„+1} = и Щ-.;' = 17Ф} и {*$,, = та и {т?,г = 0,т+1};

¡еь.

По = 0, <+г = **> V] < 3 =

р,-, г = 0,т + 1; р;„ - такие индексы из {0,1,... ,рп + 1},что

< = т9, £ = 0,пг + 1; = у = Т^; » €

Пусть К - подмножество из {0,1,... ,рп + 1}, при котором

№ = С е I) = «2(4,- + 0), 3 = 0^7; С е /;

/;• - У ей"; ^ = /и(г°), г€Ьл.

Совокупность моментов

X,, ¿о, Ь,о, ¿оо> ¿»о» -^оо>

х?, К, I,; з е л,» е

чисел и векторов

р,-, »' 6 а(»), »' е ^ = 1^;, »"€ у = 0,р,

назовем структурой оптимального управления задачи (25). Сформируем совокупность

= {и?, г € и о; 17?, г/ = 1>ф; г € X.; 17?, ; = 1,р„>,

которую назовем совокупностью определяющих элементов решени задачи (25).

В уравнения доводки введены ограничения типа равенства ис ходной задачи и условия типа равенства, которые следуют из соот ношений оптимальности (27).

Общая схема алгоритма решения задачи (25) совпадает с прив« денной ранее.

В конце каждой главы рассматриваются примеры, иллюстрь рующие работу предложенных алгоритмов для исследуемых зада*

СПИСОК ОПУБЛИКОВАННЫХ АВТОРОМ РАБОТ

1. Карасева Г.Л. Решение линейной задачи оптимального управления с фазовыми ограничениями в классе импульсных функций // Актуальные проблемы информатики: Тез. докл. конф. -Минск, 1992. - с. 12.

2. Карасева Г.Л. Задача оптимального управления с фазовыми ограничениями и нефиксированным начальным состоянием // Проблемы алгебры и кибернетики: Тез. докл. конф. - Гомель,

1995.- с. 126-127.

3. Карасева Г.Л. Формирование и решение агрегированной задачи " // Белорусский конгресс по теоретической и прикладной кибернетики: Тез. докл. - Минск, 1995.- с. 116.

4. Карасева Г.Л. Задача оптимизации динамической системы с фазовыми ограничениями в классе многомерных управлений // Актуальные проблемы информатики: Тез. докл. конф. — Минск,

1996.- с. 184.

5. Карасева Г.Л. Алгоритм решения задачи оптимального управления с фазовыми ограничениями и со многими входами // VII Белорусская математическая конференция : Тез. докл. - Минск,

1996.-Ч. 2,-с. 163.

3. Karaseva G.L., Kostiaa Е.А., Kostyukova 0.1. Numerical Methods of Optimization of Linear Dynamic Systems with Respect to Nonmooth Performance Indices. - Preprint / Academy of Sciences of Belarus. Institute of Mathematics. - Minsk, 1996.- 29p. 7. Karasyova G.L., KostinaE.A., Kostyukova 0.1. Constructive Algorithms for Solving Special Nonsmooth Problems of Optimal Control // Proceedings of the Seventh International Symposium on Dynamic Games and Applications. - Kanagawa, Japan, 1996.- Vol. 1.- p. 427-443. 3. Карасева Г.Л. Метод решения задачи оптимального управления с фазовыми ограничениями и подвижным начальным состоянием // Вестник БГУ. Серия 1. - 1997, №1.- с. 48-52. Э. Карасева Г.Л. Решение специальной задачи оптимального управления / Ред. журн. "Диффер. уравнения". - Минск, 1997.-с. 25. - Деп. в ВИНИТИ 28.04.97, № 1433-В97. }. Карасева Г.Л. Критерий оптимальности для одной специальной задачи многомерного управления // Вестник БГУ. Серия 1. -

1997, №3. - с. 49-52.

ВЫВОДЫ

По результатам диссертационной работы можно сделать следук щие выводы.

1. Исследован ряд линейных задач оптимального управления фазовыми ограничениями. Для задачи каждого типа сформулирс ваны и доказаны два типа критерия оптимальности и установлен связь между ними.

2. Полученные критерии оптимальности носят конструктивны характер, так как при их формулировке не используются меры. Эт позволило использовать их для построения численных методов р< шения исследуемых задач. Разработаны вычислительные процс дуры, обеспечивающие программную реализацию метода. Сфор мулированные условия невырожденности решения гарантируют кс нечность предложенного метода. При разработке алгоритмов маг симально учитывалась специфика каждой решаемой задачи. Мете ды являются точными, релаксационными и сходящимися. Метод] просты в программной реализации.

3. Единый подход, примененный в диссертации, дает инструмев получения эффективных алгоритмов для новых типов задач с фазе выми ограничениями. Преимущество этого подхода состоит в боле полном учете специфики задачи, постоянном уточнении имеющейс информации о решении, которая строится на итерациях метода.

РЕЗЮМЕ Карасева Галина Леонидовна

Оптимизация линейных систем управления с фазовыми ограничениями

Ключевые слова: условие Слейтера, регулярное управление, критерий оптимальности, структура, определяющие элементы, уравнения доводки.

Для линейных задач оптимального управления с фазовыми ограничениями (задачи с фазовыми ограничениями и терминальным ограничением на конец траектории; задачи с фазовым ограничениями и нефиксированным начальным состоянием; задачи минимизации уклонения траектории линейной системы; задачи с фазовыми ограничениями в классе многомерных управлений) доказаны две формы конструктивного критерия оптимальности (без использования мер). Установлена связь между ними. Исследования проведены в предположении, что ограничения задач удовлетворяют условию Слейтера.

На основании полученных критериев оптимальности предложен конструктивный метод решения перечисленных ранее задач. При разработке алгоритма был применен единый подход, но с максимальным учетом специфики каждой решаемой задачи. Общая схема алгоритма состоит из двух процедур. С помощью цервой процедуры находится приближенное решение исходной задачи, по которому определяется структура оптимального управления и вычисляются приближенные значения определяющих элементов. С помощью второй процедуры найдем точные ( со сколь угодно высокой точностью) значения определяющих элементов путем решения уравнений доводки. В уравнения доводки входят ограничения типа равенства исходной задачи и условия типа равенства, которые следуют из соотношений оптимальности. Решение исходной задачи однозначно восстанавливается по решению уравнений доводки.

РЭЗЮМЕ Карасева Галина Леашда$?на

Аптышзацыя лшейных сзстэм юравання з фазавыш абмежавадпяш

Ключавыя словы: умова Слейтэра, рэгулярнае юраванне, кры тэрый алтымальнасщ, структура, азначаныя элементы, ура^ненв даводю.

Для лЗнейных задач аптымальнага юравання з фазавымд абме жаваннямд (задачы з фазавым! абмежавалняш 1 тэрмшалъным абме жаваннем на канец траекторьп; задачы з фазавымз абмежав алиям } нeфiкcaвaным начатковым станам; задачы мЫм^зацьп адхшеши траекторьп лшейяай састэмы; задачы з фазавыма абмежаваннязи У класе шматмерных юравання^) даказаны дзве формы канструк ты^нага крытэрыяУ аптымальнаспз (без выкарастання мер). Уста но^лена сувязь пам1ж ¡ш. Даследавант праведз^ны У дапуш чэнш што абмежав ант задач здавальняюць умове Слейтэра.

На надставе атрыманых крытэрыя^ аптымальнаспз пр аланов ад ь канструкты^ны метад рашэння пералпчаных раней задач. Пры рас працоуцы алгарытма быУ скарастаны адз]ны падыход, але з мак амальным улшам спещф5ю кожнай вырашаямай задачы. Агульнал схема алгарытма складаецца з дзвух прапэдур. 3 даламогай перша! працэдуры знаходзщца прыбл1знае рашэнне зыходнай задачы, ш якому азначаецца структура аптымальнага юравання 1 вьшчваюццс прыбл]зныя значэнш азначаных элемента^. 3 даламогай друго! працэдуры знайшл5 дакладныя (з патрэбнай дакладнасцю) значэнн азначаных элемента^ шляхам рашэння Ура^ненняУ даводю. Вг $?ра$?ненвз даводю уваходзяць абмежаванш тылу ро^насщ зыходна£ задачы 1 $?мовы тылу ро^насш, тая вышкаюць з суадносш апты-мальнасщ. Рашвнне зыходнай задачы адназначна адна^ляецца ш рашэнню ^ра^нення^ даводю.

SUMMARY

Karaseva Galina Leonidovna

Optimization of Linear Control Systems with State Constraints

Keywords: Slater conditions, regular control, optimality criterion, structure, defining elements, equations of finishing procedure.

For linear optimal control problems with state constraints ( problems with state constraints and terminal constraints at the end of the trajectory; problems with state constraints and an unfixed initial system state; problems of minimizing maximal state deviation; problems with state constraints in the class of multidimensional control ) two forms of constructive optimality criterion ( without using measure) are proved. The relation between these forms is established. All investigations are performed under assamption that Slater conditions are fulfilled.

On the background of received optimality criterions, constructive methods for solving mentioned above problems are suggested. For algorithm construction we use uniform approach but maximaly take into account specific features of each problem. The general scheme of the algorithm consists of two procedures. By means of the first procedure one finds solution approximation to original problem. Using this approximation one determines structure of optimal control and calculates approximate values of defining elements. The aim of the second procedure is to construct the exact values of defining elements by solving the special system of nonlinear equations. This system consists of equality constraints of the original problem and equality coditions following from optimality relations. The solution of the original problem is restored using the solution of the equations of the finishing procedure.