Оптимальное позиционное управление линейными и квазилинейными системамина основе параметризованных программ тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Соболев, Олег Николаевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Екатеринбург МЕСТО ЗАЩИТЫ
1995 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Автореферат по математике на тему «Оптимальное позиционное управление линейными и квазилинейными системамина основе параметризованных программ»
 
Автореферат диссертации на тему "Оптимальное позиционное управление линейными и квазилинейными системамина основе параметризованных программ"

' ГОСУДАРСТВЕННЫЙ КОМИТЕТ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ВЫСШЕМУ ОБРАЗОВАНИЮ УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. А.М.ГОРЬКОГО

' ' ^ Ьм На правах рукописи

• ; ; ; УДК 517.977

Соболев Олег Николаевич

ОПТИМАЛЬНОЕ ПОЗИЦИОННОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ И КВАЗИЛИНЕЙНЫМИ СИСТЕМАМИ НА ОСНОВЕ ПАРАМЕТРИЗОВАННЫХ ПРОГРАММ

Специальность 01.01.02 — дифференциальные уравнения

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Екатеринбург — 1995

Работа выполнена и Уральском государственном университете имени А.М.Горького на кафедре прикладной математики.

Научный руководитель - доктор физико-математических наук,

профессор Э.Г.Альбрехт.

Официальные оппоненты - доктор физико-математических наук,

профессор А.Н.Красовский, кандидат физико-математических наук, доцент А.Ф.Шориков.

Ведущая организация Институт математики и механики

УрО РАН.

Защита состоится ' № в /£_ часов на заседании дис-

сертационного совета К 0G3.78.03 по присуждению учепой степени кандидата физико-математических наук при Уральском государственном университете им. А.М.Горького (020083, г. Екатеринбург, К-83, пр. Ленина, 51, к. 248).

С диссертацией можно ознакомиться в библиотеке Уральского государственного угашерситета.

Автореферат разослан '

Ученый секретарь диссертационного совета кандидат физико-математических наук, Доцент /3//С1

В.Г.Пименов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Теория оптимального управления разработана в 1956-1960 годах в работах Л.С.Понтрягина и его сотрудников п форме принципа максимума. Общие методы современной теории управления позволяют получить решение задач в замкнутой форме только в достаточно простых ситуациях, главным образом, когда динамика процесса описывается линейными уравнениями. Основная трудность состоит в решении краевой задачи принципа максимума, которая, как правило, оказывается нелинейной и не имеет общего аффективного метода решения.

Во многих практических задачах динамику управлямого процесса можно описать системой обыкновенных дифференциальных ураи-

I

вений, нелинейные члены о которых зависят от некоторых параметров и ма;1ы при малых значениях этих параметров. Игнорирование нелинейных членов с целью упрощения предварительного анализа таких процессов и упрощения и удешевления систем управления может привести в некоторых случаях к неприемлемому качеству управляемого процесса. Теория приближенных методов рршения линейных и квазилинейных задач оптимального управления развита в работах Л .Д. Акуленко, Э.Г.Альбрехта, Р.Беллмана, В.Г.Болтянского, Р.Габасова, Р.В.Гамкрелидзе, В.Ф.Демьянова, Р.Калмана, Ф.М.Кирилловой, Н.Н.Красовского, А.Б.Куржанского, Э.Б.Ли, Л.Маркуса, Ю.С.Осипопа, В.А.Троицкого, Ф.Л.Черноуеько и многих других авторов.

Многие задачи управления идеализируются как линейно-квадратичная задача оптимального управления, т.е. как задача с линейной динамикой и показателем качества, содержащим интегральное квадратичное по управляющим воздействиям и по фазовым переменным слагаемое и терминальное слагаемое в виде квадратичной формы от

фазовых переменных в конечный момент времени. Это связано с тем, что такая задача имеет простое решение в замкнутой форме, а показатель качества — достаточно определенный содержательный смысл.

В диссертации за основу решения некоторых задач оптимального управления квазилинейными системами также берется линейно-квадратичная задача с произвольным параметром в показателе качества и исследуется ее связь с другими задачами. Второй вариант данного подхода связан с задачей оптимального управления, отличающейся от линейно-квадратичной задачи тем, что в показателе качества терминальное слагаемое представлено нормой вектора конечного состояния системы. В решение всех этих задач составной частью входит решение одной и той же краевой задачи принципа максимума.

В настоящее время возрастает актуальность разработки не только численных, но и аналитических методов в связи с быстрым развитием вычислительной техники и программного обеспечения, в частности, систем аналитических вычислений (САВ), или систем компьютерной алгебры. Представляется разумным развивать методы, сочетающие в себе аналитические и численные вычис ления. Особенно важно увеличить долю аналитических вычислений при конструировании систем управления по принципу обратной связи в режиме реального времени, с тем чтобы в процессе управления формировать управляющие воздействия на основе готовых формул, в которых лишь некоторые коэффициенты надлежит вычислить по информации о текущем состоянии системы с помощью несложных, быстрых численных методов.

Обоснование синтеза управления в непрерывной схеме при условии его устойчивости дает возможность его аппаратной реализации, ориентированной на аналоговые системы управления, или использования этого же закона управления в дискретной схеме с достаточно мелким разбиением, ориентированной на цифровые системы упрапле-

ния. Диссертация следует этому направлению. В ней обосновывается конструктивный способ синтеза оптимального позиционного управления в непрерывной схеме для квазилинейных систем.

Большая часть задач управления в условиях конфликта и неполных данных о динамических или информационных помехах, воздействующих на управляемый объект, формализуется в рамках теории дифференциальных игр, получившей в нашей стране становление и развитие в исследованиях научных школ Л.С.Понтрягина и Н.Н.Красовского. Замкнутый вид здесь также имеют решения дифферепциальнцх игр, в основном, с линейной динамикой и с показателем качества либо квадратичным, либо отличающимся от квадратичного видом терминального слагаемого, когда терминальное слагаемое равно норме вектора конечного цостояния, и их обобщения. В частности, для линейных задач эффективны методы стохастического программного синтеза вычисления цены игры и экстремального сдвига для построения седло-вой точки, разработанные Н.Н.Красовским и его учениками1'2'. Диф-

I

ференциальная игра рассматривается в классе аппроксимациоггаых стратегий, зависящих от некоторого параметра точности, введенного через условие экстремального сдвига. В диссертации предлагается способ введения параметра точности через параметризацию показателя качества.

Цель работы. Разработка и теоретическое обоснование конструктивного, удобного дли реализации в компьютерных CAB приближенного метода решения некоторых задач оптимального управления линейными и квазилинейными системами по прицципу обратной связи в рамках единого подхода, основанного на вычислении оптимальных

'•Красонский А.Н., Красовсний H.H., Третьяков D.E.. Стохастический программный синтез для детерминированной позиционной дифференциальной игры // Прикл. математик! и механика. - 1981. - Т.45, вып.4. - С.579-586.

!>Kpac<iBt ¡jiii H.H. Управление динамической системой. - М.: Наука, 1085. -

520 с.

программных управлений для некоторого параметрического семейства задач оптимального управления и па регулярном выборе значений параметров, выделяющих решения исходных задач из этого семейства.

Методика исследования. Диссертация выполнена в рамках исследований по теории оптимальных управляемых процессов, дифференциальных игр и метода малого параметра, ведущихся в г. Екатеринбурге. Используются традиционные постановки задач и устоявшиеся понятия и методы: принцип макимума Л.С.Понтрягина, метод динамического программирования Р.Веллмана, вспомогательные программные конструкции3', результаты, полученные методом стохастического программного синтеза*', и итерационные процедуры решения квазилинейных задач оптимального управления, аналогичные разработанным Э.Г.Альбрехтом" на основе метода последовательных приближений Ляпунова-Пуанкаре.

Научная новизна. Изучена связь между некоторыми задачами оптимального управления без ограничений и с ограничениями, указаны достаточные условия, при которых итерационный метод решения задач управления квазилинейными системами даст решение этих задач для всех позиций из заданного множества, обоснован синтез оптимального управления по принципу обратной связи и изучена его устойчивость по отношению к помехам в каналах обратной связи; получена гладкая аппроксимация функции цены для одной'дифференциальной игры с негладким показателем качества,-и на ее основе построена оптимальная аппроксимационная стратегия первого игрока.

3)KpacoBCKitii H.H.. СубГштин А.И. Позиционные дифференциальные игры. - М. : Наука, 1974. - 450 с.

''Альбрехт Э.Г. Of> оптимальном управлении движением квазилинейных систем // Диффергнц. уравнения. - 1901». T.V. N3. - С.430 442.

С

Теоретическая и практическая ценность. Результаты диссертации имеют теоретическое и практическое значение, носят конструктивный характер, применимы к достаточно широкому кругу задач и могут быть положены в основу исследования квазилинейных управляемых объектов с использованием компьютерных систем численных и аналитических вычислений. Единство подхода к решению различных задач упрощает процесс создания соответствующего программного обеспечения. Некоторые результаты можно интерпретировать в терминах теории уравнений Гамильтона- Якоби5'.

Апробация работы. Основные результаты работы докладывались па следующих научных конференциях:

- VII Всесоюзной конференции "Управление в механических системах" (Свердловск, 1090);

- III Всесоюзной школе "Понтрягинские чтения" (Кемерово, 1990);

- Международной математической конференции "Ллпуновские чтения" (Харьков, 1992);

- Конференции математиков Беларуси (Гродно, 1992);

- II Международном семинаре "Негладкие и разрывные задачи управления и оптимизации" (Челябинск, 1993);

- Математической школе. "Понтрягинские чтения" (Воронеж, 1994);

- III Международном съезде по прикладной математике 1С1АМ'95 (Гамбург, 1995).

Результаты работы обсуждались на научных семинарах отдела математического моделирования и оптимального управления НИИ ФПМ при УрГУ, отдела динамических систем ИММ УрО РАН, кафедры математического анализа РГПУ им. А.И.Герцена.

Публикации. По теме диссертации опубликовано 4 статьи и 8 тезисов докладов на всесоюзных и международных конференциях. Из

''Субботин А.И. Минимаксны« неравенства и уравнения Гамильтона-Якоби. М. : Наука, 19D1. 210 с.

совместных с Э.Г.Альбрехтом работ в диссертацию включены результаты, полученные автором.

Структура и объем работы. Диссертация состоит из введения и трех глав. Список литературы включает 50 наименований. Объем работы составляет 118 страниц машинописного текста.

СОДЕРЖАНИЕ РАБОТЫ

В первой главе на примере нескольких типичных задач демонстрируется и обосновывается единый подход к решению различных задач оптимального управления, заключающийся в построении некоторой задачи оптимального управления с параметрами, решение которой обладает регулярными свойствами и при определенным образом выбранных значениях пират-трап диет решения некоторых других задач.

В первых двух параграфах обсуждаются предпосылки такого подхода и формулируются задачи, на примере которых этот подход демонстрируется в диссертации.

Управляемый объект описывается системой

.i = A(t)s+ B[i)u +\f(t,.r), ()<<< 0, (1)

где х 6 Л", ч € 11"', Л > 0 -— малый параметр, i) — фиксированный конечный момент нремеин.

Рассматриваются задачи о нахождении для каждой начальной позиции {<o,34i} из заданпоги множества Гц оптимального программного управления u°(t,\) — и1'(/,Л; t„,.r„), т.е. управления, доставляющего минимум на множестве U(t[i) допустимых управлений некоторому заданному показателю качества -,[/0< тц, «(•), А]. При этом на управляемый процесс может быть наложено дополнительное ограничение. Для множества Го следует указать достаточные условия, при которых функция 1 iu(f, А; io. i'o) будет задавать оптимальное управление для

всех Л е [0,Аи], где Л" •-- достаточно малое, но одно и то же для всего множества Го начальных позиций {¿п,хо}, положительное число.

Далее ставится задача синтеза универсального закона управления по принципу обратной связи, реализующего вычисленные оптимальные программные траектории в непрерывной схеме управления для всех начальных позиций из заданного множества Го и для всех Л € [О, А0]. Поскольку для построения оптимального закона управления и°[<,.т, А] будут использоваться оптимальные программные управления, важно установить их существование и свойства во всех позициях, которые могут встретиться в ходе управления. С учетом возможных возмущений это означает, что необходимо обосновать свойства оптимальных программных управлений хотя бы в некоторой окрестности каждой оптимальной программной траектории, начинающейся в Гц.

Предполагаются выполненными следующие условия.

Условир 2.1. Матрицы B(t) и непрерывны, вектор-

функция f(t.x) непрерывна вместе со своими первыми dfi(t,x)/dxj и вторыми d2fl(t,x)/Dxjd.r.k (i,j,k = l,...,»i) производными на компакте G С Л"+|, содержащем внутри компакт <7'0', в котором лежат все движения системы первого приближения.

Условие 2.2. В окрестности точки i) матрицы и B(t) имеют непрерывные производные по t вплоть до (п — 1)-го порядка, и в самой точке t = ■О ранг матрицы K(t) = (£|(f),..., L„(<)} равен н, где (к — 2,...,«) Li(t) = B(t), LiU) = - ^bjt-i(f). Кроме того, вектор-1

функция /(/. г) также имеет в окрестности каждой точки {J,х} g G непрерывные частные производные по i и по a-,- (i = 1,2,..., п) (в Т.ч. смешанные) вплоть до л-го порядка.

В следующих двух параграфах устанавливаются используемые в дальнейшем свойства квазилинейной системы (1) и системы в варИ-

ациях, ей соответствующей. Здесь внимание уделяется выполнению этих свойств равномерно по всем допустимым начальным позициям и управлениям. .Доказывается равномерная сходимость итерационной процедуры к решению краевой задачи принципа максимума, соответствующей задаче на минимум функционала i)

у = J [«'(<)Ф(0"(0 + A + l'x(V) (2)

lo

вдоль движений системы (1), где Ф(<) и P(f) — симметричные матрицы, P(t) — непрерывная и неотрицательно определенная, |/|< R.

Указываются равномерные по всем начальным позициям достаточные условия существования и единственности решения задачи 2.6, названной вспомогательной задачей, на минимум функционала (2) при P(t) = 0, решение которой входит составной частью в процедуру решения всех рассматриваемых в первой главе задач, и аналогичные условия для квазилинейно-квадратичной задачи с параметром а > О (задачи 2.4), т.е. задачи на минимум функционала (где — заданный вектор)

7 = J u'(t)'Hl)u(t)dt + - xtf.

Условие 5.1. Будем предполагать, что для константы К справедливо неравенство с.П < Л/, где с — константа. Определяемая по параметрам системы (1) и показателя (2), а константа М ограничивает по норме допустимые управления.

Условие 6.1. Будем рассматривать только начальные позиции ■{ío,a-o} такие, которые принадлежат некоторому компактному множеству Го С mi G(0', для точек {fo, t'u} которого выполняется неравенство iF-'ífoM'o^-o)! < (Л -£о)/2. и у которых 10 £ [О./11], где <° < 0, F(/0) -положительно определенная матрица, t"o>0.

Теорема 6.1. Пусть выполнены, условия 2.1, 2.2, 5:1 и 6.1. Тогда найдется такое число Л° > 0, что для каждого {îq, зц} 6 Гц, для всех а > 0 и для ассх А € [О, X0]-существует единственное решение ii0(i,a, А;/о, го) задачи 2.J,. Кроме того, каждая траектория x°(t,ft, Л; <о,з'о), X Ç [О, А0], Г» > 0, сиптпел»ы (1), соответствующая управлению u°(t, Л, Л; (о, такова, что лючки {t, .т°(/, й, A; to, а'о)} , 'о < < < д, лежат в некотором открытом множестве G С G, для начальных позиций {т, £} из которого для всех а, достаточно близких к а, и X, достаточно близких к А, также определены, оптимальные в смысле задачи 2-4 управления i/)(t,o,A;r,£), непрерывные not и непрерывно дифференцируемые но «, Л, т,

Далее устанавливается связь решения квазилинейно-квадратичной задачи с решениями задачи 2.1 — задачи у переподе системы в точку х\ при условии минимума энергии ./ = jf и'(t)<$(t)u(t) dt, задачи 2.2 — задачи с ограниченной энергией, т.е. задачи на минимум величины <7г = '|:r(i?,A) — zi|, при условии .7 < /¡о, и задачи 2.3 — задачи о переводе системы в заданную окрестность гг2 < и, при условии минимума энергии ./.

Теорема 7.1. В условиях теоремы 6..1 при стремлении положительного параметра о к нулю управлен ие u°(i,a, А; to,xo)> являющееся решением задачи 2.4, равномерно по {<0,^0} € Гц, t Ç [<о, и X 6 [О, А0] сходится к управлению »°(<,А; ¿о^о) = n°(i, ^о» О, А), А; tо,з'д), являющемуся решением задачи 2.1. Кроме того, каждая траектория .г°(f,A: /о,.то),'A S [" А"], системы (1), соответствующая управлению н°(/. Â; fo, го), такова, что тонки {t, x°(t,X', xq}, i Е [ioi^)i лежат в некотором открытом множестве G С G, для начальных позиций {т,£} из которого дли всех достаточно близких к А значений А оптимальные управления ull(t, А; т, £) также определены, непрерывны, но 1 и непрерывна дифферен цируемы но А, т и Ç.

Условие 7.1. Множество начальных позиций Го не содержит точек,

для которых выполняется равенство c(to, xq}'F~l{to)c(to, xq) — ¡¡q.. ■

Условие 7.2. Множество начальных позиций Го не содержит точек, для которых выполняется равенство c(îq, xo)'c(to, хо) = vl.

Теорема 7.2. Пусть выполнены условия 2.1, 2.2, 5.1, 6.1 и 7.1. Тогда существует такое положительное ■число А0, что для каждого {¿о,го} 6 Го, для всех А 6 [О, А0], существует единственное решение ua(t, А; цо\ to,xo) задачи 2.2. Кроме того, каждая траектория x°(t,\\ io,zo), ^ S [0,А°1, системы (1), соответствующая управлению u°(t,\\ Но", h, хо), такова, что точки {t, x°(t,À; fi0; tü,xü), p(t,\\ /i0; io.^o)}. <o < t < где /i(f, Â; /i0; i0, x'u) = /'o - <o,zo)$(Ç)u°(C>Â;

лежат в некотором открытом множестве G* С G х [0,+оо), для {г)£>/'} 113 которого для всех Л, достаточно близких к А, также определены решения задачи 2.2. Управление u°(t, A; /z; г, £), если lim J(a, А,

а—*+0

г>0 < Р) совпадает с решением задачи 2.1, а если lini J(a, А, г,£) > /л

а—Н-0

— получается из решения задачи 2-4 подстановкой в него вместо а ■корня уравнения J(a, A, r,Ç) = р.

Аналогичная теорема справедлива для задачи 2.3 (теорема 7.3) при замене условия 7.1 на 7.2. Доказательство этих теорем опирается на свойства монотонной зависимости от « значений J(a, А, г, £) и сг2(а, А., г,£) функционалов ,7 и ст2, вычисленных вдоль оптимального для задачи 2.4 процесса.

В следующих двух параграфах решается задача 2.5 — задача на минимум показателя качества 7 — J + -a-j, и также устанавливается ее связь с задачами 2.1-2.3.

Последние два параграфа первой главы содержат анализ зависимости решений рассмотренных задач от начальных данных и параметра А, а также два примера приближенного решения этих задач с использованием описанного подхода.

Вторая глава содержит обоснование синтеза оптимального закопа управления по принципу обратной связи для задач, рассмотренных в первой главе. Линейно-квадратичную задачу без ограничений для синтеза оптимальпого управления по принципу обратной связи для линейно-квадратичной задачи с терминальным ограничением независимо использовал З.Эмиргайлов6', опираясь па метод динамического программирования. В диссертации оптимальный синтез осуществляется на основе программных управлений, построенных в первой главе: и,°[<, х,ц, Л] = Л; /(; t, .г), и не только для линейных, но и для квазилинейных систем. Кроме того, учитывается, что значение вспомогательного параметра а не должно рассматриваться при управлении по принципу обратной связи постоянным, выбранным в начальный момент времени, а также должно вычисляться в процессе управления на основе информации о текущем состоянии системы.

Теорема 12.1. Пусть ныполнены условия 2.1, 2.2, 5.1, 6.1, 7.1 и 7.2. Тогда существует такое число Л° > 0, что для того ■чтобы, найти универсальный закон упрпплс.нии по принципу обратной связи u°[t,x,fJ, Л], ' реализующий оптимальны it н смысле одно¡1 из рассматриваемых задач (2.1-2.6) процесс для Л £ [(). Л"], для любой начальной позиции хо} £ Го, достаточно найти для каждой начальной позиции {г,£} £ и всех |/| < П решение u[,{t. I. Л: т. () задачи 2.6 и положить для всех t, x,fi, реализующихся о ходе упранле.ния. х, /(. Л] = u°(t,f"(t.x, A;/j), A;f,:r).

Вектор /°(f,.i,A;/i) конструктивно вычисляется для каждой из рассматриваемых задач. •

Непосредственное применение метода динамического программирования для синтеза оптимальпого управления в случае задачи 2.1 затруднено d « вязи с особенностью краевого условия для функции оптимального результата: Л) = Ä(:r|{:i'i}), где ¿>(a:|D) — индикатор-

"'Emirsajluw Z. Freilback Control in LQCP with a Terminal Inequality Constraint//JOTA.■ 1989.-Vo!.G2,No.3.-P.387-403.

ная функция множества I), значение которой равно нулю при хЕИ и бесконечности при х£В. Теория уравнений Гамильтона-Якоби5) разработана, в основном, для ограниченных краевых функций. Однако доказывается, что функция А) удовлетворяет обычныму урав-

нению Беллмана (Гамильтона-Якоби), а используемые программные конструкции позволяют эффективно синтезировать оптимальное позиционное управление (теорема 12.1). Функция оптимального результата для квазилинейно-квадратичной задачи является нижним решением, аппроксимирующим К(«,х,А).

Далее описывается итерационная процедура, реализующая приближенный оптимальный синтез с наперед заданной точностью: после к итераций погрешность оказывается величиной более высокого порядка малости, чем А*. Доказывается полезное при приближенном решении задачи с ограниченной энергией утверждение о точности решения этой задачи, приводится пример приближенного синтеза, оптимального в смысле задачи о переводе системы в точку и задачи с ограниченной анергией.

В следующем параграфе исследуется устойчивость оптимального закона управления по отношению к допустимым помехам в каналах обратной связи и вычислительным погрешностям, т.е. таким помехам и погрешностям, которые не выводят синтезированную систему из области, в которой определен оптимальный закон управления.

Теорема 14.1. Оптимальный закон управления ц,\] устой-

. чив по отношению к допустимым информационным помехам и вычислительным погрешностям.

Пример 14.1 обнаруживает своего рода нерегулярность поведения системы, синтезированной приближенным оптимальным для задачи о переводе в точку законрм, при наличии сколь угодно малых регулярных возмущений (при сколь угодно малых значениях А > 0): да-

же при отсутствии иных помех реализация управления оказывается неограниченной. В этом же примере показывается, что аппроксимация задачи о переводе системы в точку квазилинейно-квадратичной задачей с достаточно малым параметром а, согласованным с выбранной точпостью решения задачи, позволяет регуляризовать ситуацию: реализация управления оказывается ограниченной и равпомерно сходящейся к приближенному оптимальному программному управлению при«—»40.

, Указывается одно достаточное условие (условие 14.1) допустимости информационных помех в задаче о переводе системы в точку.

Третья глава посвящена распространению развитого в первых главах подхода на некоторые более общие ситуации. В первом параграфе главы рассматриваются изменения в итерационной процедуре реше-пия рассмотренных выше задач в случае, когда энергия оценивается функциопалом (2), приводится пример.

Далее рассматриваются возможности увеличения количества наложенных на управляемый процесс ограничений до двух и разнообразия терминальных ограничений путем введения двух параметров

(гг > 0 и./? > 0) и произвольной нормы р в показатель качества: |> "

У = + Ц I ,-'(/)Р(ф-(«) ,и + -(р(х(д, Л)) - I,). J <*

Решение различных возникающих при этом задач иллюстрируется примерами.

Последний параграф третьей главы посвящеи решению линейной дифференциальной игры для системы

■г = Л^)х + В^)и + С{1)1>,

с показателем качества для заданной игральной позиции {¿«,х,}

О о

7о[*.,*.,«(•),«(•)) = J и\тЩт)и[т)ат-jj(T)9{T)v(T)dT + oa(x(â)),

где A(t), B(t), C(t) ■— непрерывные матрицы функции, Ф(<), Ф(t) — симметричные непрерывные положительно определенные м&трицы-. функции при 0 < i <t3, оа(х) — функция В.А.Стеклова:

[ |х| , |х|>2а,

<г0(х) -

Ы!

+ а , |г| < 2а, а > 0.

. Показывается, чти при а, большем вычисляемого по параметрам системы и показателя качества числа A*(i») > 0, данная игра имеет непрерывно дифференцируемую функцию цены pa{t, х), которая вычисляется регулярным образом, и седлокую точку ua(t,x), va(t,x), непрерывную по t и х.

Благодаря известному выражению для цены несколько другой дифференциальной игры с: показателем качества

7[i»,®.,u(0. «(•)) = J ч\тЩт)и(т)(1т-J 1>'(г)Ф(т)и(т) dr + |x(i9)|, i. t.

полученному методом стохастического прог!>аммного синтеза2', устанавливается связь между двумя этими играми: при 0 < а < А*(<,) в начальной позиции цена pu(tt,xt) 'игры с показателем качества уа совпадает с ценой p°(tt,xt) игры с показателем качества у.

Теорема 17.1. Функция pP(t,x) цены дифференциальной игры с показателем качества у есть равномерный по всем t 6 [0,1?] и х £ R" предел при £ —> +0 непрерывно дифференцируемой по tux при всех t € [0,1?], х б R" tf>0, за исключением не более чем счетного числа гиперплоскостей t = i,-, функции

\p(t,x,e) = pn{tie){t,x), «(/,е) = А*(0 + е, £>0, 16

и ■равномерно по всем I и с выполняются неравенства

Лм) </>('. р°{1,Х)>р{г,Х,£)-£.

Кроме того, стратегия и^,х,е) — — |Фестъ универсальная и равномерная аппроксимационная оптимальная стратегия для дифференциальной игры с показателем качества у.

Функция р(1, х,е) является, таким образом, верхним решением задачи Коши для уравнения Гнмильтона-Якоби, соответствующего игре с показателем качества у, и аппроксимирует функцию />°(<,х).

В диссертации получены следующие основные результаты:

1. Установлена евпзь двух задач -оптимального управления квазилинейными системами без ограничений, содержащими параметр в показателе качества, с задачами с ограничениями на энергию или конечное состояние, на основании которой указаны достаточные условия оптимальности и предложен конструктивный итерационный, способ решения этих задач, удобный для реализации на ЭВМ. Показано, что такой подход применим к задачам более общего вида.

2. Обоснован синтез оптимального позициопного управления, опирающийся на программные управления, построенные в первой главе. Для задачи перевода квазилинейной системы с минимальной энергией в заданную точку получены необходимые и достаточные условия оптимальности в форме уравнения Беллмана (Гамильтоиа-Якоби) с краевым условием, представимым в виде индикаторной функции целевого множества. ■ .

3. Изучена одна дифференциальная игра с гладким показателем качества, зависящим от параметра. На ее основе получена гладкая аппроксимация функции цены другой дифференциальнойьигры я.по^ строена оптимальная аппроксимационная стратегия первого игрока.

н

>

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Al'brekLt E.G., Sobolev O.N. Semi-symbolic computation of Pareto-optimal controls // Между нар. сб. научных трудов "Многокритериальные динамические задачи при неопределенности". - Орехово-Зуево, 1991. -С.71-74.

2. Альбрехт Э.Г., Соболев О.Н. О связи задач оптимального управления с подвижными и закрепленными концами // Проблемы управления с гарантированным результатом. - Екатеринбург: УрО РАН, 1992. - С.3-14.

3. Альбрехт Э.Г., Соболев О.Н. Об итерационной процедуре решения некоторых задач оптимального управления // Межвуз. сб. научиых трудов "Дифференц. уравнения с частными производными". - С.-Пб.: Образование, 1992. С.3-10.

4. Соболев О.Н. О решении некоторых задач оптимального управления квазилинейными системами // Изв. РАН. Техническая кибернетика. - 1994, N4. - С.218-225.

5. Al'breklit E.G., Sobolev O.N. On an approximate synthesis of optimal feedback controllers in iiuasi-liuear systems //III International Congress on Industrial and Applied Mathematics: Book of Abstracts - Hamburg, 1995 P.218.

Подписано в печ. iS- Формат 60x84 1 /IG.

Бумага ii^ytaОбъем 1,0. Тир. 100. Зак. N 3 73

Екатеринбург, К-83, пр, Ленина, 51. Типолаборатория УрГУ