Методы квадратичной фазовой аппроксимации для решения задач оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Захарченко, Варвара Сергеевна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Иркутск МЕСТО ЗАЩИТЫ
1994 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Методы квадратичной фазовой аппроксимации для решения задач оптимального управления»
 
Автореферат диссертации на тему "Методы квадратичной фазовой аппроксимации для решения задач оптимального управления"

р г од

. ^ .ГОСУДАРСТВЕННЫЙ КОМИТЕТ РОССИЙСКОЙ ФВДЕРАЦШ ^ ' (М\1 К"Ш ПО ВЫСШЕМУ ОБРАЗОВАНИЮ

Иркутский государственный университет

На правах рукописи

Захарченко Варвара Сергэовна

МЕТОДЫ КВАДРАТИЧНОЙ ФАЗОВОЙ АППРОКСИМАЦИИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

01.01.09 - математическая кибернетика

Автореферат

диссертации на соискание учбной степени кандидата физико-математических нчуй

Иркутск - 1994

Работа выполнена на кафедре вычислительной математики 1 Иркутского государственного университета

Научный руководитель - до:стор физико-математических наук,

профессор В.А.Срочко.

Официальные оппоненты - доктор физико-математических наук,

дсцант А.И.Москаленко, - кандидат физико-математических наук, доцент Н.В.Тарасенко.

Ыцу^н оргож!-.-лт,у,д - Санкт-Петербургский государственный университет

Защита соог<,,пся " ^ " Ш>М]иО 1994 г. в /У часов на заседании Сош' а Д063.32.04 по защите диссертаций на соискание ученой степени доктора наук в Иркутском государственном! университете ( 661003, бул.Гагарина,20,1-й корпус ИГУ' ),

С диссертацией мохяо ознакомиться в научной, библиотеке Иркутского государственного университета ( бул.Гагарина, 2А\ ).'

Автореферат разослан " " октября 1994 года ь

Ученый секретарь специализированного совета»* к.ф.-м.н., доцент ' гУ/1.^" Н.Б.Бельтюков

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Разработка специализированных' методов оптимизации, использующих своеобразна задач управления динами-чесютли системами, имеет важное значение как для теории оптимального управления, так и для а5 многочисленных приложений. Актуальность этого направления исследований определяется также осознанной необходимостью повышения уровнг фундаментальности вычислительных методов оптимального управления,

ГЩ>?ктивность методов решения общих задач оптимального управления обуславливается, в первую очередь, качеством применяемых аппроксимация управляемой системы и целевого функционала. ' Методы линеаризации (петоый порядок аппроксимации) являются в настоящее время наиболее разработанным и популярным средством • численного решения задач оптимального управления. Дальнейшее развитие и повышение эффективности вычислительных методов связано с переходом на уровень аппроксимации второго порядка. В рамках задач оптимального управления здесь открывается обширный спектр возможных направлений исследования (слабая квадратичная аппроксимация, игольчатая аппроксимация второго порядка, фазовая квадратичная аппроксимация):

Определенный набор методов второго порядка (в том или ином' смысле) рредложен в работах Федоренко Г.П., Гурмана В.И. и Батурина В.А., . Васильева О.В., Тятюшкина А.И. и Больтюкова Н.Б, Срочко В.А. и др. В диссертации продолжены исследования по аде- . тодам фазовой квадратичной аппроксимации для задач оптимального управления со свободным правым концом.

На этом пути специального рассмотрения требуют квадратичные задачи оптимального управления, имеющие достаточно актуальное значение для приложений (задачи минимизации среднеквадратичных невязок, задача быстродействия). Повышение эффективности численного решения этого класса задач связано, на наш взгляд, с разработкой методов нелокального улучшения, в структуре которых отсутствует процедура параметрической оптимизации. Методы подобного сорта также нашли отражение в диссертации.

Диссертационная работа.выполнена в рамках научного проекта "Методы линейно-квадратичных аппроксимаций для решения задач

Э

оптимального управления", получившего грант Госкомитета[РФ по высшему образованию (г.Санкт-Петербург) на 1992-93, 1994-95 г.г.

Целью работы является построение и анализ вычислительных методов оптимального управления на основе фазовых квадратичных аппроксимаций целевого функционала.

Метод исследования основан на анализе формул приращения целевого функционала с использованием аппарата теории оптимального управления в обыкновенных динамических системах.

Научная новизна полученных результатов состоит в следующем:

1) Предложен метод приращений для решения квадратичных задач оптимального управления. Метод достаточно прост в реализации и обеспечивает нелокальное улучшение по функционалу без использования параметрического поиска на базе всей информации из приращения функционала, без выделения главных и остаточных членов. Поиск особых участков оптимального управления возможен с помощью скользящих режимов соответствующих разрывных систем.

2) Проведены новые разработки по методам фазовой квадратичной аппроксимации в основной задаче оптимального управления. Предложенные методы получены на основе естественной квадратичной аппроксимации целевого функционала без ориентации на необходимо условия оптимальности. В результате используются все члены, линейные и квадратичные по фазовому приращению, что позышает информационный уровень соответствующих методов. Методы не вырождаются на особых управлениях, что открывает возможность их улучшения.

Практическая значимость. Разработанные метода доведены.дс программной реализации и апробированы в процессе вычислительного эксперимента^ ка ряде задач прикладного содержания. Результаты эксперимента дают основание судить об эффективности предлагаемых алгоритмов.

Некоторые результаты диссертации используются в учебно! ■процессе кафедры вычислительной математики ИГУ.

Апробация работы. Основные результаты, включЭнные в дао' сертационную работу, докладывались на 9-ой Мевдународаой школе семинаре по •'методам оптимизации и их приложениям (Иркутек, 1989) Втором Международном семинаре "Негладкие и разрывные задачи

оптимизации и управления"(Челябинск, 1993), Воронежской математической школе "Понтрягинские чтешм-У" (1934), семинарах кафедры вычислительной математики ИГУ,, объединением семинаре по проблемам оптимизации при кафедре высшей математики ИГЭЛ.

Публикации. По теме диссертации опубликовано 5 работ , в которых отражено е9 основное содержание.

Структура и объбм диссертации. Диссертация состоит из введения, трбх глав и списка литературы. Общий объбм составляет 1.1 Г страниц... Список литературы содержит 103 наименования.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность тэмн, .проводится обзор методов решения задач оптимального управления со свободным правым концом, дается краткое изложение содержания работы.

В первой главе исследуется задача оптимизации линейной по фазовому состоянию системы в классе ограниченных управлений по квадратичному критерию качества. Даются конструктивные представления для приращения квадратичного функционала, построены и проанализированы процедуры улучшения допустимых управлений, разработан специализированный метод решения поставленной задачи.

Рассматривается проблема минимизации квадратичного функци-'

онала

Ф(и) = <с,ха))> + 1 <х(г{),Вха1)> + (I)

+ | / (ь0ги,г; + <а(и,1),х(г)> + | <ха),я(и,г)х(г)>^б.г,'

т . .

определенного на траекториях линейной по состоянию динамической

системы

х = А(и,г)х т Ь(и,1), х(г0) = х° (2)

в классе допустимых управлений

V = { и с 1Г(Т) : и(г) « и, ; € Т >. (3)

СО

Здесь переменная г « Т имеет смысл времени, ха ) = г),..., хпИ)) - вектор-функция фазовых переменных (состояние), иЦ) = (и1 а),..., иг(г)) - вектор-функция управляющих воздействий (управление)..

Внесем необходимые предположения. Пусть матричные функции

А(и^) и (¿(и,г), вектор-функции аСиДЛ Ъ(и^) и функция Ъ0(и,1) непрерывны по совокупности своих аргументов на прямом произведении и « Г, множество и допустимых значений управления и(1) компактно в Кг. Предположим далее, что в выражении (I) О, Я - симметричные матрицы, начальное'состояние х° и отрезок времени Т заданы.

Пусть иа),ь(г) - допустимые управления в задаче (1)-(3), х(1,и) и х(1,V) соответствующие им фазовые траектории < приращением Ь>х(г) = ха.и) - х(г,и). • ;

Обозначим

ц>(х) = <о,х> | <.х,дх>, /°(х,и= Ъо(иЛ) + <а(иА),х> + | <х, (}(и,г)х>, /(х.иЛ) = А(и,г)х + ь(и,г). Тогда для Ьха) справедливы уравнения

д£ = А(иа),гт + о. (а;

ьх = Амг),г)ьх + ьхи0) =' о, (б:

где Д^ /(х.иД.) = /(х.ьЛ) - ?(х,и,г).

Вводится в рассмотрение функция Понтрягина для задачи (1)-(3; Н(ф,х,ил; = < ф,/Сх,и,г; > - /°(х,и,г). Пусть фа,и), I ч Т, - решение задачи Коши для сопряженной системы:

<1> ф=-ц>:с(х(г1,и))= ~(с+1)х(г1,и)).(е:

Дополнительно вводится симметричная (п « гс.) матричная функция I с Г, удовлетворяющая системе

ш = - Ш(и(г)Л) - А(иа),г)Ч + сми(г).г),

^ (7!

= ' ; = - л.

Тогда с учетом уравнения (4) построена первая формула приращения функционала

Л^ФОО = -х диа_, 1) ак, (в:

г

где р(1,и,ю) = ф(г,и; + щ%,и)Ьх(г), - решение матрич-

ной задачи Кони (7).

"Симметричный" вариант выражения (8) - вторая формула риращения - имеет вид

ЛуФ(и) = щр(г^,и),х(г,и),и(г:,г) аг. (9)

т

ри этом векторчЬункшпо pГí,y(uJ с учетом уравнения (5) для г можно определить дифференциальным-образом •

рг£(; = - ^¿ха^ч)).

Заметим,что формулы приращения (3>,(9) являются точными том смысле, что не содержат остаточных членов тех или иных азложений. Их отличительной особенностью является присутствие атричной функции Ф(t), которая традиционно используется при сследова>ши особых управлений как необходимый элемент ' оответствующих условий оптимальности.

Отметим еще одну характерную особенность выражений (8),(9) подынтегральная функция есть частное приращение по '/правлению амильтониана Я для определенной совокупности аргументов. Такое редставление открывает возможность нелокального улучшения уловления иа) через операция на максимум функции Понтрягина, :оторая является ядром для всех предлагаемых процедур и методов., 'лучшения.

Введем отображение и*СФ,-£. и с помощью экстремального ¡оотношения

и'(ф,х,и = агдюх Н(ф.х.и.г), ф € Яп, х е йп, г <• Г. (Ю) и € и

Предположим, что формула (1С) определяет вектор-функцию которая является кусочно-непрерывной по совокупности звоих аргументов на Яп«Яи*!Г. Каждая поверхность разрыва задается уравнением вида = 0, где функция g дифференциру-эма по совокупности (ф,х) е йп«йп и непрерывна по I е Г. На тавврхностях разрыва (и только ра ¡глх) вектор-функция и*Чф,.г.и определяется соотношением (10) неоднозначно.

Возьмем за основу формулу приращения (8) и опишем первую процедуру улучаения (гл.1,§2):

I) по допустимой паре (иа), Ъ £ Г, найдем решение ф(Ч,и;, ввкторно-матричной системы (6)-(7);

2) образуем вектор-функцию

рсх.и = фа,и; + <и(г,и)(х - ха.и)) и сформируем экстремальное управление

и*(х,г) = и"(р(х.г),х,г), х е д", t « т;

3) найдем решение х(г), { € Т фазовой системы

вместе с управлением v(t) = u*(x(t),г), t t Т. Предположим, что решение x(t) задачи Коши (II)(возможно не единственное) существует на Т и соответствующее управление v(t),t с Т является измеримой вектор-функцией. В результате на выходе получаем допустимую пару (v(t),x(t,v)) со свойством улучшения $(v) ç Ф(и). Равенство v(t) = u(t), t е Т, означает, что управление u(t) удовлетворяет принципу максимума. '

Отметим трудоемкость реализации (цену улучшения) - две векторные задачи Коши (ф(t,u),x(t,u)) и одна матричная задача Коши (9(t,u)).

На основе зторой формулы приращения (9) построена альтернативная схема улучшения. По трудоемкости реализации обе процедуры эквивалентны.

В §3 главы I проведено дополнительное исследование возможностей улучшения для полученных процедур. При этом задача (I)-(3) конкретизируется по части зависимости от управления. Предполагается, что функционал (I) и система (2) линейны по управлению, причем г-1 (одномерный случай), U = fct.pj (двусторонние ограничения). Соответствующая задача называется линейно-квадратичной. В этом случае функция Понтрягина имеет следующую структуру:

Введем в рассмотрение функцию переключения g(x,t) = HJp(x,i),x,t).

Тогда экстремальное управление бйределяется формулой

На поверхности разрыва g(x,t) = 0 управление u*(x,t) прини-

X = ;(X,U*(X,t),t), X(tn) «= х°

о

Ci, g(x,t) < О Р, g(x,t) > 0.

а

мает любое допустимое значение: u'(x,t) ç fc

Определение I. Решение x(t,v) системы (II) назовем скользящим режимом на промежутке времени Т0 = 1, ■

т; > т0, если g(x(t,v),i) = О, t £ TQ.

Решение разрывной системы (II) может быть не единственным, что приводит к множеству управлений на выходе процедуры улучшения :

V^u) = { v g V : vit) = u*(nt,v),t), t e T К

Приведем ряд утверждений, доказанных в §3, характеризующих первую процедуру улучшения. Определил множество

= { х ç т' 8(x(t,v),t)(v(t) - u(t)) > 0 }.

Леша I. Пусть Vf(u) ф 0, u С V((u). Тогда управление v е Vj(u) лучше управления u € V (®(v) < ®(и)), если те&Т > О.

Следствие I. Если решение x(t,v) является скользящим режимом на Т, то улучшение отсутствует: Д^Ф(и) = 0. Если решение не является скользящим режимом в пределах Т, то улучшение гарантируется: ¿^Ф(и) < О.

Сйязь между особыми управлениям:! W ,и) ,x(t ,u),u(î),i)= = О) и скользящими режимами состоит в следующем: всякий особый участок управления u е V^uJ является промежутком скольжения для соответствующей фазовой траектории x(t,u) и наоборот.

Определение 2. Будем говорить, что скользящий режим x(t,d) t е TQ, u € Vf(uj является устойчивым, если для любого управления и е V^u) решение x(t,v) является скользящим режимом на TQ.

Значение свойства устойчивости определяется следующими утверждениями.

Леша 2. Пусть u € V - оптимальное управление с особым участком TQ = (х0,% ], на котором u(t) е ¡.'a,|3J. Тогда скользящий резким x(t,u), t е î'0, является устойчивым.

Следствие 2. Пусть управление u(t) удовлетворяет принципу максимума с особым участком Т0, которому соответствует неустойчивый скользящий режим. Тогда на зыходе первой процедуры найдется управление v е Vf(и) со свойством улучшения:

Ф(v) < Ф(и).

При численном интегрировании системы (II) устойчивый

сксльпксл реккм реализуется с помощью пошаговых переключений упраг-ления мехцу крьйкими значениями <1 и р. Что касается неустойчивого скол--л:;ого рожиуа, то его численная реализация приводи-, з-0ч'ще гоьсчл, к нескользящему решению Это является благоприятным ром, гак как обеспечивает улучшение

ссотватст&у^п ••/ управления. По сути дела происходит астскатичьская отг-р^кс-гк-» не^та'пальных скользкщих режимов без иредв&оптельких ;¡лгср;:гьх-:оскпх заготовок.

1< 54 ¡¡а основе двух Независимых процедур улучшения допустимых управлений построен ксмб'/лг/.розоннай метод «метод приращений), хоторый гр; делах той трудоемкости, что и каждая про- • цедура в отдельности, о'еепечивэе'. двойное улучшение управления'' (повысе-ие э.ягек^иьнооти в дьа раза).

Стаем «--ту» ;:.'гр;.::.;!й метода, А - 0,1.....Пусть имеется

допустима« пана ;.х*ч :<Т, а вычислено значение функционала С-Си"). Нойд--м ретонис. рк(Х), векторно-матричной задачи Кози при -а*= и"г),г )

Ь - л.гг..-г-!':),и*,:; - о ди. /(х!,и),ик(г),г).

- - А(п',- ЬА(и'.г) + рп.) = - (с + Ьх^ч!,)). = -с.

я сформируем управление

1>*т = •1'(рк1Г),х>,а),т:), г € г. Образуем вектор-функцию

гЛг.и * {] + Фгигх - ^а)),

и найдем решение хк*'(1), г е Т фазовой системы

х = /(х,и'(рк(х.г),х,г), х(г0) -- х°.

формируем управление ик*'ш = и'(рк(х,1),х,1) при х= 3 итоге получаем допустимую пару (ик*'(1). х**1(1)). Подсчитаем значение функционала 0(ик*'). Итерация закончена. В процессе итерации метода происходит двойное улучшение по функционалу:

Подчеркнем характерные черты метода приращений отсутствие параметрического поиска (нелокальное улучшение) и

ю

необходимость интегрирования разрывных (кусочно-непрэгквннх) систем. Работа с разрывными система!.:!' расшгряет возмо*мости метода, так как в рассмотрен1.^ естественным образом входя;' '•скользящие режимы, которые охватывают случал вырождения принципа максимума (особые управления;, достаточно тиличше для квадратичных задач. Сходимость метода обосновывается теоремой 1.

Вторая глаза посвящена построению и обоснованию новых мо-тодов второго порядка, использующих квадратичную аппроксимацию функционала и процедуру игольчатого варьирования управления.

Рассматривается задача оптимального управления

Ф(и) = ф(дгсс,)) + —- плп, и е г, (¡2-

связанная с обыкновенной динамической системой

х=Г(х,и^), х(10) = х°. (13;

На множестве допустимых управлений

V = { и € Ь^ :.и(г) ч и, г с Т ). (14)

Предполагается, .что терминальная функция ф(х) двакды не• прерывно-дифференцируема на А'", штегрант /°(х,и,т) к вяктор-функция /(х,и^) непрерывны по совокупности свои аргументов на Йп » и « Т вместе с производными по состоянию х до второго порядка включительно, множество и в (14) компактно.

Будем считать, что каждому и е V соответствует единственное абсолютно-непрерывное решение х(г,и), I * Т задачи Коши.ЦЗ), причем семейство фазовых траекторий ЛгСГ,и), и € V} ограничено :

х(г,и) <• I, г с Т, и е V , где X с яп- компактное множеств.").

Пусть иа),ю(г) - допустимые управления с траекториям? х(т,и), ха,ю), г е Т. Квадратичной фазовой аппроксимацио? функционала Ф на управлениях. и, у назовем функционал АгФ(и,ь/), определяемый представлением

4Ш Ф(и) - А Ф(и,и>) + 0(\АХ),

где Ьх(1) - - ха,и).

В §1 построены явные выражения для квадратичной•аппроксимации (две формула). Первая формула имеет бвд

bjb(u) = 0гФГи,ш; + Т\,(\ЪХ\)' (15)

C^(u.V') .= - J bw(t) Я(фCt,и) * 9(t,u)bx(t),x(t,v>),u(t),t) dt,

•n.riAxlJ = üC|Ü.T{2).

Здесь Я - функция Понтрягина для задачи (12)-(14), ф(Ч,и,) и Vit,и) - ртЕвния еле дукхгах. задач Коши:

ф = - Hx(^,x(t,v.),u,t), Wt,) = -<px(x(tr,u}); (16)

Oft) = - f fx(t,и),u(t),t)т9 - Фfjx(t,u),u(t),t) -

1 - (17)

- Hxxwt),x(t,u),u(t),t). Фа,) = - %x(x(t1tu)).

Вторая формула, определяющая квадратичную аппроксимацию представляется следующим образом

bjb(u) - ö20iu,wj + i}2f|Ai|;. (18)

= - J K(p(t,u,u>),x(t,u),u(t),t) dt,

T p

TJ2f|iIi) = 0(\LX\2). Здесь вектор-функция p(t,u,w) определяется уравнением p = - Hx(p,xC,u)Mt),tJ - Шw(t/(x(t,u),u(t),tJ ,

P(t,) = ~ <CT(x(t1,u)), (19)

® - - ;x(x(t,u),w(t),t)Tü - Vfjx(i,u),w(t),t) -- Hzx(p,x(t,-d),w(t),t), o,'tt) - -<pi3/xftf,u;;.

Заметил, что в случае квадратично? задачи (12)-(14) остаточные члены TfjdAxU, п2([Lx\) равны нулю, то есть соответствующие аппроксимации 6;0(u,w) и SJX»Ги.ш) являются точными :

А = öt$(u,w), Ь JS>(u) - 5p<S>(u,w) .

Процедура игольчатого варьирования для управления u f V оформляется в виде

и Jt) = um + y(t)(v!t) - u(t)), t ( T,

v € v, % f x , а с [о,1],

а

x« = { * е V^ Х»; г -Г y-(tm = a!t, - V }• .

г

Здесь и,х.<* - параметры варьирования. Локальность варьирования

обеспечивает параметр с(. Соответствующие выражения для квадратичной фазовой аппроксимации имеют вид

0,Ф = 120)

= -¡х(*) ¿иа;я(фгг,и; + ъ(t,u)шt),z(t,uVtX),u(t),t)dt. г

е2Ф^и,ии1х; = - / хи)ь„а)Н1ра,и,и0 (21)

т

На основе указанных представлений построено два метода улучшения допустимых управлений. Первый метод изложен и обоснован в §3 с использованием представления (20). Техника улучшения состоит в следующем. Зафиксируем йеЮ,1) и будем искать параметры варьирования таким образом, чтобы уменьшить функционал д1Ф(и,иь ) на величину порядка о£, то есть обеспечить оценку 6^(и,ии ) < -о£ 8й(и), З(иа) > 0. (22)

С этой целью решается вспомогательная задача

¡Г Щ} *^• г?аг' и € У> х « ха.

г

где ра,х) = фа,и) + Ъ(г,и)(х - x(t,u)), х=х(г) - произвольная йбсолютжьнапрарывная вектор функция.

В результате анализа этой 'задачи построено й-паррметричес-•коэ семейство управлений варьирования, которое описывается сле-.•дуидими соотношениями

>иаа) =м(г) + - иа)), ха(г) » ха,иа),

'^(Л) = агдпах Н(р(Х,х„и)),хП),у,%) а и с и

«¿¿г; < 1. ваш >\

II 0*1, ваи> = Аа

а

<При этом оценка.уменьшения,(22),справедлива ддя аа

Для обоснования свойства:улучшения,в рассмотрение введена . яевяака принципа;максимума _з(,и).да,-управлении,и,'О:

хТ

11,3

ü(t) = argnax H(ty(t,u),z(t,u),v,t), t с Т. и с и

Установлена связь меаду -величине- л за(и), в(и):

■ ¡a^fu; - <?iu,)| < Cd. Конэчный результат о возможости улучшения формулируется сл^дущим сбразом.

Теорема. Если управление uf:j,teT не удовлетворяет принципу максимума в задаче (12)-(14), то Ф(и^) < <й(и) для молнх <*>0.

Опишем итоговый метод улучшения. Пусть (u(t),x(t,u)) -допустимая пара с управлением, не удовлетворяющим принципу максимума. Соответствуйте рец&иия ф(t,и), Ф(t,и) находятся из систем (16) и (17) соответственно.

Формируется вектор-функция ■'

p(t,x) = ф(t,u) + 4>(t,u)(x - x(t,u)). Ыаксимизурующее управление определяется из условия

u(t,x; = argrnx H(p(t,x),x,v,t), (23)

v € U

Образуется функция переключения

gft.X) = ^v(t,x) H(p(t,x),x,u(t),t). Вводится параметр X > 0 , строится управление

Г u(t), g(t,x) < X • u(t,x,X) = -j v(t,x), g(t,x) > X (24)

[ u(t)v v(t,x), g(t,x) = X

и находится решение x(t,X) фазовой системы

х = f(x,u(t,x,X),t), X(t0) = зР. Для заданного значения ас (0,1./ ищется параметр Х-Ха из условия

С t а Т: g(t.xit.X)) > X ) = dft, - t0).

Параметр OL находится как приближенное решение задачи Ф(ua) —* min, ü i (0,1J,

где uat't; = u(t,x(t,Xa).Xa).

В качестве альтернативного варианта улучшения можно использовать ^.-параметрический поиск на базе семейства управлений u(t,x,X).

Выделим'частные случаи предлагаемой процедуры. Если в формулах (23)-(24) зафиксировать фазовое состояние х = x(t,u), то

получим метод игольчатой линеаризации, тесно, связанный с принципом максимума. Если положить 4Vt.ii.' = С, то прихода* к методу фазовой линеаризЕндои Подчеркнем, что для квадратичных задач построенный метод обоепочиъазт уменьшение функционала для мтОих а € (О,и. Действительно,в этом случае ДФ = 5 Ф, поэтому Ыча) - Ф{и) - 6^(и,иа) < -а ио(и) 4 о.

В частности, при а-1 получаем перзугэ процедуру улупания для квадратичных задач (§2,.глЛ).

Второй метод удушения разрабатывается в 54 на основе второй формулы для квадратичной аппроксимации (21). Схема построения аналогична придндущь-му. Заметим, что вспомогательные задачи обоих методов (на максимум гамильтониана) не выроадеются на особых управлениях, что открывает возможность их улучшения. Примечательным фактом является и наличие в структуре методов разрыв:шх систем, что позволяет включить в работу скользящие рекиш как возможные решения таких систем.

В третьей главе проводится описание и обсуждение еычисляг тельного эксперимента по реализации предлагаемых методов,для. решения ряда: конкретных задач оптимального управления, с прикладным содержанием. Задачи подобраны из статей<и монографий; 1« носят, естественно, тестовый методический, характер. Числрвдоз. ]эе-тение проводилось с целью, отладки, алгоритмов и; осо-

бенностей поведения методов ц, процесса реализации,. Бц/п, такка Проведено сравнение с методами. линеаризации (пер^о^о цррадка,), ПО некоторым- показателям,, характеризую^! кач^ртдо, ц, трудоемкость решения,- задачи..

Результаты расчетов показывают безусловную эффективность метода приращений для. решения квадратичных задач оптимального управления. На уровне нелинейных задач эффективность предлагаемых методов второго порядка в значительной степени проявляется в вырожденных случаях, когда оптимальное управление содержит особые участки..

Публикации по теме диссертации:

1.3ахарченко В.С. Об улучшении допустимых управлений в эе-дячах, линейных ио. состоянию // Приблш;енные методы решения

операторных уравнений.- Иркутск, 1992..- С.88-93.

2. Антонин В.Г., Захарченко B.C. Решение задач оптимального управления методом второго порядка // Международная школа-семинар "Методы оптимизации и их приложения".Тез.докл.-Иркутск, 1932.- С.8.

3. Срочко В.А., Антоник В.Г., Захарченко B.C. Методы квадратичной фазовой аппроксимации для задач оптимального управления // 2-ой международный семинар "Негладкие и разрывные задачи управления и оптимизации". Тез.докл. - Челябинск,93. -С.128.

4. Захарченко B.C. Метод второго порядка численного решения задач оптимального управления.- Иркутск, 1993,- Деп.в ВИШИ '16.02.93., Ж379 - В93. '

5. Срочко В.А., Антоник В.Г., Захарченко B.C. Решение!-за-деч оптимального управления на основе квадратичных аппроксимаций // Весенняя Воронежская математическая школа "Понтрягинс-кие чтения - V". Тез.докл.- Воронеж, 1994.- С.131.

GL-W

Подписано к печати " " октября 1994 г. Оперативная печать Тираж 100 экз. Заказ Л 2.0■

Отпечатано в Иркут. ун-те •Иркутск, ул. К.Маркса, I