Асимптотика решений некоторых дискретных задач оптимального управления с сингулярно возмущенными связями тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Гаипов, Мухамедкули Акадович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Иркутск МЕСТО ЗАЩИТЫ
1992 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Асимптотика решений некоторых дискретных задач оптимального управления с сингулярно возмущенными связями»
 
Автореферат диссертации на тему "Асимптотика решений некоторых дискретных задач оптимального управления с сингулярно возмущенными связями"

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи Гаипоо Мухамедкули Акадович

АСИМПТОТИКА. РЕШЕНИЙ НЕКОТОРЫХ ДИСКРЕТНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С СИНГУЛЯРНО В03ЩН1НШ СВЯЗЯМИ

0I.0I.G9 - ¡^.тематическая кибернетика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико - математических наук

ИРКУТСК - 1992

Работа выполнена в Туркменском исследовательском центре " НООСФЕРА " - Центре прикладной математики и аридной информатики

Научный руководитель - доктор физико-математических

наук .профессор М.Г.Дмитриев

Официальные оппоненты -доктор физико-математических

наук,профессор В.А.Плотников

кандидат физико-математических наук,доцент Н.В.Тарасенко

•', 'Ведущая организация -Белорусский государственный

университет

Зашита состоится " "ЛнЬаЬ-А 199£г. в_час.

на заседании специализированного совета К 063.32.06 по присуждению ученой степени кандидата наук при Иркутском государственном университете ( 664003, Иркутск, ул. К.Маркса I, ИГУ, математический ф-т,спецсовет К 063.32.06 ).

С диссертацией можно ознакомиться в библиотеке Иркутской государственного университета.-

Автореферат разослан " " 0^1С<х<др& 199 / г.

Ученый секретарь специализированного совета к.ф.-м.н., доцент

Н.Б.Бельтюков

Актуальность теш. Многие задачи экономики, плэнировпил, автоматического управления сводятся к penjemro задач диск-етного оптимального управления,' причем шаг дискретности ока-ивается малым, либо число шагов велико, то есть поведение объ-ктов описывается дискретными (разностными) сингулярно возмучен-ими ураоненняш'. ' ■

При решении дискретных задач оптимального управления с мсныаением шага, при фиксированном отрезкд существования ре-ения, значительно увеличивается количество вычисления, найти очное решение этих задач очень трудно, иногда и невозможно из-а малости шага. .Поэтому для решения дискретных садач оптимзль-эго управления с малым шагом целесообразно применять метод, учи-аващий малость шага, в частности, строить решение разностной адачи оптимального управления в виде ряда по степеням шага.

Последние годы в работах Дмитриева М.Г., Омолли P.C., кеймсона А., Кокотовича Р.В., Глизера В.Д., Калинина А.П. и

р. авторов, интенсивно развивается направление, связанное с

«

римснемием методов теории сингулярных возмущений к задачам оп-имального управления. Основным методом исследования в этих ра-этгос был метод пограничных функций Васильевой А.Б. Оби'льо метод эграничных функций применяется для построения асимптотики рсие-||я краевой задачи принципа максимума. Такое применение метода зграничных функций имеет некоторые недостатки: во-перЕЫх, те-пется вариационный смысл каждого асимптотического приближения накладываемых условий существования асимптотики; во-вторых, ;тается неясным вопрос существования оптимального управления исходной задаче и субоптимальности построенной асимптотики давления; в-третьих, затруднено применение традиционных мето-зв оптимального управления и пакетов прикладных программ для

нахождения каждого асимптотического приближения; и наконец, в-четвертых, применение этого способа сужает класс рассматривав? задач.

В работе Дмитриева М.Г. (1933г.) был предложен другой пу; применения метода пограничных функций для построения асимптоп ки решения задачи оптимального управления с быстрыми и медлеш ми Движениями. Этот способ применения метода пограничных функций в дальнейшем получил название' прямая схема. Основная идея прямой схемы связана с прямим подставлением искомого разложеш в условия задачи и в функционал, последующим разложением условий в постулируемый асимптотический ряд и последовательным реп нием получающихся при этом вариационных задач меньшей размернс ти.

Далее в работах Дмитриева М.Г. и Еелокопытова С.В. пряма; схема развивалась для различных классов непрерывных задач опта мального управления с сингулярно возмущенными связями.

Возникает вопрос о возможности применения прямой схемы д; новых классов задач, в частности,' для дискретных задач оптимео лого управления с сингулярно возмущенными связями, где также проявляется эффекты пограничного слоя. Этот класс задач требу« введения новой техники и приводит к появлении новых качественных моментов.

Настоящая работа посвящается дискретным задачам оптимал! ного управления с сингулярно возмущенными связями,,то есть дис ретным задачам оптимального управления с малым шагом и дискре: сингулярно возмущенной задаче оптимального управления, возник;: щей. при регуляризации дискретной задачи оптимального управлену с особым управлением.

Цель работы, заключается в развитии и обосновании прямой схсш применения метода пограничных функций в дискретных задачах оптимального управления с сингулярно возмущёнными связям:.

Научная новизна работы определяется следующими осногныьи результатами:

1) предложен способ применения прямой ехзмы для построения асимптотики решения дискретных задач оптимального управления с сиигу-лярно возмущенными связями;

2) получены оценки субоптимлльности асимптотики управления рассматриваемых задач;

3) установлено свойство релаксационности асимптотики, то есть уменьшение значения функционала исходной задачи с каждым новым асимптотическим приближением;

4) получено условие управляемости для дискретной линейной нестационарной системы с.малым шагом в виде условия управляемости присоединенной системы;

5) предложен новый способ построения допустимого управления с г.о-моцью асимптотических приближений к траекториям дискретно.'1, линейно-квадратичной задачи оптимального управления с малым шагом с ограничением на правом конце траекторий, который приводит к субоптимальности допустимого управления;

6) предложен новый способ построения асимптотики решения дискретной линейно-квадратичной задачи оптимального управления с "депо-вой" платой за управление в виде регулярного ряда.

Пргктическаг и теоретическая ценность. Работа теоретическая. Результаты работы могут быть использованы при: п) построении схем приближенной декомпозиции дискретных задач управления с болшим числом шагов; исследован»« задач математической эконо-

мики; в) исследовании управляемости систем с малым шагом; г) при получении более экономичных вычислительных алгоритмов решения некоторых дискретных задач оптимального управления.

Метода исследования. Использованы общие методы теории оптимального управления, методы теории сингулярных возмущений.

Апробация работы. Результаты работы докладывались на: Всесоюзном совещании "Прикладной асимптотический анализ и спектраль ные задачи" (Ашхабад, 1990), Всесоюзной конференции "Дифференциальные уравнения и оптимальное управление" (Ашхабад, 1920), Рабочем совещании МАК "Сингулярные возмущения и асимптотические метода б системах управления" (Бостон, 1989), Международной конференции "Синтез систем управления: теория и применение" (Новосибирск, 1991), Всесоюзной конференции "Асимптотические методы теории сингулярно-возмущенных уравнений и некорректно поставленных задач" (Бишкек, 1991), городском математическом семинаре г. Ашхабада, семинарах Института математики, и механики АН ТССР, ТИЦ "Ноосфера'-Центра прикладной математики и аридной информатики.

Публикации. По теме диссертации опубликовано семь работ, из них три - совместные.

■КРАТКОЕ СОДЕИКАНКЕ РАБОТЫ

Во впадении обосновывается актуальность работы, указывался цель исследования, приводится обзор направлений в исследо-1аниях задач оптимального управления асимптотическими методами, слагается краткое содержание работы.

В первой главе рассматривается' нелинейная дискретная задача птимального управления с малым шагом в классической постановке.

В §1.1 приводится постановка рассматриваемой задачи и из-агается формализм прямой схемы применения метода пограничных ¡ункций.

Рассмотрим задачу

I (11с)с Q (% (Т 8 Ц Нab с (t i\ II г (fe Z) Д £) ■

min (I)

1 ЬО c Ue *

'де (rt ) - а-мерный, вектор фазовых координат, 11 ('fc) - ^ -ерный вектор управления^ = С

;T={'t:0«'-t4n}>y=T/£ , £>0 _ малый шаг, Т - фиксированное оложительное число.

С помощью замены ^ (t + £ ) - ^ = £ F(^£(-t),Zl£(t\t), £(0)=0 исходную задачу (1),(2) приводим к задаче Майерз •

>£: а (НО > Q (%t (Т)) + ув (Т) - rmrv , (й)

' , (4)

h (*t+ О-f Н), г|е (t),t),

I

Следуя прямой схеме применения метода пограничных функций при решении вариационных задач асимптотику решения задачи Рс ицем в виде разложения

a(t,£) = x(t,£> (5)

H(±tL)J

где СС (±, £) = S £ (± ) - регулярный ряд 'с коэффициентами, зависящими от t ; ' = § ^П-^Ъ) - левы

-i»0

пограничный ряд с коэффициентами, зависящими от ЯХ = "t /£ ;

ISO ^

Q. X (Cfcj, £ ) s £ GLi^f^O ^ пРавый пограничный ряд с ко эффициентами, зависяп;ими от

= (t- Т )/£ , причем м _ „ -аЯг0 , а.

ЦПхх(ч:.)||4 се , ||Gu®(<t.)l«ee

Прямая схома била предложена и'применена в работах М.Г.Дми риева и С.В.Белокопытова для построения асимптотики решения неп рерывных задач оптимального управления с быстрыми и медленными движениями.

Итак, подставляя (5) о (4) и проводя обычные прсобраэопв ния метода пограничных функций, то есть, разлагая левые и правы части системы (4) в ряды по степеням £ , приравнивая коэффициенты разложений при одинаковых степенях* £ слева и справа, от дельно зависящие от t , ЧГ0 »ЯГ* , получаем уравнения состоян для членов асимптотики. Затем, подставляя (5) в функционал (3) задачи Р£ , получаем следующее разложение

e^m-t-.., . (6)

Идея формализма прямой схемы заключается в последовательной минимизации коэффициентов разложения (б).

Для определения членов нулевого равномерного приближения получаем следующие задачи:

т

Р0: 3 (&о/йо)= 0 + ]г(&0,й,1)си гто. , ^.Ы-^^о^ХяДо ^и), *1=слупгп СОД, По р: ПД - - Е [Н С1 (о)+ П о^ (Ъ), и, (0) + П.И 5о(0),0)-н(^о(0),г<.(0)1Фв(о),0)]

По% (яГо-0 д (о)+п0и (ъ), 0)-{(ШД(о)4

ПД (о) - ^о (о),

Н(10(Т),^(Т),Ф0(Т),Т)]— тгп ,

и„ц

$ (а. (Т), ги (Т) /т), си (О) = %т0- (т).

нага

ПсИ

где И ('ЬИ.Ч'.О - ¥'(*)(£(*:) -

- Р ( ¿Ь-С-Ь ), 1Д ) - гамильтониан, а 41 (1) - множители Лагранжа задачи Ро .

Далее, для определения высших членов равномерного приближения получаются линейно-квадратичные задачи , ГКР и От.? , ъ = 1,2,... ,

В §1.2 приводятся достаточные условия существования и единственности решения задач ПоР , (ЗоР и устанавливается экспоненциальные оценки для нулевых пограничных функций, то есч

||Иох(^еехр(-йЯ с ехр(а<^))СД>0,с1;= 0,1,

я: 1»-0,4гг.,..; •

В §1.3 обосновывается-формализм прямой схемы. В результате решения задач Ра , П1р и QlP "1-=0,п. олрьделяем следующие векторы

Г, ^(^М + Па® Цч ос С^О), ССп.=

г «О

где 5^(1), П1СС(ЯГо), 0 { ОС (Я^) - решения задач Р-1 , Гк Р » Р » = 0,а , соответственно.

Кроме того, в результате минимизации коэффициентов , 1 =0,2 а + I, разложения ( & ), определяем следущее разлокени

За+-...+

Вводится, как и в работе С.В.Белокопытова, расширенный фуь ционал I £ (X), который обладает следующими свойствами: ,

I) (ОС) = У (Ц£) для допустимого решения задачи Рр, ;

- 5л. + О (£*•♦*) .

Введем следующие условия:

| < 1 » гДв С^- собственные значе-;ия матриц ^^ , Т =1, п. .

[ Пара матриц п. Л)» ^ ^Дестабилизируема прг.

:еТ£.

Имеет место следующая

Теорема 3.1. Пусть выполняется условие I . Тогда ля достаточно малых £>0 , имеют место неравенства

О (ги) ^ о (гц) 5»... > 9 (ги) .

Теорема 3.2. Пусть функционал 1£ выпуклый по ^ Д) и сильно выпуклый по и & и и выполняется хотя би дно из условий I или II . Тогда, для достаточно малых £ >0 ешение зедач;; Р £ существует и единственно, при зтсм

) («О-^е «се

дв ^ ^ » , 0 £ - оптимальное решение задачи Р(? (Плетение системы (4), соответствующее На » Ь?,* ~ Разностный . налог пространства •

Вторая глава диссертации посвяцается дискретной линейнэ-вадратичной задаче оптимального управления с малым шагом и фа-овым терминальным ограничением.

В §2.1 приводится постановка задачи и излагается формализм рямой схемы для задачи

V i ~I2~

—3» min , и '

X (t +-£) « ^(t)ccCt>B(t)H(t),oc(0)^oc%

a®(i)>oi, (9)

n t,

где SC (t) e ]R - состояние процесса, 1t ("t) 6 В- - ynpa ленив процессом, i € T£ =-J4:-fc= fcß, fe-ОД,..., jV-i } С

С = шаг, Q - заданная постоянная

ftf у. А матрица, ci - заданный гл.- мерный вектор, ciet^ (i]

^(t) - положительно полуопределенная а R <t) положительно определенная матрица на отрезке L0»ll Все матрицы, входящие в (7)-(9), достаточно гладкие на отрезке [0,1].

Отметим-^существенное отличие задачи (7)-(9) от задач! рассмотренной в г;.:аве I. Здесь присутствуют ограничения на правом конце траекторий, которые усложняют построение асимптотик* решения рассматриваемой задачи...

Далее, в данном параграфе строится П-е асимптотическое приближение

Ш J - (t,e)= fz (io:

4 ' i=-0 '

задачи (7)-(9).

В §2.2 приводятся условия управляемости системы (8). . Справедлива . ....

Теорема 2.2.1. Пусгь выполняются условия

б.) fconfe[ß(t),А(i)b(t),n,Не[од]

'Гогда для достаточно малых £>0 система (8) управляема. В §2.3 доказывается существование и единственность рассмат-шаемой задачи.

Теорема 2.3.1. Пусть выполняются условия теоремы 1.2.1. Тогда решение задачи (7)-(9) существует и единственно на ¡ножестпе допустимых управлений.

Далее в третьем параграфе второй главы показывается бли-ость полученного а -го асимптотического приближения , £ ) : точному решению задачи (7)-(9), а также устанавливается субоп-•имальность асимптотики управления. Следуя Л.И.Калинину,введём

-Л.

Определение I. Управление 'U (t) будем называть Б -опустимым управлением задачи (7)-(9) порядка il , если выполнятся неравенства

GxCO-ci^- слк, >о,

де ОС ( 1) - решение системы (<3) соответствующее И (t). Приведем известное (Ц.Г.Дмитриев)

2 1!Р_еД£лиДопустимое управление 11 (t) будем нл-ывать субоитималышм управлением задачи (7)-(9) порядка ^ если ыполняется неравенство О (И) - 9 г? С Z ; где С > 0 , 3*- оптимальное значение критерия качества, а С (14) - знз-*

л

ение критерия качества, соответствующее И (t). Справедлива следующая

Теорема 2.3.2. Пусть выполняются условия теоремы

.2.1. Тогда U|V(-tf£) является £ - допустимым управлением

орядка а +1, обладает свойством субоптимальности порядка

rv + 2 и при этом справедливы оценки

| . .

а* (гЦ)II * еГ4, || II * ее"'1,

ги ¿с8л+1, оо,

траектория, а

•^ом«.!«!..^^ 6»Т\ 1-1

* ~ ( . ч« , . _ л+1 г

где СС1" - оптимальная траектория, а 'Ц*- оптимальное управле!

евкл!

¿»о '

дова норма.

В §2.4 с помоцью П.-го асимптотического приближения траектории'для случая:

строится допустимое

управление, которое имеет следующий вид -1-ые коэффициенты разложения (10). • (е*

Теорема 2.4.1. Пусть выполняется условие

. Тогда справедливы следующие утверждения:

г—'

1) пара (СГ£,Ц£) является допустимым регаением задачи (7)-(9);

2) для достаточно малых £ >0 справедливы оценки

—.

3) допустимое управление И^('-к) является суболтимальным упрг лекием порядка 2а 42 задачи (7)-(9), то есть справедлива оцет

з (й£) -Л св2а"г и при этом 11а£(0-г£(±)||* се"4'1 ,

ЦИ^СО-И- С£ , где ОС*, И*", 3 - оптимальное решение рассматриваемой задачи.

В §2.5 основные результаты второй главы демонстрируются ш конкретном примере.

Дискретной линейно-квадратичной задаче оптимального управ;

-15* с "дешёвой"'Платой за улраглекие посвящается третья гляйп

5'0ТЫ.

В §3.1 рассматривается следующая задача

Л'т^а))- гл т , (II)

*«о *

Е(-Ь)У(1), ос(0)-осс , (12)

з "Ь = О, I,..., 1 , ас (-Ь ) - сг -мерный вектор фязозых ординат, V (1 ) - п. -мерный вектор управления, матрицы 4 (£),

(-4), 'й (-Ь), 12 ) имеют соответствующие размерности,

>0 - малый параметр, штрих означает транспонирование.

Подобного рода задача рассматривалась в работах О'Мо^й.Е..

техоп -Д. только для непрерывного случая, в которых авторы

образует исходную задачу к сингулярно возмущенной задаче спти-

ыюго управления. Далее строят асимптотику решения задачи, вы-

ающей из необходимых условий оптимальности.

В данной работе с помощь» замены 11(4. )= (Ь ) задача

),(12) сводится к эквивалентной задаче, то есть

Н(11) — тхл , (13)

-I -о ^

(14)

Далее, используя прямую схему, строится асимптотика реше-задачи (13),(14) п виде регулярного ряда, то есть

Ля ... Д и)= (хи), и (-0). (15)

Для опр9деленйя каждого члена, разложения (15) получаются задачи: задача безусловной минимизации и задача условной ми-[зации функций многих переменных. Решая эти задачи, можем оп-1лить равномерное а -ое асимптотическое приближение решения

задачи (13),(14), го есть

(м)* £:

Во втором параграфе третьей главы задача (13),(14) свод] к эквивалентной минимаксной(задаче, в которой независимыми ] ременными являются переменные управления и состояния. Далее, строится асимптотика решения минимаксной задачи, которая удо1 воряет необходимым условиям оптимальности задачи (13),14) с 1 костью до 0(£а+').

В §3.1 устанавливается субоптимальность асимптотики упрг ления.

Справедлива

Теорема ,3.3.1. Пусть выполняются условия: .

а) сиь Ъ(Ъ)фО-,

б) £>(Ь)>0, £ (±)> О при -Ь^дГч.

/•— _ , , , Тогда И-л (-Ь,Е ) является субоптимальным управлением задачи

(13),(14) порядка 2а » то есть имеет место неравенство '

а(ги)-я* < сега,

причем, «

.11 а*-Я* II « С£а, Ии^-КНСЕ^,

у у ^

где СС , 11 , О Г - оптимальное решение задачи (13),(14). Отметим здесь "грубый" характер оценок из-за неучета функций, ••' даленно напоЫинаюг^их погранслой.

В §3.4 основной результат данной главы демонстрируете.! н конкретном примере.

В заключении кратко формулируются результаты работы.

Оснопные результаты диссертации опубликованы в следующих работах :

I. Гаипов М.А. Прямая схема построения асимптотики в дискретных задачах оптимального управления с малым шагом. - Ашхабад: ГГУ, I9dB - 15 с. - Библиогр.: II назв. - Рус. - Деп. в Турк-иенШШГМ, 22.09.88, № 96-Т/-68.<

Î. Гаипов М.А. Асимптотика реаения нелинейной дискретной зада-4И оптимального управления с малым шагом брз ограничений на управление (формализм) I. // Изв. АН ТССР, сер. Ш и Гн, 1990, Р I, с. 9-IÔ.

5. Дмитриев М.Г., Евлокопытов C.B., Гаипов М.А. Асимптотика ре-пения нелинейной дискретной задачи оптимального управления с маши шагом без ограничений на управление (обоснование) II. /,г /изв. 1Н ТССР, сер. Ш и Гн., 1990, № 2, с. 10-18. I. Гаипоо М.А. Асимптотика решения дискретной сингулярно позму-!енной задачи оптимального управления с фазовым ограничением // В :б.: Информатика и системный анализ, Ашхабад, 1990, с. 43-53.

4

>. Гаипов М.А. О построении асимптотики решения одной дискрет-го й задачи оптимального управления с сингулярно чозмугценнимн :нязями // Тез. докл. Всесоюзной конференции "Дифференциальные равнения и оптимальное управление", Ашхабад, 1990, с. 157-158.. .mC.Dmibiew, Jl.U fcitfio, Vlù.Gaipov ,УС.А. Oroiotf, $ У. Hbnov,

гп^и^а-г регЫг&ес!. optimal cont^oC p?o&£emj - пего "гелдШ | ontïoC j^item iyn-lPiedid: Ifi^oty Qnci opp^cotioa ,Фгосеес(з'г^} : ibe Cfoteïnationû8 tfoïfestap' TloucHÎbifcifc ,\H4R, a? may -jupe , iS9i , p. 19-24.

7. Дмитриев Ц.Г., Битко A.B., Гаипов U.A., Овезов Х.А., Сол' нов С.Т. Некоторые результата по асимптотике решений линейны: сингулярно возмущенных систем управления. ¡1 Тезисы докладов ] союзной конференции "Асимптотические методы теории сингулярш возмущенных уравнений и некорректно поставленных задач", - Ei кек. - 9-12 сентября, 199I, с.39.

Подписано к печати I2.IIi.9T года формат бумаги 60x04 1/16 обьем .1,1 п.л. уч - издат 0,6 Заказ 2256 тираж 100 экз

Отпечатано ООП ГВЦ Госкомстата Туркменистана г. Ашхабад - 91 г.