К решению задачи об оптимальном параметре совместности для некоторого класса уравнений в нормированном пространстве тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Ровенская, Елена Александровна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2006 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Диссертация по математике на тему «К решению задачи об оптимальном параметре совместности для некоторого класса уравнений в нормированном пространстве»
 
Автореферат диссертации на тему "К решению задачи об оптимальном параметре совместности для некоторого класса уравнений в нормированном пространстве"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М. В. ЛОМОНОСОВА

К РЕШЕНИЮ ЗАДАЧИ ОБ ОПТИМАЛЬНОМ ПАРАМЕТРЕ СОВМЕСТНОСТИ ДЛЯ НЕКОТОРОГО КЛАССА УРАВНЕНИЙ В НОРМИРОВАННОМ ПРОСТРАНСТВЕ

01.01.09 — Дискретная математика и математическая кибернетика

На правах рукописи

Ровенская Елена Александровна

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Москва - 2006

Работа выполнена на кафедре оптимального управления факультета вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова

Научный руководитель:

доктор физико-математических наук, академик РАН Кряжимский Аркадий Викторович

Официальные оппоненты: доктор физико-математических наук,

профессор Максимов Вячеслав Иванович

доктор физико-математических наук, профессор Ишмухаметов Альберт Зайнутдинович

Ведущая организация:

Институт проблем механики РАН, г. Москва

Защита диссертации состоится 22 декабря 2006 г. в 11.00 часов на заседании диссертационного совета Д 501.001.44 при Московском государственном университете им. М. В. Ломоносова по адресу: 119992, ГСП-2, Москва, Ленинские горы, МГУ, второй учебный корпус, факультет вычислительной математики и кибернетики, ауд. 685.

С диссертацией можно ознакомиться в библиотеке факультета вычислительной математики и кибернетики МГУ.

С текстом автореферата можно ознакомиться на портале ВМиК им. М.В. Ломоносова http://cs.msu.su в разделе "Наука"— "Работа диссертационных Советов" - "Д 501.001.44".

Автореферат диссертации разослан 22 ноября 2006 г.

Ученый секретарь диссертационного совета,

профессор

Трифонов Н.П.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В диссертации рассматриваются оптимизационные задачи вида:

р —+ min,

F(p,x) = Ь(р), , ,

® 6 Х(р), W

Р 6 [ро.Р0]-

В задаче (1) требуется найти наименьшее значение скалярного параметра р, при котором зависящее от этого параметра уравнение F(p,x) = b(p) имеет решение в пределах заданного множества А'(р); нахождению подлежит также само это решение. Подобные постановки возникают в разного рода прикладных задачах (задачи оптимизации сетей страховых компаний, задачи оптимизации портфелей инновационных проектов1), а также при исследовании параметрических семейств операторных уравнений2 3. Заметим, что в форме (1) можно также представить4 стандартную задачу оптимизации вида

J(x) —<• min, F(x) = О, х б X.

Диссертация посвящена построению и исследованию одного итерационного метода решения задачи (1) (пространство аргументов х считается, в общем случае, бесконечномерным). При рассматриваемых в работе ограничениях оптимизационная задача (1), является, вообще говоря, невыпуклой. Предложенный итерационный метод конкретизируется применительно к некоторым задачам оптимального управления.

Известно, что для решения невыпуклых задач оптимизации стандартные методы, например, градиентного типа5 6 могут быть не применимы. Известен также ряд общих подходов, применимых для решения широкого класса

lDigas B.V-, Ermoliev Yu.M.,Kryazhimsky A.V. Guaranteed optimization in insurance of catastrophic risks.// International Institute for Applied Systems Analysis. Laxenburg. Austria. IR-9S-082. 1998.

2Агеев А.Л. Об устойчивости несиметричной проблешл собственных значений.// Proceedings of International Conference on Distrubuted Systems: Optimization and Economic-Environmental Applications. Ekaterinburg, 30 May - 2 June, 2000. Ekaterinburg. Urals Branch, RAS. 2000. pp. 220-223.

3Kryazhlmsky A.V., Pascbenko S.V. Distribution of resources and problem of optimial compatibility.// Proceedings of International Conference on Distrubuted Systems: Optimization and Economic-Environmental Applications. Ekaterinburg, 30 May - 2 June, 2000. Ekaterinburg. Urals Branch, RAS. 2000. pp. 210-212.

4Krya^himsky A.V. Optimization problems with convex epigraphs. Application to optimal control.//

Internatioanl Journal of Applied Mathematics and Computer Science. 2001. Vol. 11. No 4. pp. 101-129.

БВасильев Ф.П. Методы оптимизации. M.: Факториал Пресс. 2002.

еИшмухаметов А.З. Методы решения задач оптимизации. М.: Издательство МЭИ. 1998.

оптимизационных задач - методы штрафных и барьерных функций4 7; гомотопические методы8; методы стохастической оптимизации9. Подходы этого класса, обладая значительной общностью, сопряжены, однако, с проблемой их конструктивной реализации при решении конкретных задач.

Тип невыпуклой задачи обычно создает специфические трудности на пути обоснования конструктивных алгоритмов решения. В связи с этим развиваются специализированные подходы, ориентированные на решение конкретных типов задач невыпуклой оптимизации. Для некоторых классов задач, в определенном смысле близким к выпуклым, известны итерационные алгоритмы решения, использующие операции с функцией Лагранжа10 п. Предлагаются подходы к итерационному решению оптимизационных задач, невыпуклость которых определяется присутствием в них разностей выпуклых функций12. Развиваются методы оптимизации, основанные на игровых моделях13.

Широко исследуемый класс задач оптимизации составляют задачи оптимального управления. Центральным инструментом анализа таких задач является принцип максимума Понтрягина14. Во многих случаях он позволяет получить окончательное решение задачи либо выявить его аналитическую структуру. Все же значительное число задач оптимального управления находятся за пределами сферы эффективного применения принципа максимума Понтрягина. К числу таких задач относятся, прежде всего, задачи оптимального управления с фазовыми (а также смешанными) ограничениями: для них принцип максимума Понтрягина имеет усложненную форму и трудно поддается аналитическому исследованию в конкретных ситуациях15.

Другой универсальный подход к решению задач оптимального управления, в том числе, с фазовыми ограничениями, объединяет метод динами-

тФиакко А., Мак-Кормик Г. Нелинейное программирование. Методы последовательной безусловной оптимизации. М.: Мир. 1972.

®Zangwill W.I., Garcia С-В. Pathways to Solutions, Fixed Points and Equilibria. Englewood Clifls: Prentice Hall. 1981.

^Нурминский E.A. Численные методы решения стохастических и минимаксных задач. Киев: Наукова думка. 1979,

10Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы. М.: Мир. 1979.

11 Антипин A.C. Методы нелинейного программирования, основанные на приямой и двойственной модификации функции Лагранжа. М.: Изд. ВНИИСИ. 1979.

"Стрекаловский A.C. Элементы задач невыпуклой оптимизации. Новосибирск: Наука. 2003.

13 Атггипин A.C., Васильев Ф.П. Методы регуляризации для решения задач равновесного программирования с сдвоенными ограничениями.// Журнал вычислительной математики и математической физики. 2005. т, 45. № 1. С. 23-37.

"Понтряптл Л.С., Болтянский В-Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М-: Наука. 1976.

" A.A. Axutyunov, S.M. Aseev. Investigation of degeneracy of the maximum principle for optimal control problem with state constraints.// SIAM Journal Control Optimization. Vol. 35. No 3. pp. 930-952.1997.

ческого программирования16 и его обобщения17 (численная реализация этих методов сопряжена, вообще говоря, с большими размерностями вычислений). Большая серия работ посвящена изучению корректных дискретных аппроксимаций, позволяющих получать приближенные решения задач оптимального управления посредством решения конечномерных задач математического программирования18. Развиваются методы, ориентированные на решение

10

различных типов задач оптимального управления .

Многие задачи оптимизации, как известно, некорректны: малые возмущения их данных могут вести к большим отклонениям решений20. Построение методов регуляризации оптимизационных задач - нахождения их устойчивых приближенных решений на основании возмущенных данных - составляет обширный раздел теории некорректных задач.

Материал настоящей диссертации примыкает к работам4 21 22 23 24 25 и др., развивающим методы решения обратных задач динамики и задач оптимизации исходя из регуляризации известного в теории позиционного управления принципа экстремального сдвига H.H. Красовского 26.

Задача (1) ранее рассматривалась23 24 в предположении что функция F(p, х) линейна по аргументу х, был построен основанный на принципе экстремального сдвига итерационный метод ее решения, указано его приложение к решению линейной задачи быстродействия с фазовыми ограничениями и приведен соответствующий регуляризирующий алгоритм.

В данной работе функция F[p,x) полагается, вообще говоря, нелинейной, но удовлетворяющей ряду ограничений, наиболее существенным из которых выступает условие выпуклости множеств F(p, Х(р)). Последнее условие поз-

16Беллман Р. Динамическое программирование. M.: ИЛ. 1960.

17Н.Н.Субботина H.H. Метод характеристик Копги н обобщенные решения уравнений Гамильтона-Якоби-Беллмаяа.// Доклады АН СССР. т. 320. № 3. С. 556-561.1991.

"Васильев Ф.П. Методы решения экстремальных задач. М.: Наука. 1981.

1йМатвеев A.C., Якубович В.А. Невыпуклые задачи глобальной оптимизации.// Санкт-Петербургский Математически» Журнал. 1993. т. 4.. № 6. С. 1217-1243.

^Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука. 19S6.

21Кряжимский A.B., Осипов Ю.С. К регуляризации выпуклой экстремальной задачи с неточно заданными ограничениями. Приложение к задаче оптимального управления с фазовыми ограничениями.//

Некоторые методы позиционного и программного управления. УНЦ. Свердловск. 1987.

23Кряжимский A.B., Осипов Ю.С. Экстремальные задачи с отделимыми графиками.// Киберн. сист. анал. 2002. No 2. С. 32-55.

a3Kryaahimskii A.V., Paschenko S.V. On the problem of optimal compatibility. J. Inv. Ill-Posed Problems. 2001. Vol. 9. No 3. pp. 283-300.

24Кряжимскяй A.B., Пащенко C-B. К решению линейной задачи быстродействия со смешанными ограничениями.// ВИНИТИ. Итоги науки и техники. Сер. Современная математика и ее приложения. 2002. т. 90. С. 232-260.

25Kryazhimsky A.V. Convex optimization via feedbacks.// SIAM Journal Control Optimization. 1999. Vol. 37. No 1. pp. 278-302.

2вКрасовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука. 1974.

воляет путем подходящей рандомизации аргумента сконструировать вспомогательную оптимизционную задачу с линейным ограничением-равенством, в определенном смысле эквивалентную задаче (1). Для вспомогательной задачи строится итерационный метод решения, обобщаяющий метод, предложенный для линейной задачи23 и устанавливается сходимость генерируемой им последовательности к решению исходной задачи (1). Предложенный метод конкретизируется применительно к некоторым частным случаям, включающим задачи оптимального управления со смешанными ограничениями. В конце работы конструируется связанный с этим методом регуляризирующий алгоритм.

Цель работы. Цель работы состоит в разработке и исследовании итерационного метода решения задачи поиска оптимального параметра совместности для класса уравнений в нормированном пространстве; в применении полученного метода к решению задач оптимального управления; в разработке и исследовании алгоритма регуляризации для задачи поиска оптимального параметра совместности в случае неточного задания входных данных.

Основные результаты работы.

1). Предложен итерационный метод поиска наименьшего значения скалярного параметра, при котором зависящее от этого параметра уравнение в нормированном пространстве имеет решение в заданном множестве, которое, вообще говоря, также зависит от параметра. Доказана сходимость метода.

2). Рассмотрено приложение данного метода к решению двух задач оптимального управления - задачи быстродействия со смешанными ограничениями и задачи оптимизации смешанного ограничения для некоторых классов, вообще говоря, нелинейных управляемых систем.

3). В случае неточного задания входных данных задачи предложен алгоритм регуляризации для задачи поиска оптимального параметра совместности.

Методы исследования. В работе используются элементы функционального анализа, теория многозначных отображений, теория мер, выпуклый анализ, теория некорректных задач.

Научная новизна, теоретическая и практическая ценность работы. Результаты работы дополняют теорию невыпуклой оптимизации. В работе рассматривается класс невыпуклых задач оптимизации и предлагается конструктивный метод решения. Рассматриваются приложения к задачам оптимального управления.

Апробация работы. Результаты работы были представлены в виде докладов на семинаре кафедры оптимального управления факультета ВМиК

МГУ (руководители семинара академик РАН Ю.С. Осипов, профессор М.С. Никольский); научном семинаре "Математические модели в экономике и экологии", Химки, 27-29 января 2004 г.; международном семинаре "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби (CGS'2005)", Екатеринбург, 22-26 июня 2005 г.; научном семинаре "Математическая теория оптимального управления и теория дифференциальных включений", Москва, 12-13 октября 2006 г.

Публикации. Основные результаты диссертации опубликованы в работах [1] - [5]. Все результаты, вошедшие в диссертацию и в перечень опубликованных работ, получены автором самостоятельно.

Структура и объем диссертации. Диссертация состоит из введения, трех глав и библиографии. Общий объем диссертации 129 страниц, включая 12 рисунков. Библиография содержит 105 наименований.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении раскрываются цели и задачи работы, ее актуальность, а также кратко описываются основные результаты, полученные в работе.

В главе I рассматривается задача оптимизации вида (1), где •) -функция из [pojï>°] х.Хо в У (здесь ро, р° - некоторые действительные числа, такие, что ро > р°, Хо - некоторое непустое множество, выделенное в нормированном пространстве X, Y - гильбертово пространство); Ь(-) - функция из [ро,Р°] в F и Х(р), р 6 [Р0>Р°] -однопараметрическое семейство подмножеств множества Хо. Задача (1) требует, таким образом, найти минимальное значение параметра р 6 [р(ьр0]> при котором система уравнений F(p>x) = b(p) является совместной в Х(р).

Предполагается, что для задачи (1) существует допустимый элемент. Оптимальное значение задачи (1) обозначается через р», множество всех ее решений (р,, xt) - через {р,} х X,.

Задача (1) рассматривается при следующих основных условиях:

(Al) многозначное отображение р i—* X(р) непрерывно в том смысле, что если Xk € Х(рк) (к = 0,1,...) рк —► р и хк -+ х, то х е Х(р);

(А2) функции р I-+ Ь(р) и (р, х) F(p, х) непрерывны;

(A3) для любой последовательности (pk,Xk) из [ро>Р°] х -^о такой, что l-^CPt» хк) — Ь[рк)\у —+ 0 и Pk—>p, последовательность (х^) компактна в X.

В диссертации показано, что при выполнении условий (Al) - (A3) решение задачи (1) существует.

Далее на задачу (1) накладывается следующее условие, в дальнейшем играющее решающую роль:

(A4) для каждого р е [ро.Р*] множество F(p, Х(р)) = {F(p, х): х е Х(р)} выпукло.

Условие (A4) позволяет путем рандомизации аргумента1 сконструировать задачу с линеаризованным ограничением-равенством, в определенном смысле эквивалентную задаче (1). Пусть Е - множество всех подмножеств пространства X. рассматриваются вероятностные меры ß на Е, являющиеся конечными выпуклыми комбинациями точечных мер Дирака27:

го т

ß = y^aAj, ai>0, = хи...,хтеХо. (2)

i=l 4=1

Через М обозначим множество всех мер ß на Е вида (2). При всяком р € [ро,Р°] и всяком ß € М вида (2) положим

/и ■ го

F(p, x)ß{dx) = F&> x)5*Xdx) = aiF&>*<)•

t=l J ¿=1

При этом F(p,Sx) = F(p, x) (p g [po,P°], x 6 Xq) и, таким образом, при отождествлении 5Х с х (х £ Хо), функция F(-, •) распространяется с [ро,Р°] X на [Ро>Р°] х Л/. Легко видеть, что при каждом р е [ро>Р°] функция ц > F(p,p) на М линейна в том смысле, что для любых ß\, ß2 £ М и любого А € [0,1] верно

F(p,\ßi + (1 - АЫ = АF(p,Ml) + (1 - X)F(p,ß2).

Для каждого р 6 [ро>Р°] введем множество М[р) = {ß е М : ß(X(p)) = 1} и рассмотрим следующую расширенную задачу оптимизации:

р —* min,

F(p,ß) = b{p), . .

ß € M(p), l j

P € [P0,P°]-

Теорема. Пусть выполнены условия (AI) - (A4). Тогда

1) оптимальные значения задан (1) и (4) совпадают,

2) если (р„, £„) - решение задачи (1), то {р*, 5Х,) - решение задачи (4)-Равенство оптимальных значений задач (1) и (4) используется для построения итерационного алгоритма решения задачи (1) при некоторых дополнительных условиях:

27Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М-: Наг ука. 1Э77.

(А5) многозначное отображение р Х(р) монотонно возрастает на [ро, р.], т.е. X(pi) С X(pi) при любых рх € [ро.р*], Рг е [pi,p»J;

(А6) для каждого р € [ро,р*] множество F(p,X(p)) замкнуто в У;

(А7) для любого е > 0 существует 6 > 0 такое, что для всяких рх е [Ро,Р*], Рг 6 [pi,p»j таких, что рг — Pi < & и всякого я £ X(pi) выполняется

(А8) множество Upe[po,p.] F(p> Х(р)) ограничено в У;

(А9) при всяком I е У функция р >-+ c(l\F(p,X(p))) непрерывна на [ро,Р*] (здесь и далее c(-|W) - опорный функционал непустого множества W С У).

Обозначим R(p,ß) = {х е Х(р) : F(p,x) = F(p,ß)} (р € [ро,Р°], ß € М(р)). Заметим, что условие (A4) влечет, что R(p,ß) ф 0 для всяких р е [ро,р,] и ß е М(р).

Предлагаемый итерационный алгоритм решения задачи (1) осуществляет последовательный пересчет тройки (j>k, ßkixk), где (рь,х¡¡) е [ро>р0] х ^о есть текущее приближение решения задачи (1) и ßk £ М - вспомогательный элемент, связанный с расширенной задачей (4).

Итак, рассмотрим следующий итерационный алгоритм. На нулевом шаге выбираются

ßo£M(po), xq € R(j>o, ßo) (5)

и тройка (poi ßo, xa) принимается в качестве начального элемента последовательности. На шаге к+1 по элементу (pk,ßk,Xk) задается элемент (pk+i,ßk+i, Xjt+i). Именно. Находится решение (pjt+i, ¡•'t+i) следующей задачи минимизации:

Р Р

{F{Pk,ßk) v

определяется

тк+1 = arg min \F(pk+i, (1 - r)ßk + ri/jt+i) - Ь(р*+1)||- (7)

re[0,ij

и полагается

ßk+i = (1 - Tk+i)ßk + Tk+iVk+u (8)

Xk+i € R(Pk-n,ßk+i) при R(pk+ußk+i) ф 0, e X(pk+i) при R(pk+i,ßk+1) = 0-

Лемма. Пусть выполнены условия (AI) - (А6) и (А9). Тогда последовательность (рк> ßk, хк) определена условиями (5) - (9) корректно, т.е. при

—> min,

6 [р*.Р°].

- b{pk),F(p,u)-b{p))Y< О,

G М(р);

всяком k = 0,1,... задача (6) имеет решение (pk+u^k+i) и элемент rk+i (7) существует. Более того, при каждом k = 0,1,...

Ро < • ■ ■ < Рк < ■ ■ ■ < Р., цк € М(рк), хк 6 R(pk, йь)-

Основной результат первой главы сформулирован в следующей теореме. Теорема. Пусть выполнены условия (Al) - (А9) и последовательность (j>k,l¿k,xk) задана алгоритмом (5) - (9). Тогда Рк р* и dist(xt, —* 0.

Алгоритм (5) - (9) допускает упрощенную форму, позволяющую перейти от пересчета мер (8) к пересчету дополнительных "вспомогательных" элементов из X, и в которой задача (6) имеет упрощенную форму, а именно, сводится к задаче скалярной оптимизации с последующим вычислением экстремального элемента в пространстве X.

Рассмотрим следующий итерационный алгоритм, осуществляющий пересчет элементов (рк, ..., a¡,k\ v0,..., vk, хк), где

Рк £ [PoiP°]) 6 [0,1], v0,...,vk,xk e XQ.

На нулевом шаге полагается

£*о0) = 1, ж0 G Х(р0), v0 = ar0, (10)

и набор (ро, vo, x¡¡) выбирается в качестве начального элемента последовательности. На шаге к + 1 по набору (рк, ..., а[к\ vq, ..., vk,xk) находится набор (pjt+i, ■ • • i а^1', vq,...¡ vk+i,xk+i). Именно. Полагается

к

^ = (11) «=1

Vb(p) = c(lk\F(p, Х(р))) - (lk, b(p))Y (р € [РЬР°]) (12)

и находятся число

pjt+i = min{p € \рк,р°] : Мр) > 0} (13)

и элемент

vk+1 € Х(рм) (14)

такой, что

(lk,F(Pk+u vk+1))Y = c&IFGfc«, Xfab+O)). (15)

Значение определяется из

т _ 1 3 ?*+1сГП11 -г* ... (Як+и Ъ(рк+1) - Р(рк+ь /х0)у тая-1=< тк+1, 6 [0,1], тм =-г——р-- (16)

I тк+1 > У

(чк+1 = Р(рк+и Щ+г) - а\к)Г(рк+1, г>0 ф ,

гц.1€[0,1] Ы1-0). (17)

Полагается

= (г = 0,..., Л), = (18)

Элемент х^-ц находится из

г*+1 е Р~1(рк+и'Шк+1) при ^ 1(рш,гиц+1) ^ 0, е Х(рш) при Р"1(Р/=+ьги*:+1) =

(19)

где

А+1

= а?)р(Рк+1. (20)

¿—О

^-»(р,ш) = {X 6 Х(р) : ^(р,х) = (21)

Основная операция на шаге к Н- 1 указанного алгоритма, таким образом, сводится к решению одномерной задачи минимизации (13) и последующему нахождению экстремального элемента (14) - (15). Операция (19) - (21) по нахождению приближения хк+1 компоненты решения (из множества X,) может быть достаточно трудоемка. Ее можно опустить, если нас интересует приближение лишь оптимального значения р, задачи (1).

Теорема. Пусть выполнены условия (А1) - (А9) и последовательность (рк, а®, • • • > ^01 • • ■) г-'ь задана алгоритмом (10) - (21). Тогда рк —» Pt и ¿¡вЦжь, X*) —* 0.

Основной алгоритм (5) - (9) (или эквивалентный ему алгоритм (10) - (21)) решения задачи (1) требует, вообще говоря, бесконечного расширения текущей памяти. В конце первой главы I показано, что в случае независимости от параметра р значений Г(р,х) оператора уравнения Г(р, х) = Ь(р), входящего в задачу (1), алгоритм (10) - (21) можно модифицировать так, что вычисления потребуют постоянного объема памяти; там же приведена эта модификация.

В главе II рассматриваются приложения предложенного в главе I алгоритма к решению двух задач оптимального управления с фазовыми ограничениями.

В разделе 2.1 рассматривается задача быстродействия для п-мерной дифференциальной управляемой системы

z(t) = f(z{t),t) + g(z(t),t)u(i), (22)

функционирующей на отрезке времени [О, Т\ (Т > 0), из заданного начального состояния 2° € FC1 в заданное конечное состояние z1 е Rn при смешанном геометрическом ограничении (z(t),u(t)) е Q(t) (t £ [0,!Г]) на фазовую переменную z(t) и то-мерную управляющую переменную u(t).

Рассматриваемая задача быстродействия может быть записана в виде экстремальной задачи

р —► min, z(p) = г1, (23)

(z(-),u(-)) 6 П,

где П - множество допустимых управляемых процессов. Обозначим оптимальное значение задачи (23) - время быстродействия - через р*, а множество всех ее решений - через {р*} х ГЦ, где П. С П. Задача (23) рассматривается при следующих условиях: (В1) (z, t) f(z, t) и (z, t) ь-+ g{z, t) - непрерывные функции на Rn х

[о ,П;

(В2) Q(i) - выпуклое, замкнутое и ограниченное подмножество Rn х Rm для всех t 6 [0,Т];

(ВЗ) многозначное отображение t ь-> Q(i) измеримо27; (В4) множество Ute[o Т) QM ограничено.

В дисертации показано, что при выполнении условий (Bl) - (В4) решение задачи (23) существует.

Сведем задачу (23) к оптимизационной задаче вида (1). Введем гильбертово пространство

У = L2([0,T), Rn х Rn) (24)

и нормированное пространство

X = L2([0,T], Я") х ЬЦ[0,Т\, Rm), (25)

где ([0, Г], üm) есть пространство £2([0, Т], Л"1), снабженное слабой нормой26. В L2([0, Т], Л") х L2([0, Г], Rm) выделим некоторое ограниченное множество

Ха такое, что все допустимые управляемые процессы х — (г(-), «(•)) лежат в Х(, (такое множество существует в силу условия (В4)). Для каждого ре [О,Г] положим

Я(р,*)(«) = - ¡'и^тЪ^+дШ^и^т {г е [0,Т]), (26) Jo

*® + ЯиШ,т) + дШ,т)иШт (t 6 M)

2{P' Д ' ~ \ Ф) ~ Гр(№т),т)+9Ш,т)и(т))с1т (t € [р.Т]) [ П

(*=(*(•),«(•)))

и введем функцию (р, а;) >—> F(p, ж) : [О, T] х Xq i-> Y, полагая

F(p,x) = F(p,x)(-) = (Fi(p,x)(-), Fiip,£)(■))• (28)

Зададим b = (bi(-), ¿>г(-)) S ^ условиями

bi(0 = A MO-*1 (te M). (29)

Наконец, введем множество

G = {a; = («(•),«(.)) S X0 : (z(i),«(t)) € Q(t) (i £ [0,T])}. (30)

Теорема. Задача (23) и задача (1), где Х(р) — G, Ь(р) — Ь, эквивалентны в следующем смысле:

(i) оптимальные значения задач (23) и (1) совпадают;

(п) пара (р*,х) € [0,Т] х Хо, где х = (г(-), «(•)), решает задачу (1) тогда и только тогда, когда найдется оптимальный управляемый процесс (z,(-),u»(-)) такой, что (z(t),u(t)) = (zt(t),u,(t)) при п.в. t е [0,Т].

Далее задача (23) рассматривается при следующем дополнительном условии

(В5) при каждом р € [0,pt] множество F(p,G) = {F(p,x) : х Ç G} выпукло.

Следующая лемма обосновывает возможность применения алгоритма (5) -(9) (или эквивалентного ему алгоритма (10) - (21)) для решения задачи (23) с помощью эквивалентной ей оптимизационной задачи (1), где пространства X и Y определены по (25), (24), Х(р) = G задано по (30), b(p) = Ь определено по (29), F(-, •) имеет вид (26) - (28).

Лемма. Пусть для задачи (23) выполнены условия (Bl) - (В5). Тогда для эквивалентной задачи (1) выполнены условия (Al) - (А9).

Таким образом, с помощью алгоритма (10) - (21) строится алгоритм решения задачи (23). Утверждается его сходимость к множеству решений задачи (23).

В конце раздела 2.1 приводятся результаты численного решения задачи быстродействия для модели одноногого робота в фазе полета28.

Раздел 2.2 посвящен приложению общего алгоритма, описанного в главе I, к задаче оптимизации смешанных ограничений для n-мерной дифференциальной управляемой системы (22). В этом разделе предполагается, что фазовая переменная z(t) и m-мерная управляющая переменная u(i) удовлетворяют фазовому ограничению, зависящему от скалярного параметра ре [Ро,Р°] =

(z(t),u(t)) € Q(p,t) (t е [0,Т], р € [ро.р0]).

Рассматривается задача нахождения наименьшего значения параметра р € [ро.р0] при котором существует управляемый процесс (z(t),u(t)), удовлетворяющий указанному ограничению:

р —+ min,

Р 6 [ро,Р°], (31)

(*(•),"(•)) 6 П(р),

где П(р) - множество всех р-допустимых управляемых процессов, т.е. таких управляемых процессов, что для п.в. t € [О,!1] выполняется (z(t),u(t)) €

Q(p,t).

Задача (31) рассматривается при следующих условиях:

(CI) (z,t) I—> f(z,t) и (z,t) t-> g(z,t) - непрерывные функции на Rn х

[0,71;

(С2) Q(p, t) - выпуклое, замкнутое и ограниченное подмножество Rn х ff для всех р 6 ¡р0,р°] и t € [0,Т];

(СЗ) многозначная функция t i—> Q(p,t) измерима при всех р £ [ро,р0]; многозначная функция р >—► Q(pt t) непрерывна при всех t € [0,Т], то есть если (zk,uk) € Q(pk,t) (к = 1,2,...) и рк р, zk z, ик й, то (z,ü) е Q(p,t);

(С4) множество U(p,i)c[po,p0j*[o,r] Q(P> ограничено;

(С5) для любого t 6 [0, Т] многозначная функция р > Q(p, t) монотонно возрастает, то есть Q(pi,t) С Q(j>2,t) при любых pi > ро, Р2 > Pi-

В диссертации показано, что при выполнении условий (С1) - (СЗ), (С5) решение задачи (31) существует.

28Мигтау R.M., Li Z., Sastry S.S. A Mathematical Introduction to Robotic Manipulation. CEC Press. 1994.

Далее исходная задача вновь сводится к задаче вида (1) в нормированном пространстве X = L2({0,T\,Rn) х L„([0, Т], Rm). На рассматриваемую управляемую систему накладывается дополнительное требование (Сб) вы-пуклозпачности образов F(p,X(p)) (р е [0,Т]), где F(-, •) - интегральный оператор системы (22), Х(р) - множество управляемых процессов (z(-), tt(0)> удовлетворяющих смешанному ограничению (z(t),u{t)) 6 Q(p,t) (i € [О,Г]). Показывается, что условия (CI) - (С6), выполненные для задачи (31), гарантируют выполнение условий (AI) - (А9) для соответствующей эквивалентной задачи вида (1), что дает возможность применить алгоритм (10) - (21) для решения задачи (31). Дается конкретизация этого алгоритма для решения задачи (31) и утверждается его сходимость к множеству решений задачи (31). Приводится результаты численного решения задачи оптимизации фазовых ограничений для модели технологического роста Японии во второй половине XX века29.

В главе III задача (1) рассматривается при неточных входных данных F(-, •), б(-) и Х(-), отклоняющихся от неизвестных точных данных не больше, чем на заданные известные величины погрешностей hF, hb, hx > 0, т.е.

\F(p,x)-F(p,x)\y < hF (p € [P0iP°]> x 6 удаР),г]р*о), (32)

¡Ь(р) — Ь(р)|г < hb (p € [po,p0]), (33)

*(p)cv£[*(p),c/i*], (pe[p0,p0])- (34)

В (32) и далее I - фиксированное положительное число и Vx [A'i, Л] - замкнутая Л-окрестность множества Xi в пространстве X (h > 0); в (34) и далее для непустого множества Xi С Хо и любого h > 0 множество таково, что

XtCVZlX^chjcVxlXuh], где с > 0 — не зависящий от Х\ и h параметр, причем

если X] С Х2, то V£[Xb h] С V$[X2, ft]; (35)

если Х2 С V^[XU /ij] и Хз С V$[X2, h2], то Х3 С + h2]

(36)

(условия (35), (36) позволяют трактовать как некоторую /г-окрестность

множества .Xi).

Пусть D - какое-либо непустое множество троек (F(-, ■), fc(-), Х(-)), где F(-, •), b( ) и Х{-) введены также, как и в главе I. Будем полагать, что существуют такие L > 0, Л > 0, что для всех {F(-, •), b(-),X(-)) 6 D

_]F(p,x)-kp)\r< L (ре [po,P°], * e Vj[X(p),eA]). (37)

2öKryazMmsky A., Watanabe Ch. Optimization of Technological growth. Gendaitosho. 2004.

Пусть в Ь выделено некоторое непустое подмножество Б, каждый элемент •), Ь(-),Х(-)) которого удовлетворяет условиям (А1) - (А9). Кроме того, предполагаем выполненным следующее условие на класс И :

(А10) существует функция «(•) : [0, оо) н-> [0, оо) такая, что к(К) —► 0 при Л —» 0 и для всех •),&(•)> ■*"(•)) е р € [ро,Р°] и Ь > О

Р(р, Ух1х(р)Л]) с ЪИПр, Х(р)), к(Л)]; (38)

здесь и далее Уу [У1, /г] - замкнутая Л-окрестность множества У! в пространстве У (Л > 0).

Всякую задачу (1) такую, что •), Ь(-),Х(-)) 6 £>, будем называть допустимой; при этом тройку •), £(•), Х(-)) будем называть данными этой задачи. Множество всех •), Ь(-),Х(-)) £ £>, удовлетворяющих (32) - (34), при заданном (^(-,-),Ь(-),Х(-)) € Б, будем обозначать через ¿>(ЬР, /г.6, Их\

П-.-).ь(-),*(■))•

Заметим, что приближенные данные •),&(•), Х(-)), вообще говоря, выходят за пределы множества Г> и, таким образом, задача (1), данные которой заменены на приближенные данные (Р(-,-),Ъ(-),Х(-)), вообще говоря, не является допустимой; в частности, для такой задачи может быть пустым множество ее допустимых элементов.

Семейство операторов, действующих из 13 в \ро,ра] х

Хо, называется регуляризирующим алгоритмом, если для любых допустимых данных (Р(-,-),Ь(-),Х(-)) £ 2?, любых сходящихся к нулю неотрицательных последовательностей (Н^), {к^ и любой последовательности №('.•). такой, что

($(.,-),Ы-),ХА-)) е Щ,Щ,Що,К-),Х(-)) С? = 1,2,...),

последовательность вида

(р,, = "). Ы\> (З = 1,2, • • ■)

сходится к множеству {р.} х X* всех решений допустимой задачи (1) с данными •), £>(•), Х(-)), то есть

РЗ Р*1 «^(х^, X,) -»0 {] —» оо).

Построим теперь искомый регуляризирующий алгоритм, представляющий собой определенную модификацию метода невязки20.

Следующая лемма является основой конструкции искомого регуляризиру-ющего алгоритма.

Лемма. Пусть

(1) (Е(-,-),Ь(-),Х(-)) € И, (к?), (/»'), (И,*) - сходящиеся к нулю неотрицательные последовательности и

(^ЫЛ(-)Л'(-)) е£(А?,л$.ь?И'>0,КО,Х(.)) и = 1,2,...),

(и) р* - оптимальное значение релаксированной задачи

р -* п^, \Р^,х)~Ь,(р)\у < + Ь», * €

р е [ро.р0] О" = 1,2,...),

(Ш) Р} € [р0,Р°] и X] е с/г^] таковы, что

Р1<Р1+Ъ, (39)

+ + О'= 1,2,...), (40)

где

Р.и шз 0 и

Тогда последовательность (р_,-, х3) сходится к мнооюеству {р„} х X» всех решений задачи (1) с данными (Р(-,-),Ь(-),Х(-)) :

Р] —► р», ЛГ») -+ 0 (з -* оо).

Сформулируем теорему о построении регуляризирующего алгоритма. Зафиксируем произвольные положительные функции «;(•, •, ■), £(•, •, •) трех неотрицательных аргументов такие, что ги(/гг, Л', Кх) —♦ —> 0 при Л6, Ьх —► 0. Также зафиксируем функцию

¿(Лр, Л\ йх) = МЛ*", Ль, А*)2Х + 2ЩР + Нь) + (кГ + Ль)2, (41)

где

б^Ь?, Нх) = 2Ь (ЦДЛ' + Л6) + (2/1* + к(Л*))£)4 +

иь{}Iе + Л») + (21гх + к(Л Х))Ь. (42)

Для произвольных Ь.х > 0 введем оператор Д^г^х, действующий

из Ь в [ро,р°] х Хо, следующим образом. Пусть •), $(•), Х(-)) 6 £>■ Если не существует тройки (2?(-, О, КО, Х(-)) € £) такой, что

(£(-,.), 6(0.■*(■)) € (43)

(такой случай при правильном задании погрешностей приближенных данных не реализуется, его описываем лишь для соблюдения формальной строгости изложения), то

(р,£) = (44)

полагается произвольным элементом из [рсьр0]*-^«)- Если тройка *), б(-), Х(-)) € £>, удовлетворяющая (43), существует, то (1) рассматривается релаксированная задача

р inf,

|F(p,x)-S(p)|y < hF + h\

х 6 V%[X(jp),chxl

p e [po,P°],

(45)

для которой, с помощью модификации метода, предложенного в главе I для решения задачи (1) (см. (10) - (21)), строится последовательность (р*, а^',.. ■, с*£\ 1)к) (см. ниже (46) - (53)) и находится такой номер к, что выполняется

¿(^/■(р^-й&ъ)

i=0

< Ss(hF, hb, hx) + (Л' 4- hb) + w(hF,h\hx)\

(ii) определяется такой, что x~k € Vx[X(pf.), hx]:

К

< inf

+ ahF,h\hxy,

i=0

(iii) значение (p, x) (44) полагается равным (p~k, x-k). Следующая теорема содержит основной результат данного раздела: Теорема. Семейство (RhF,hb,hx)hF,hb,hx>о есть регуляризирующий алгоритм.

Приведем формулировку итерационного алгоритма, необходимого для решения релаксированной задачи (45) на этапе (i). Алгоритм осуществляет пересчет элементов (р*, а^,..., а^, t>o,..., i>*), где

Рк>Ро, ...,G [0,1], vo,...,^ 6-Х"0.

На нулевом шаге выбираются

ийе^АГЫ.ал*], 40) = 1 (46)

и набор (ро, *Ль ао°'>) выбирается в качестве начального элемента последовательности. На шаге к + 1 по набору (рк, .. ■, ук), находится набор (рк+1, ..., а^1^, но,..., 1^+1). Именно. Полагается

к

г* = Вы - (рк,ц), (47)

1=1

фк(р) = с(1к\р(р, скх)) - (к,Ь(р))¥ (Р € [Рь р0]) (48)

и находится число

рк+1 = Ш {р е \рк,Р°] : фк(р) > -¿(А* + кь)}. (49)

Далее определяется элемент ук+\ € такой, что

(к Р(рк+иук+1) - Ь(рк+1))у > + Ы>)Ь - (2кх + к(кх))Ь. (50)

Значение тк+г определяется из

т _(?' 2 ГП 11 (Я^икрм) - Е1о ьч))у

м - *г у 11 1--м

V к+1 > 1>

(51)

тм € [0,1] (й+1 = 0). (52)

Полагается

^+1) = (1-т,+1)а,(к) (г = 0,..., к), = т*+1. (53)

Лемма. Пусть (Г(;.),Ь(-),Х(-)) € £>, (£(-,■), Ь(-),Х(-)) е Г(-,-),Ь(-),Х(-)) и последовательность (рк,о^\...,а^\ьк) определена алгоритмом (46) - (53). Тогда

Рк [р0,р.] (А; —► оо)

к

к—оо —' г=0

где ¿(-,-,-) определена по (41), (4%)■

В конце главы III дается приложение построенного регуляризирующего алгоритма, к задаче быстродействия (23) при неточно заданных входных данных.

Автор выражает глубокую благодарность своему научному руководителю Аркадию Викторовичу Кряжимскому за постоянное внимание к работе.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

[1] Ровенская Е.А. К решению задачи быстродействия с фазовыми ограничениями для простейшей модели прыгающего одноногого робота.// Сборник "Нелинейная динамика и управление". М.: Изд. МГУ. 2005. № 5.

[2] Ровенская Е.А. К решению задачи быстродействия со смешанными ограничениями для некоторого класса управляемых систем.// Теория управления и обобщенных решений уравнений Гамильтона-Якоби: Тезисы докладов международного семинара. Екатеринбург, Издательство Уральского Университета. 2005. С. 133-135.

[3] Ровенская Е.А. К решению задачи об оптимальном параметре совместности для одного класса уравнений в банаховом пространстве. Журнал вычислительной математики и математической физики.// 2004. т. 44. № 12. С. 2150-2166.

[4] Ровенская Е.А. О задаче оптимизации фазового ограничения для линейной управляемой системы.// Математические модели в экономике и экологии: Материалы научного семинара. М.: МАКС Пресс. 2004. С. 7578.

[5] Ровенская Е.А. О численном методе решения задачи быстродействия с фазовыми ограничениями для простейшей модели прыгающего одноногого робота.// Проблемы динамического управления: Сборник научных трудов факультета ВМиК МГУ им. Ломоносова. Под ред. Осипова Ю.С., Кряжимского A.B. М.: Издательский отдел факультета ВМиК МГУ. 2005. Вып. 1. С. 253-267.

Напечатано с готового оригинал-макета

Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12.99 г. Подписано к печати 21.11.2006 г. Формат 60x90 1/16. Усл.печл. 1,25. Тираж 70 экз. Заказ 824.

119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 627 к. Тел. 939-3890,939-3891. Тел./факс 939-3891.

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Ровенская, Елена Александровна

Введение

1 Постановка задачи и алгоритм решения

1.1 Исходная и расширенная задачи.

1.2 Дополнительные условия и алгоритм решения.

1.3 Конкретизация алгоритма.

1.4 Случай оператора, не зависящего от параметра.

 
Введение диссертация по математике, на тему "К решению задачи об оптимальном параметре совместности для некоторого класса уравнений в нормированном пространстве"

В диеертации рассматривается оптимизационные задачи вида: р —> min, FM = Ь(р), х е Х{р), Р > РоВ задаче (1), требуется найти наименьшее значение скалярного параметра р, при котором зависящее от этого параметра уравнение F(p,x) = b(p) имеет решение в пределах заданного множества Х{р)] нахождению подлежит также само это решение. Подобные постановки возникают в разного рода прикладных задачах (задачи оптимизации сетей страховых компаний, задачи оптимизации портфелей инновационных проектов - см., напр., [85,88]), а также при исследовании параметрических семейств операторных уравнений [88]).

Диссертация посвящена построению и исследованию одного итерационного метода решения задачи (1) (пространство аргументов х считается, в общем случае, бесконечномерным). При рассматриваемых в работе ограничениях оптимизационная задача (1), является, вообще говоря, невыпуклой. Предложенный итерационный метод конкретизируется применительно к некоторым задачам оптимального управления.

Известно, что для решения невыпуклых задач оптимизации стандартные методы, например, градиентного типа (см. [12], [55], [32], [29]) могут быть не применимы. Известен также ряд общих подходов, применимых для решения широкого класса оптимизационных задач - методы штрафных и барьерных функций (см., напр., [12], [77]); гомотопические методы (см., напр., [97]); методы стохастической оптимизации [52]). Подходы этого класса, обладая значительной общностью, сопряжены, однако, с проблемой их конструктивной реализации при решении конкретных задач.

Тип невыпуклой задачи обычно создает специфические трудности па пути обоснования конструктивных алгоритмов решения. В связи с этим развиваются специализированные подходы, ориентированные на решение; конкретных типов задач певыпуклой оптимизации (см., напр. [9G|). Для некоторых классов задач, в определенном смысле близким к выпуклым, известны итерационные алгоритмы решения, использующие операции с функцией Лагранжа (см., напр., [79], [2]). В [G7-G9] предложен подход к итерационному решению оптимизационных задач, невыпуклость которых определяется присутствием в них разностей выпуклых функций. В [3] развиваются методы оптимизации, основанные на игровых моделях.

Широко исследуемый класс задач оптимизации составляют задачи оптимального управления. Центральным инструментом анализа таких задач является принцип максимума Понтрягипа [50]. Во многих случаях он позволяет получить окончательное решение задачи либо выявить его аналитическую структуру. Все же значительное число задач оптимального управления находятся за пределами сферы эффективного применения принципа максимума Понтрягипа. К числу таких задач относятся, прежде всего, задачи оптимального управления с фазовыми (а также смешанными) ограничениями: для них принцип максимума Понтрягипа имеет усложненную форму и трудно поддается аналитическому исследованию в конкретных ситуациях. Другой универсальный подход к решению задач оптимального управления, в том числе, с фазовыми ограничениями, объединяет метод динамического программирования [8], [11], [18], [21,22], [30,37], [05] и его обобщения (численная реализация этих методов сопряжена, вообще говоря, с большими размерностями вычислений). Большая серия работ посвящена изучению корректных дискретных аппроксимаций, позволяющих получать приближенные решения задач оптимального управления посредством решения конечномерных задач математического программирования (см. [70], [13], [48]). В [94], [57[ - [03] развиваются методы, ориентированные на решение различных типов задач оптимального управления.

Многие задачи оптимизации, как известно, некорректны: малые; возмущения их данных могут вести к большим отклонениям решений |12|. Построение методов регуляризации оптимизационных задач - нахождения их устойчивых приближенных решений на основании возмущенных данных - составляет обширный раздел теории некорректных задач [71], [20[, [45], |1,4|, |9|, [?, 12,15,10], [20|, [23], [24|, [28|, [31], [44|, [50], [51[, [01], [72,73[.

Материал настоящей диссертации примыкает к работам [38| - |43|, |82|

- [93], развивающим методы решения обратных задач динамики и задач оптимизации исходя из регуляризации известного в теории позиционного управления принципа экстремального сдвига H.H. Красовского [35]. Задача (1) ранее рассматривалась в [40,87,90], где, в предположении что функция F(p,x) линейна по аргументу х, построен основанный на принципе экстремального сдвига итерационный метод ее решения, указано его приложение к решению линейной задачи быстродействия с фазовыми ограничениями и приведен соответствующий регуляризирующий алгоритм.

В данной работе функция F(p,x) полагается, вообще говоря, нелинейной, но удовлетворяющей ряду ограничений, наиболее существенным из которых выступает условие выпуклости множеств F(p, Х(р)). Последнее условие позволяет путем подходящей рандомизации аргумента (см. [89|) сконструировать вспомогательную оптимизционную задачу с линейным ограничением-равенством, в определенном смысле эквивалентную задаче (1). Для вспомогательной задачи строится итерационный метод решения, обобщаяющий метод, ранее предложенный в [91], и устанавливается сходимость генерируемой им последовательности к решению исходной задачи (1). Предложенный метод конкретизируете применительно к некоторым частным случаям, включающим задачи оптимального управления со смешанными ограничениями. В конце работы конструируется связанный с этим методом регуляризирующий алгоритм.

В главе I рассматривается задача оптимизации вида (1) в нормированном пространстве X. В разделе 1.1 на нес накладываются такие основные требования, как требования непрерывности многозначного отображения р н-> Х(р) и функций р I—> b(p), {р,х) и-> F(p,x), а также требование того, что функция (р, х) н-> F(p,x) — Ь(р) является компактифнкатором (см. [89]) (условия (AI) - (A3)). При данных условиях устанавливается существование решения задачи (1) (следствие 1.1).

Далее накладывается упомянутое выше требование выпуклости множеств F(p,X(p)) (р > Pq) (условие (A4)) и строится расширенная задача оптимизации в пространстве вероятностных мер, являющихся выпуклыми комбинациями точечных мер Дирака: т т г=1 г=1

При этом носителем данных мер для каждого р > ро является множество Х(р). При сделанных предположениях полученная расширенная задача оказывается задачей выпуклого программирования.

В разделе 1.2 вводится ряд дополнительных предположений (условия (А5) - (А9)) и, с использованием эквивалентности исходной и расширенной задач, обосновывается основной алгоритм решения. Раздел 1.3 посвящен упрощению основного алгоритма.

Основной алгоритм решения задачи (1) требует, вообще говоря, бесконечного расширения текущей памяти. В разделе 1.4 алгоритм конкретизируется для случая, когда значения Р(р,х) не зависят от параметра р и показывается, что в этом случае алгоритм можно модифицировать так, что вычисления потребуют постоянного объема памяти.

В главе II рассматриваются приложения предложенного в главе I алгоритма к решению двух задач оптимального управления с фазовыми ограничениями.

В разделе 2.1 рассматривается задача быстродействия для п-мерной дифференциальной управляемой системы

1) = 1{*Ш) + 9Ш,1)и(Ь), (2) функционирующей на отрезке времени [0,Т] (Т > 0), из заданного начального состояния г° е Яп в заданное; конечное состояние г1 € Вп при смешанном геометрическом ограничении (¿(¿), ?/(£)) 6 (£ £ [0,Т]) па фазовую переменную и т - мерную управляющую переменную м(£).

В разделе 2.1.1 формулируются требования непрерывности функций /(•, •), /;(•, •) и замкнутозначности, выпуклозпачпости и ограниченности многозначного измеримого отображения $(•), гарантирующие существование решения поставленной задачи быстродействия (теорема 2.1).

Теоремы существования, учитывающие специфику конкретных классов задач оптимизации, приведены в |10|. |19|. [33], [34], [00]. [70]. [78|.

Далее исходная задача быстродействия сводится к задаче вида (1) в нормированном пространстве X = Ь2{[0, Т], В!1) х Ь\([О, Т], Ят), где Ь\([О, Т], Ят) - иространтство 1/2([0,Т], Я"1), снабженное слабой нормой (см., напр., [10]). На рассматриваемую управляемую систему накладывается дополнительное требование выпуклозначности образов С?) (р б [0,Т]), где - интегральный оператор системы (2), С - множество управляемых процессов (г(-), «(•)), удовлетворяющих смешанному ограничению (г(£),и(£)) б (*е[0 ,Т]).

Там же приводится билинейная управляемая система в качестве примера системы, для которой соответвующая задача быстродействия удовлетворяет указанному условию выпуклозначности образов при интегральном преобразовании.

Разделе 2.1.2 посвящен строгому обоснованию возможности применения общего метода к решению задачи быстродействия для системы (2) и его конкретизация.

В разделе 2.1.3 описан пример приложения указанного метода к решению задачи быстродействия для модели динамики одноногого прыгающего робота в фазе полета [95|. Приведены результаты численного эксперимента.

Раздел 2.2 посвящен приложению общего алгоритма, описанного в главе I, к задаче оптимизации смешанных ограничений для п-мериой дифференциальной управляемой системы (2). В этом разделе предполагается, что фазовая переменная и ш - мерная управляющая переменная м(£) удовлетворяют фазовому ограничению, зависящему от скалярного параметра р> Ро : 0 (1е[0,Т},р>р0).

Рассматривается задача нахождения наименьшего значения параметра р > Ро, при котором существует управляемый процесс (,г(£), и(£)), удовлетворяющий указанному ограничению.

В разделе 2.2.1 формулируются требования непрерывности функций /(■, •), /;(-,•) и многозначной функции (?(•,£) (£ б [0,Т]); измеримости многозначной функции С,}(р, •) (р>Ро)ш, требования замкнутозначности, выпуклозначности и ограниченности многозначного отображения (?(•,•): такжо требование монотонного возрастания многозначной функции р н-» С}(рЛ) для всех t G [0,Т]. При указанных предположениях доказывается существование решения рассматриваемой задачи оптимизации (теорема 2.5). Далее исходная задача вновь сводится к задаче вида (1) в нормированном пространстве X = Ь2([0,Т], Rn) х L2W([О,Т],Rm). На рассматриваемую управляемую систему накладывается дополнительное требование выпуклозначности образов F(p,X(p)) (р G [О, Г]), где F(-, •) - интегральный оператор системы (2), Х(р) - множество управляемых процессов (z(-), и(-)), удовлетворяющих смешанному ограничению (z(t),u(t)) G Q{p,t) (t G [0,T]).

Там же приводится билинейная управляемая система в качестве примера системы, для которой соответвующая задача оптимизации смешанных ограничений удовлетворяет указанному условию выпуклозначности образов при интегральном преобразовании.

Раздел 2.2.2 посвящен строгому обоснованию возможности применения общего метода к решению задачи оптимизации смешанного ограничения для системы (2) и его конкретизация.

В разделе 2.2.3 описан пример приложения указанного метода к решению задачи оптимизации смешанного ограничения для модели глобального экономического роста. Приведены результаты численного эксперимента.

В главе III задача (1) рассматривается при неточных входных данных F(-, •), b(-) и Х(-), отклоняющихся от неизвестных точных данных не больше, чем па заданные известные величины погрешностей.

Для падежного решения неустойчивых задач строится регуляризирую-щий оператор (регуляризирующий алгоритм) [71], [5]. Все методы решения неустойчивых задач так или иначе предполагают наличие какой-нибудь априорной информации о рассматриваемой задаче, о ее входных данных и их погрешностях и т.д. Различные аспекты проблемы использования априорной информации обсуждаются, например, в [17], [4G], [71,74]. Методы регуляризации для решения неустойчивых задач включают в себя метод стабилизации (метод стабилизирующих функционалов), разработанный А.Н. Тихоновым [71]; метод невязки [20|, |49|, [74]; метод квазирешений [2G], [71| и их многочисленные модификации.

Корректность задач оптимального управления при возмущениях пачального состояния рассматриваются в [98], [100]. Эти результаты получены как приложение абстрактной теории, развитой в [99].

В разделе 3.1 при некоторых предположениях, касающихся неизвестных точных входных данных (а именно, предположения непрерывности функций &(')> многозначного отображения Х(-), а также предположения о том, что F(•, •) — Ь(-) - компактпфикатор), предлагается регуляризирующий алгоритм решения задачи (1) с возмущенными входными данными Ь(-) и Х(-). Данный алгоритм включает в себя необходимость решать релаксиро-ванную задачу, сконструированную по исходной задаче (1).

Данный неконструктивный элемент предложенного регуляризирующего алгоритма исключается в разделе 3.2. Там делаются дополнительные предположения относительно неизвестных точных входных данных и предлагается конструктивный алгоритм решения. В разделе 3.3 рассмотрена регуляризация задачи быстродействия, описанной в разделе 2.1.

Основные результаты диссертации:

1. Предложен итерационный метод поиска наименьшего значения скалярного параметра, при котором зависящее от этого параметра уравнение в нормированном пространстве имеет решение в заданном множестве, которое, вообще говоря, также зависит от параметра. Метод основан на идее метода экстремального сдвига Н. Н. Красовского. Доказана сходимость метода.

2. Рассмотрено приложение данного метода к решению двух задач оптимального управления - задачи быстродействия со смешанными ограничениями и задачи оптимизации смешанного ограничения для некоторых классов, вообще говоря, нелинейных управляемых систем.

3. В случае неточного задания входных данных задачи предложен алгоритм регуляризации для задачи поиска оптимального параметра совместности.

Основные результаты диссертации опубликованы в работах [101] - [105].

Автор выражает глубокую благодарность своему научному руководителю Аркадию Викторовичу Кряжимскому за постановку задачи, постоянное внимание к работе и ценные замечания.

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Ровенская, Елена Александровна, Москва

1. Антипин A.C. Метод регуляризации в задачах выпуклого программирования.// Экономика и математические методы. 1975. т. 11. К0- 2. С. 336342.

2. Антипин A.C. Методы нелинейного программирования, основанные на приямой и двойственной модификации функции Лагранжа. М.: Изд. ВНИИСИ. 1979.

3. Антипин A.C., Васильев Ф.П. Методы регуляризации для решения задач равновесного программирования с сдвоенными ограничениями. Журнал вычислительной математики и математической физики. 2005. т. 45. 1. С. 23-37.

4. Антипин A.C. Об едином подходе к методам решения некорректных экстремальных задач.// Вестник Московского Университета. Серия 1. Математика и механика. 1973. № 2. С. 60-67.

5. Бакупшнский A.B., Гончарский A.B. Некорректные задачи. Чмсленные методы и приложения. М.: Издательство МГУ. 1989.

6. Бахвалов Н.С. Численные методы. М.: Наука. 1973.

7. Беллман Р. Динамическое программирование. М.: ИЛ. 1960.

8. Гурман В.И. Принцип расширения в задачах управления. М.: Физмат-лит. 1997.

9. Денисов Д.В. Метод итеративной регуляризации в задачах условной минимизации.// Журнал Вычислительной Математики и Математической Физики. 1978. т. 18. Л* С. С. 1405-1415.

10. Дикусар В.В. Регуляризация вырожденной задачи оптимального управления.// Дифференциальные уравнения. 1998. т. 34. № 11. С. 1850-1865.

11. Жиглявский A.A. Математическая теория глобального случайного поиска. JL: Издательство ЛГУ. 1985.

12. Иванов В.К., Васин В.В., Танана В.П. Теория линейных некорректных задач и ее приложения. М.: Наука. 1978.

13. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука. 1979.

14. Ишмухаметов А.З. Вопросы устойчивости и аппроксимации задач оптимального управления. М.: Издательство ВЦ РАН. 2000.

15. Ишмухаметов А.З. Методы решения задач оптимизации. М.: Издательство МЭИ. 1998.

16. Канторович JI.B., Акилов Г.П. Функциональный анализ. М.: Наука. 1984.

17. Калашников АЛ. Порядковая регуляризация некорректной задачи оптимального управления.// В сборнике: Дифференциальные и интегральные уравнения. Вып. 2. Горький: Изд. Горьковского Университета. 1978. С. 124-129.

18. Карманов В.Г. Математическое программирование. М.: Физматлит. 2000.

19. Колмогоров А.Н., Фомин C.B. Элементы теории функций и функционального анализа. М.: Наука. 1976.34| Корнейчук Н.П. Экстремальные задачи теории приближения. М.: Наука. 1976.

20. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука. 1974.

21. Кротов В.Ф., Букрсев В.З., Гурман В.И. Новые методы вариационного исчисления в динамике полета. М.: Машиностроение. 1969.

22. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука. 1973.

23. Кряжимский A.B., Осипов Ю.С. Об одном алгоритмическом критерии разрешимости игровых задач для линейных управляемых систем. // Тр. Ин-та матем. механ. УрО РАН. 2000. т. 6. № 1. С. 2-10.

24. Кряжимский A.B., Осипов Ю.С. Экстремальные задачи с отделимыми графиками.// Кибсрн. сист. анал. 2002. No 2. С. 32-55.

25. Кряжимский A.B., Пащенко C.B. К решению линейной задачи быстродействия со смешанными ограничениями.// ВИНИТИ. Итоги пауки и техники. Сер. Современная математика и ее приложения. 2002. т. 90. С. 232-260.

26. Потапов М.М. Апрокснмация экстремальных задач в математической физике (гиперболические уравнения). М.: Издательство МГУ. 1985.

27. Потапов M.M. Метод прямых в задачах граничного управления и наблюдения для гиперболического уравнения с краевыми условиями второго и третьего рода. // Вестник МГУ. Серия 15, вычислительная математика и кибернетика. 1990. № 2. С. 35-41.

28. Потапов М.М. О сильной сходимости разностных аппроксимаций для задач граничного управления и наблюдения для волнового уравнения.// Журнал вычислительной математики и математической физики. 1998. т. 38. № 3. С. 387-397.

29. Потапов М.М. Об апроксимации но функционалу максиминных задач со связанными переменными, для систем Гурса-Дарбу при наличии фазовых ограничений.// Журнал вычислительной математики и математической физики. 1979. т. 19. № 3. С. 610-G21.

30. Потапов М.М., Раз гул и н А.В., Шамеева Т.Ю. Аппроксимация и регуляризация задачи оптимального управления для уравнения типа Шре-дингера.// Вестник МГУ. Серия 15, вычислительная математика и кибернетика. 1987. № 1. С. 8-13.

31. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука. 1982.

32. Роитенберг Я.Н. Автоматическое управление. М.: Наука. 1978.

33. Стрскаловский А.С. Элементы задач иевыпуклой оптимизации. Новосибирск: Наука. 2003.

34. Тихомиров В.М. Некоторые вопросы теории приближений. М.: Издательство МГУ. 1976.

35. Тихонов А.Н., Арсении В.Я. Методы решения некорректных задач. М.: Наука. 1986.

36. Тихонов А.Н., Васильев Ф.П. Методы решения некорректных экстремальных задач.// В книге: Banacli Center Publications. Vol. 3. Mathematical Models and Numerical Methods. Warshawa. 1978. pp. 297342.

37. Тихонов A.H., Васильев Ф.П., Потапов M.M., Юрий А.Д. О регуляризации задач минимизации на множествах, заданных приближенно.// Вестник МГУ. Серия 15, вычислительная математика и кибернетика. 1977. № 1. С. 4-19.

38. Тихонов А.Н., Леонов А.С., Я гол а А.Г. Нелинейные некорректные задачи. М.: Наука. 1995.|75. Треиогин В.А. Функциональный анализ. М.: Наука. 1980.

39. Федореико Р.П. Приближенное решение задач оптимального управления. М.: Наука. 1978.|77| Фиакко А., Мак-Кормик Г. Нелинейное программирование. Методы последовательной безусловной оптимизации. М.: Мир. 1972.

40. Филиппов А.Ф. О некоторых вопросах оптимального регулирования.// Вестник МГУ. Серия 1, математика и механика. 1959. № 2. С. 25-38.

41. Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы. М.: Мир. 1979.

42. Kryazhimsky A., Watanabe Cli. Optimization of Technological growth. Gendaitosho. 2004.

43. Kryazhimsky A.V., Osipov Yu.S. Inverse Problems of Ordinary Differential Equations: Dynamical Solutions. Gordon and Beach. London. 1995.

44. Kryazhimsky A.V., Ermoliev Yu.M., Ruszczynski A. Constraint aggregation principle in convex optimization. // Mathematical Programming. Series B. 1997. Vol. 76. pp. 353-372.

45. Kryazhimsky A.V., Ruszczynski A. Constraint aggregation in infinite-dimensional spaces and applications.// International Institute for Applied Systems Analysis. Laxenburg. Austria. IR-97-051. 1997.

46. Kryazhimsky A.V., Digas B.V., Ermoliev Yu.M. Guaranteed optimization in insurance of catastrophic risks. // International Institute for Applied Systems Analysis. Laxenburg. Austria. IR--98-082. 1998.

47. Kryazhimsky A.V. Convex optimization via feedbacks. // SIAM Journal Control Optimization. 1999. Vol. 37. No 1. pp. 278-302.

48. Kryazhimsky A.V. Optimization problems with convex epigraphs. Application to optimal control. // Inteniatioanl Journal of Applied Mathematics and Computer Science. 2001. Vol. 11. No 4. pp. 101-129.

49. Kryazhimsky A.V., Ruszczynski A. Constraint aggregation in infinite-dimensional spaces and applications. // Math. Operat. Research. 2001. Vol. 2G. No 4. pp. 769-795.

50. Kryazhimskii A.V., Paschenko S.V. On the problem of optimal compatibility. J. Inv. Ill-Posed Problems. 2001. Vol. 9. No 3. pp. 283-300.

51. Matveev A.S. Yakubovich V.A. Nonconvex problems of global optimization.// St.Peterburg Mathematical Journal. 1993. Vol. 4. № 6. pp. 1217-1243.

52. Murray R.M., Li Z., Sastry S.S. A Mathematical Introduction to Robotic Manipulation. CRC Press. 1994.

53. Yakubovich V.A. Nonconvex optimization problems: The infinite-horizon linear-quadratic constraints.// Syst. and Contr. Lett. 1992. Vol. 16. pp. 1322.

54. Zangwill W.I., Garcia C.B. Pathways to Solutions, Fixed Points and Equilibria. Englewood Cliffs: Prentice Hall. 1981.

55. Zolezzi T. Well-posedness of optimal control problems.// Control and Cybernetics. 1994. Vol. 23. pp. 289-301.

56. Zolezzi T. Well-posedness critaria in optimization with application to the calculus of variation. // Nonlinear Analysis, Theory, Methodology and Application. 1995. Vol. 25. pp. 437-453.

57. Zolezzi T. Extended wellposedness of optimal control problems.// Discrete and Continuous Dynamic Systems. 1995. Vol. 1. pp. 547-553.

58. Ровепская E.A. К решению задачи об оптимальном параметре совместности для одного класса уравнений в банаховом пространстве. Журнал вычислительной математики и математической физики. 2004. т. 44. № 12. С. 2150-2166.

59. Ровепская Е.А. К решению задачи быстродействия с фазовыми ограничениями для простейшей модели прыгающего одноногого робота. Сборник "Нелинейная динамика и управление". М.: Изд. МГУ. 2005. К0- 5.

60. Ровепская Е.А. О задаче оптимизации фазового ограничения для линейной управляемой системы. Математические модели в экономике и экологии: Материалы научного семинара. М.: МАКС Пресс. 2004. С. 7578.