Градиентные методы решения задач оптимизации системами, описываемыми обыкновенными дифференциальными уравнениями и уравнениями в частных производных тема автореферата и диссертации по математике, 01.01.07 ВАК РФ
Албу, Алла Филипповна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1994
ГОД ЗАЩИТЫ
|
|
01.01.07
КОД ВАК РФ
|
||
|
российская академия наук вычислительный центр
на правах рукописи УДК 519.8:519.622
Албу Алла Филипповна
Градиентные метода решения задач оптимизации системами, описываемыми обыкновенными дифференциальными уравнениями и уравнениями в частных производных
01.01.07 - вычислительная математика
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Москва 1994
Работа выполнена в Вычислительном центре РАН
Научный руководитель: член-корреспондент РАН,
доктор физико-математических наук, профессор Ю.Г.Евтушенко
Официальные оппоненты:
доктор физико-математических наук, профессор В.М.Борисов
доктор физико-математических наук А.С.Антипин
Ведущая организация: Институт системного анализа РАН
часов на заседании специализированного совета Д002.32.01 при Вычислительном центре РАН по адресу: 117967, Москва, ул. Вавилова, 40.
С диссертацией можно ознакомиться в библиотеке Математического института им. В.А.Стекловя по адресу: ул. Вавилова, 42.
Защита состоится
1994 года в
Автореферат разослан
1994 года.
Ученый секретарь специализированного совето доктор физ.-матем. наук
общая характеристика работы
Актуальность темы исследований. Широкое применение в науке и технике находят задачи оптимального управления. Они имеют многочисленные применения в механике космического полета, в вопросах управления химическими или ядерными реакторами. К ним обращаются создатели автоматизированных систем управления и систем автоматизированного проектирования, экономисты, инженеры-конструкторы и многие другие. Обширные приложения способствуют бурному развитию вычислительных методов оптимизации, созданию новых разнообразных направлений исследования. Практическая реализация многих численных методов решения задач оптимального управления требует огромного объема вычислений, поэтому широкое применение эти методы нашли в последние годы в связи с появлением быстродействующих электронно-вычислительных машин.
Многие задачи оптимального управления формулируются в терминах разрывных систем, которые обладают качественными отличиями от непрерывных систем и требуют разработки специальных подходов.
В данной работе рассматриваются два вида задач с разрывами: оптимальное управление задачам типа Стефана и задача оптимального управления систем, которые описываются обыкновенными дифференциальными уравнениями с разрывной правой частью.
Имеются многие причины, позволяющие отнести разрывные системы управления к числу важных для исследования объектов. Первая из них - запросы практики. В терминах разрывных систем формулируются многие содержательные инженерно-технические задачи, связанные, например, с движением летательных аппаратов в анизо-
трошшх средах, распространением сейсмических колебаний, работой вибромашин и вибротранспортеров, протеканием ударных и взрывных процессов, управлением манипуляторами, функционированием проти-воаварийной автоматики электроэнергетических систем. Разрывные системы широко используются в экономике, химической технологии, теории автоматического регулирования, теории систем с переменной структурой и других областях науки. Наконец, разрывные системы играют важную роль в самой математической теории оптимальных процессов при решении вопросов синтеза, разрешимости краевых задач принципа максимума, чувствительности решений по начальным значениям и параметрам и т.п.
Если в теории гладких оптимальных систем получены такие фундаментальные результаты, как принцип максимума Л.С.Понтряги-на, метод динамического программирования Р.Беллмана и ряд других, то успехи теории негладких систем значительно скромнее. Численные методы для разрывных систем развиты пока слабо.
Задачи типа Стефана возникают при рассмотрении процессов распространения тепла в средах с изменяющимся фазовым состоянием, когда искомой является не только температура среды, но и подвижная граница раздела фаз. На практике такие задачи возникают в литейном деле в процессе кристаллизации литейных заготовок. Различные металлические детали для нужд промышленности приборостроения, станкостроения, сконструирования двигателей и т.д. изготавливаются из литейных заготовок путем шлифовки, срезки ненужных частей и пр.
Обычно требуется, чтобы полученная деталь обладала определенными свойствами прочности, упругости, стойкости к усталости и
др. Естественно, этого можно добиться только в том случав, когда соответствующими физическими свойствами обладают литейные заготовки. Последние, в свою очередь, зависят от кристаллической структуры застывшего металла в процессе литья. На становление кристаллической структуры застывшего металла влияют в разной степени много факторов (так называемые параметры процесса): состав сплава металла, точка или диапазон температуры кристаллизации сплава, общее температурное поле в литейной форме и ее содержимого, температура внешней среды и др. На практике часто возникают задачи оптимального выбора тех или иных параметров процесса таким образом, чтобы поведение границы раздела жидкой и твердой фаз, а также температура рассматриваемого объекта в заданный момент времени были наиболее близкими к желаемым.
Математическая модель задачи представляет собой систему нелинейных дифференциальных уравнений в частных производных параболического типа. Определенные трудности возникают в связи с тем, что при рассмотрении процессов распространения тепла в средах с изменяющимся фазовым состоянием, задача становится разрывной.
Целью настоящей работы является
а) Разработка алгоритма численного решения задач оптимального управления с разрывной правой частью в том случае, когда система обыкновенных дифференциальных уравнений интегрируется по неявной схеме.
б) Разработка алгоритма, предназначенного для численного решения задачи оптимального управления процессом кристаллизации и плавления металлов и вывод формулы для вычисления градиента функционала качества.
Научная новизна исследований состоит в том, что результаты, представленные в диссертационной работе получены впервые.
Теоретическая и практическая ценность. Теоретические результаты диссертационной работы могут быть использованы при разработке программ для численного решения задач оптимального управления процессом плавления и кристаллизации металлов и для задач оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями с разрывной правой частью.
Публикации. По результатам выполненных исследований опубликовано 3 печатных работ и подготовлено к печати одна статья.
Структура и объем диссертации. Работа состоит из введения, четырех глав и списка литературы. Общий объем работы - 111 страниц. Библиография включает 63 наименований.
СОДЕРЖАНИЕ РАБОТЫ Во введении говорится об актуальности темы исследований и о целях диссертационной работы.
В главе I излагается метод быстрого автоматического дифференцирования функций. Здесь приводятся общие формулы дифференцирования функций при наличии связей.
Пусть для векторов гей", иейГ определены отображения ИГ:ЯП*ЯГ"—»Я1, Ф:Я"«ЯГ—>ЯП. Векторы 2 и и связаны условием
ф(2,и) - 0. (1 )
Используя теорему о неявной функции, можно показать, что имеет место
Теорема. Пусть функции РР(г,и), Ф (г,и) непрерывно дифференцируемы в некоторой окрестности точки удовлетворящей (!) и пусть матрица Ф (г^.и,) невырождена. Тогда
^^ Ш,'-' и 1 и J IV 1 X ^ X Х1Ч-» V—■ 1. И Л .1 Щ
соответственно, что для каждого иеВ существует единственное
решение системы (1), причем производная непрерывно
дифференцируемый функции П(и)=Иг(2(и),и) задается формулой
сЮ Ш
¡Г
Верхний индекс "т" обозначает транспонирование, а нижние индексы г и и обозначают частные производные функций по явно входящим Еекторам 2 и и.
Введем функцию Лагрэнжа 1 и определим тг-мерный вектор р и матрицу N размером г*п с помощью следующих условий:
1(2,и) = ЙЧл.и) + ртФ(г,и),
Ъ {г,и) = ¡7 (л,и) + Фт(2,и)р = 0, (3)
г г г 1
1 = + =°- (4>
При выполнении условий теоремы существуют окрестности точек 2* и и*> ГД0 системы линейных уравнений (3) и (4) однозначно определяют вектор р и матрицу N. задающую производную неявной
функции г (и) по и: N = = - фЦ^]"1 '
Формулу (2) можно записать двумя способами:
® = I = (у + Фтр, (5)
аи и и иг
Щ = яг + ^ . (6)
ии и г
Обычно в вычислительных задачах векторы г и и состоят из наборов векторов меньшей размерности:
г = и = 1и,,иг.....иА1, 2(еД3, и{€йт, при
этом условие связи (1) расщепляется на к векторных условий вида
z{ = F(t,Zl,Ul), n = s-fe, r = m-k. (7)
Здесь и Ul - заданные наборы векторов: - множество всех z{, которые входят в правую часть уравнения (7), - множество всех и{, которые входят в правую часть этого уравнения. Благодаря специфике условий (7) формулы производных функции 0 (и) упрощаются, что облегчает численные расчеты конкретных задач.
Для каждого Се[1:йЗ введем два индексных множества Q{ и включив в них индексы всех векторов Zj и и , входящих в наборы и !7 соответственно. Тогда
Zi = jz^r j€Qtc[l:ft]j-, Ut ={iy JzK^ll :й]|. Введем так называемые сопряженные индексные множества Q{ и К.
Qi = [1 :ft]: ieQ^j-, I{ = j/e f1:ft]: ieK,}.
Вектор-функцию $(z,u) представим как объединение вектор-функций F{i,Zl,Ul) - z{, когда t принимает всевозможные значения из множества И:й]. Формулы (З)-(б) можно теперь записать в следующем виде:
. Изложенная выше схема дифференцирования демонстрируется на примере несложной задачи оптимального управления.
В главе П рассматривается оптимизация систем, описываемых уравнением параболического типа. В многочисленных задачах оптимизации важно уметь вычислять значение градиента минимизируемого функционала. Есть традиционный путь его отыскания, основанный на использовании идей вариационного исчисления. Другой, сравнительно новый путь основан на использовании подхода, идущего от теории оптимизации дискретных систем (глава I). Во второй главе на примере конкретной задачи оптимального управления процессом нагрева стержня проводится сравнительный анализ обоих подходов.
В первом параграфе излагается постановка вышеуказанной задачи.
Во втором параграфе выводится формула для вычисления градиента минимизируемого функционала на основе традиционного подхода и приводится схема, по которой дискретизируестя исходная задача оптимального управления.
В третьем параграфе выводится формула для вычисления градиента функционала с помощью второго метода, т.е. вычисляется градиент функционала дискретной задачи оптимального управления, которая аппроксимирует исходную задачу.
В четвертом параграфе приводятся результаты численных расчетов и дается анализ влияния способов расчета градиента на решение оптимизационной задачи. Важно отметить, что значение градиента, вычисленное по выведенным в третьем параграфе формулам, является точным для дискретной задачи оптимального управления.
В главе Ш получены формулы для вычисления градиента функционала для задач оптимального управления с разрывной правой частью. Рассмотрен случай, когда система обыкновенных
дифференциальных уравнений интегрируется по неявной схеме. В первом параграфа приводится постановка вышеуказанной задачи.
Матемэатческая модель процесса управления представляет со''<<й обччно совокупность обыкновенных дифференциальных
[ ч..>;0,и(П>, скит,
(12)
j .r(O) = xQ,
f(x(t),u(t)), 3ix(t),u(t))<0, где ф(.г) = | g(x(t),u(i)). S{x{t),u(t)m, (13)
Здесь x(t) - n-мерный фазовый вектор, u(i) - r-мерный вектор
управлений; f(x,u), g(x,u) - непрерывно дифференцируемые по
совокупности аргументов n-мерные вектор-функции, S{x,u)
(поверхность разрыва) - дифференцируемая по совокупности
аргументов функция. На фазовый вектор х (t) и на вектор
управлений u(i) могут быть наложены ограничения следующего вида:
Г1 (x(t),u(i)) = О, О^Т, (14)
T2(x(t),u(t)) s; 0, Oct«;?, (15)
Г3(х(Т)) = 0, (16)
r4(i(T)U0. (1Т)
Здесь Г, (г,и), Г (г,и), Г (аг(Т)), Гд(.г(Т)) - заданные гладкие
вектор-функции. Условия (14) и (15) называются траекторными
ограничениями типа равенства и неравенства, условия (16)-(17) -
терминальные ограничения на правый конец фазовой траектории.
Введем минимизируемый функционал:
' I(x(.t),u(.t)) = Ф(х(Т)) + !4°{x(t),u(t))at. (18)
о
Функция 1(х,и) предполагается дифференцируемой по совокупности аргументов. Задача оптимального управления состоит в том, чтобы
среди всех измеримых управлений найти такую вектор-функцию u(t), чтобы для иЦ) и соответствующих решений хЦ) системы (12)-(13), для которых выполнены условия (14-)- (17), функционал (18) принимал бы наименьшее возможное значение.
При численном решении поставленной задачи оптимального управления обычно используются градиентные методы минимизации. Поэтому необходимо получить формулу производной сложной функции 1(х(и),ч) по компонентам вектора управлений.
Для вывода формулы градиента функционала применяется метод, изложенный в первой главе. Так как при этом очень важно по какой схеме осуществляется дискретизация задачи и каким образом вычислено приближенное значение функционала, то во втором параграфе приводится алгоритм численного интегрирования системы обыкновенных диффвренцичльных уравнений с разрывной правой частью.
Траектории* и терминальные ограничения (14)-(17) заменяются их дискретными аналогами
7. и,,и, ) = о. Г, (.<:,, и.) < О, I = о (19)
I Ъ I с. I Ь
Г3(^) = О, Г4СГЙ) < 0. (20)
Здесь к - число отрезков интегрирования по времени.
Для вычисления приближенного значения функционала используется одна из квадратурных формул. Тогда задача оптимального управления сводится к задаче безусловной минимизации функции вида
к
Лх,и) = Ъ(х ) + 2 В(х }.
* 1=0 11
Терминальные ограничения (20) вошли в функцию Ъ(хк), а траекторные ограничения (19) - во второе слагаемое.
В третьем параграфе выводится формула для расчета градиента минимизируемого функционала. Здесь рассматриваются шестнадцать случаев, которые могут возникать при расчете импульсов и вектора градиента в ¡-ом узле сетки в зависимости от того, какие значения получает функция Б{х,и) в окрестности этой точки. Доказывается теорема:
Теорема. Если в задаче (12)-(18) вектор-функции /(х,и), 8(х,и), Г1{х,и), Г2(х,и), Г3(х(Т)), Гд(х(Т)) и функции Б{х,и), О{х,и) - непрерывно-дифференцируемые по совокупности аргументов, то градиент минимизирумого функционала дискретной задачи оптимального управления вычисляется по формулам сЫ _ ™
шг0 ~ V
сУ
Ъ1_,ё1(х1,и1)р1 * П^, если О,
т ~ ~ да1-1 т ~
Г + -
Т 5а*-1 т
+ 1Уи , если ,и{-1 )<0, О,
да.
{-1
ж:
За
+ 1У
если Б (¿¡г »ы{_1 5(£{,и{)<0,
7-1 ? 7?
V- I у у а • • у Л •
Здесь й - число отрезков интегрирования по времени ^ £ - момент разрыва правой части системы (12); р{ - импульсы,
р( - дополнительные импульсы. (Формулы для их вычисления выводятся в третьем параграфе. Уравнения для расчета импульсов представляют собой систему линейных алгебраических уравнений.) Вычисленные по выведенным здесь формулам производные минимизируемого функционала являются точными для той дискретной задачи, которая выбирается при аппроксимации исходной задачи оптимального управления. Это подтверждают численные эксперименты, которые приводятся в четвертом параграфе.
В главе 1У рассматривается задача оптимального управления процессом кристаллизации и плавления металлов.
В первом параграфе приводится математическая модель задачи, которая представляет собой систему нелинейных дифференциальных уравнений в частных производных параболического типа. Через Т=Т(х,t) обозначим температуру стержня в точке х в момент времени I. Пусть Т(^,0)=ф(х) - распределение температуры в стержне в начальный момент времени при í=0. Требуется, управляя температурой внешней среда, минимизировать значение функционала при условии, что Т=Т(х,1) является решением краевой задачи:
Т(г,0)=ф(аг), ге[0,П,
Я(Т)Т^=д(,г,г ) - р{7,2:)?, х=1), ^(О,",]
где I и t - заданные положительные величины, /(Т) - заданная
функция. Нижней индекс ^ обозначает производную по внешней
нормали к границе;
г д С ^), х=0, <?(х,*) = Л °
I х=1,
р(Т,лг) =
■ р0(Т), . рг(Т), Х=1.
Здесь Е(Т) - функция теплосодержания, или, так называемая энтальпия:
р с Т,- Т<Т_,
«я я * г *
Грс
Е(Т) = ] * 3 '
гог (Т-Т^Я-р^Т^+р^, тэт,,
где ра, рг - плотность материала в твердом и жидком состоянии
соответственно,
сд, сг - удельная теплота материала в твердом и жидком
состоянии, 7 - скрытая теплота плавления, Т - температура кристаллизации. Функция теплопроводности Я(Т) имеет следующий вид
я(т)
Г*в. т<тг
IV таг,,
где йа, - теплопроводность материала в твердом и жидком состоянии соответственно.
На концах стержня (при а>0 и х=1) может происходить теплообмен по разным законам (закон излучения Стефана-Больцмана, закон Ньютона, закон постоянного потока и др.). Для того, чтобы рассмотреть более общий случай, мы обобщили граничные условия следующим образом £(Т)Т^-»=д(:г, г )-р(Т,г)Т,д,еГД€(ОД11.
Если использовать, например, закон излучения Стефана-Больцмана, то /{(Т)Т^=-а(Т4-или)) и тогда р{Т,х)=аТ3, q(x,t)=auл(t), где о - степень черноты внешней среды, u(t) -температура внешней среды.
В качестве управления процессом распределения тепла высту-
пает температура внешней среды значение которой входит в
выражении функции q(z,t).
Во втором параграфе приводится алгоритм численного решения задачи Стефана. Система нелинейных уравнений, получающаяся в результате дискретизации, имеет общий матричный вид 4(Т)Т=£. где Т - искомый вектор температуры, Л(Т) - трехдиагональная квадратная матрица, элементы которой зависят от координат искомого вектора, £ - известный вектор. В задачах с фазовым превращением среды (кристаллизацией) элементы матрицы Л(Т) либо негладко зависят от Т, либо вообще разрывны. По этой причине итерационные методы решения системы уравнений ЖТ)Т=£ обычно плохо сходятся. Поэтому целесообразно осуществить переход от функции Т к функции энтальпии Е(Т), что позволяет лучше учесть скачок функции теплосодержания, свойственный материалам с фазовым превращением. Получающаяся при этом система уравнений сохраняет общий матричный вид: В(Е)Е=т], где Е - искомый вектор, В(Е) - трехдиагональная квадратная матрица, т] - известный вектор. Однако, здесь элементы матрицы В(Е) уже непрерывно и даже гладко зависят от координат искомого вектора Е, что, при выполнении некоторых дополнительных условий, гарантирует сходимость итерационных методов решения системы В(Е)Е=г\. Система уравнений В(Е)Е=Г] решается с помощью модифицированного метода Якоби.
В третьем параграфе выводятся формулы, по которым вычисляются компоненты градиента функционала качества. При этом используется метод быстрого автоматического дифференцирования.
В четвертом параграфе приводятся результаты нескольких численных экспериментов. Первые четыре эксперимента были
осуществлены с той целью, чтобы убедиться в достоверности выведенных во втором и третьем параграфе формул. В следующих трех экспериментах получены результаты численного решения одной модельной задачи оптимального управления процессом кристаллизации стержня с помощью метода сопряженных градиентов.
Основные результаты диссертации.
1. На примере конкретной задачи оптимального управления систем, описываемых уравнением параболического типа, проводится сравнительный анализ двух методик вычисления градиента функционала качества и анализ влияния способов расчета градиента на решение оптимизационной задачи.
2. Разработан один алгоритм численного решения задачи оптимального управления с разрывной правой частью и получены формулы для вычисления градиента минимизируемого функционала. Рассмотрен случай, когда система обыкновенных дифференциальных уравнений интегрируется по неявной схеме.
3. Разработан один алгоритм численного решения задачи оптимального управления процессом кристаллизации и плавления металлов. Выведены формулы для вычисления градиента функционала качества на основе подхода, идущего от теории оптимизации дискретных систем.
По теме диссертации опубликованы следующие работы:
1. Албу А.Ф. Оптимизация систем, описываемых уравнением параболического типа // Исследование операций. - М. ВЦ РАН, 1991.
2. Албу А.Ф. Оптимальное управление в задачах типа Стефана // Исследование операций. - М. ВЦ РАН, 1992.
3. Евтушенко Ю.Г., Албу А.Ф. Оптимизация процессов, описываемых параболическими уравнениями с разрывами // Негладкие и разрывные задачи управления и оптимизации. - Тезисы докладов. -Челябинский Гос. Университет, 1993. Подготовлена к печати статья "Оптимальное управление системами с разрывной правой частью".