Приближенное решение позиционных задач социального и дифференциальных игр тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Фоменко, Александр Васильевич АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Киев МЕСТО ЗАЩИТЫ
1992 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Приближенное решение позиционных задач социального и дифференциальных игр»
 
Автореферат диссертации на тему "Приближенное решение позиционных задач социального и дифференциальных игр"

> ^ Г.- У У I

;кий государственный университет имени Т.Г.Шевченко

На правах рукописи

Фоменко Александр Васильевич

УДК 517.277.5/8

ПИШШЕННОЕ РЕШЕНИЕ Л06Щ10НШ ЗАДАЧ ПИЛЬНОГО УПРАВЛЕНИЯ И ДШЕРЫШШЖХ ИГР

01.01.09 - математическая кибернетика

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

Киев - 1992

Работа выполнена в Запорожском индустриальном инстиа Запорожском государственном университете и по месту прик] ления в Киевском государственном университете имени Т.ГЛ ченко.

Научный консультант - доктор физико-математических 1

Официальные оппоненты:

доктор физико-математических наук, профессор НМ.ХрА доктор физико-математических наук, профессор Н.Е.Ки] доктор физико-математических наук, профессор А.А.Чи:

Верущхя организация - Институт математики и механик

Залита состоится " / Г " Л 1992 г.

часов на заседании, специализированного совета Д 068-18.1 Киевском государственном университете имени Т.Г.Шевченко (252127, Киев, проспект Академика Глушкова, б, 1СГУ, факу. кибер^тики, ауд. 40).

С диссертацией можно ознакомиться в библиотеке КГУ.

профессор А.И.Егоров

УрО АН СССР

Учений секретарь специализированного совета канд. физ.-мат.наук

А.В.Кузьмж

0Н1;\Я ХАРАКТЕРИСТИК РАБОТЫ

ктуальность теш. Математическая теория оптимальных про-■ управления и дифференциальных игр получила интенсивное ие в последние десятилетия. 2>го связано с возникновени-отшх задач космической и авиационной техники и с созда-ффективных производственных технологий. С появлением ко-гай и высокопроизводительной вычислительной техники ста-1моииой реализация сло;лшх алгоритмов управления. Разно-(е идей и методов теории оптимального управления вызвано >стью рассматриваемых задач. Редкое использование оптима-систем и п^оцесссн 2 технмкэ объясняется трудностью пом достаточно простых математических моделей, адекватных шм система;.! и процессам, и использованием в большинстве зв программных законов управления, которде не учитывают шдихся условий функционирования.

Зо многих прикладных задачах только решение в форме пози-?го управления является приемлемым и эффективным. Системы 1Тной связью обладат лучшими функциональными качествам, 5ны работать п условиях неопределенности и противодейст-^стойчивы к начальным и постоянно действущим возмущени-эпускаеше зачастую при решении задач синтеза линеариэа-атематической модели и Сили) обратной связи не всегда оп-ны при значительных отклонениях движений системы от неко-заданной программа. Поэтому становится вадной проблема за для исходной, как правило, существенно нелинейной сис-Проблема синтеза особо остро проявляется при реаенкя за-

правления в условиях неопределенности, конфликта или коо-ии нескольких управляющих воздействий. Математическая фо-ровка задач управления, учитываюсая такие условия, нагла

отражение в теории дифференциальных игр. Источником ее жили реаиьнвге технические задачи, типичной из которых . ся задача о встрече движений механических систем.

Теоретические проблемы синтеза оптимальных систем ления и дифференциальных игр исследовались в трудах Л. рягша, А.М.Летова, Н.Н.Красовского, Р,Айзекса, Р.Белл Дд.Лейтмана и др. Сдля класса сосредоточенных систем), тковского, А.И.Егорова, Т.К.Сиразетдинова, К«А.Лурье, нова, 2Х.-Л.Лионса, Дж. Варга, П.К.С.Ванга и др. '»для » распределенных систем). Значительные успехи в аналити* решении конкретных типов задач получены в работах Б.Н. ного, В.И.Коробова, М.И.Зеликина, А.И.Мороза, В.Ф.Кроо К.Мерриэма и др.

Трудности аналитического решения позиционных зад; водят к необходимости применения приближенных методов тощее Бремя разработка численных методов синтеза отн! наиболее важным и перспективным областям прикладной м ки. В этом направлении получены значительные результа ботах Я.Н.Моисеева, В.И.Зубова, Н.Е.Кирина, В.И.Гурш Черноусько, А.Брайсона и Хо В-иш.Е.Р.Нусщ и др. Соз достаточно простых и надежных методов синтеза, основа применении ЭВМ, позволит осуществить множество эффект приложений оптимальных систем управления в науке и те

Цель работы. Диссертация посвящена разработке чи способов решения задач синтеза оптимальных систем улр сосредоточенными и распределенными объектами и даЗДе{ кюс игр. Ьначигельноа место в работе отведено исследс просов устойчивости и управляемости систем. Основное в проводимых исследованиях, сконцентрировано на конст;

редлагаемого подхода, возможности описать основные этапы ия задачи синтеза для различных классов систем управле -о единой методике.

Методы исследования. В диссертации используется метод ¡за оптимального управления, основанный на регрессивном 1ипе Айзекса и параметрической конструкции семейства по-жстремалей. Экстремали поля выделяются принципом макси-Понтрягина или его обобщениями на соответствутание клас-адач управления. В качестве вспомогательных методов испо-заны численные метода теории приближения и интегрирования ашонных уравнений описывающих поведение динамических си), методы оптимального управления, дифференциальных «гр, ии устойчивости и управляемости.

Научная новизна. Проведенные исследования по выбранной позволили получить, при некоторых ограничительных првд-жениях, следующие новив результаты;

1) Введено, с привлечением теории интегральных многообра-лонягие параметрического поля экстремалей для различных

;сов задач управления. Исследованы вопросы существования х полей.

2) Разработан конструктивный способ построения поля экс-тлей на основе регрессивного принципа и методов многомер-теории приближения.

3) Предложено несколько способов построения сингезируе-улравлений по различный аппроксимациям полей экстремалей.

4) Введен новый тип стратегий - интегро-интерполяцион -стратегия (ИИС), рассчитанная на функционирование в усло-

к неопределенности и помех измерениям. Предложен способ ко-руирования управлений на базе ИИС с привлечением соответст-

вующих полей экстремалей,

5) Разработана методика оценки эффективности страт при неоптимальном противодействии 1 содействии) игрока-п шка.

Кроме того, предложены способы восстановления функ пунова и нахождения области управляемости, основанные н де полей экстремалей. Для реализации процедуры построен: тезируемого управления разработаны вспомогательные числ способы и приемы. Они относятся к задачам многомерной т. приближения (тригонометрическая интерполяция и сферичес идентификация) и численному.анализу динамических систем собы численного интегрирования сингулярно возмущенных о и систем с последействием и опережением, волновых уравн! по методу .Цаламбера).

Теоретическая и практическая ценность. Теоретическ! значение работы состоит в развитии теории синтеза оптим; ных систем и процессов с позиций вариационных полей оке: лей. Прикладное значение диссертации заключается в созд< единого подхода построения параметрических полей экстре) для различных классов задач управления. Л1одход позволяв' таточно просто конструировать алгоритмы вычисления синп емого управления по этим полям и создавать соответствуй пакеты программных средств.

Апробация работы. Основные результаты диссертации ; давались на научных семинарах, республиканских, всесоюз! международных конференциях, в том числе, Всесоюзной щкоз "Оптимальное управление. Геометрия и анализ" (Кемерово, Всесоюзной научно-технической конференции "Актуальные щ мы моделирования исправления систем с распределенными г

и" (Одесса, 1987), Всесоюзном совещании "Методы малого ¡тра" (Нальчик, 1987), 7 tfi IFAC Wotksfiop 0Г1 Codb LppflcalLoas o|! nonftneai pio^iaraingand optlrnizaüon.

[си, 1988), Международном советско-польском семинаре (атические методы оптимального управления и их приложе-.Минск, 1989), У1 Всесоюзном совещании "Управление много-ам системами" (Суздаль, 1990), 1У Международной конфере-'Проблет комплексной автоматизации" (Киев, 1990). 3 полном объеме работа докладывалась и обсуждалась на ка-< прикладной математики ДОЛ1, моделирования и оптимиза-ясягх систе" КГУ. теории дифференциальных уравнений и пения ХГУ, уравнений математической физики МГУ, инфорла-цх систем управления ЛГУ, научном семинара "Теория приня-ешений" ПК АН УССР, в отделе систем управления ИШ Ур-о СР.

Полученные в диссертации результаты были использованы в ом процессе Запорожского госуниверситета в дисциплинах ализации "Системный анализ", "Оптимальное управление", ационные методы г,гатематической физики", "Численные метода ¡ального управления" и в четырех дипломных работах. Публикации. Основные результаты опубликованы в 23 статьях, incax.

Структура и обгем работы/ Диссертация состоит из введения, глав,'заключения, списка основной и дополнительной лите-ш из 298.наименований и содержит 321 страниц маиинонис-текста, в том числе, 4-1 рисунка и 5 таблиц.

СОДЕРШК РА ГСП» Зо введении отмечена актуальность темы исследования, рас-рёныго'ановныё.-калревления'анализа ."проблемы синтеза с ука-

займем.соотнетстнувп{их источников, приведены основные мет исследования и дана аннотация глав и параграфов диссертац Глава I содержит результат», которые, наряду с изпес ми методами численного анализа, представляют базу для при женного решения задач оптимального синтеза и использованы последующ« главах. В основе проводимых исследований ле граничный диффеоморфизм многомерных областей и тригономе ческал интерполяция.

В §1 рассматривается задача многомерной тригонометри кой интерполяции в ограниченной и односвяэной области С-Г{>шшцей Ц^ , Предполагается, что имеет параметри

кое описание в полярных координатах

j>=RlS), lj> - Ф ls) , se U

где U - открытый (fl-I)-мерный интервал. Доказано утв доние, что при выполнении некоторых естественных предполо ний отображение L *. 12 - iO,1)«U —G вида

P~0Rt$ï. Ю~Ф<5). 9^(0 ,i) StU

j - 5 * ' ' •

является С*-диффеоморфизмом, причем области G- и G"* личаются не более чем ÎTI-I)-мерным многообразием. Отобрал L ^граничный диффеоморфизм) используется для решения за тригонометрической интерполяции функции нескольких переме Доказан", формула обращения дискретного преобразования Фур сеточной функции п. лереиенных

Ux) = изо n L v-ik) ехр(-1к X) - v-u), Vxe 1

к*К

____п

VU) = Z tf(j(}expUK-x) П К:, К«к, к-х=к.х,"

X4UJ. Г ¿4 *

Здесь:

W. =(Х: Ху* а к/Ь^ , кеК:

= Ж/К} ,

случая равноотстоящих узлов интерполяции приведена оценка ешности тригонометрической интерполяции, основанная на венстве Лебега. Рассмотрен такяе метод неопределенных ко-циентов для интерполяции в неканонической области. Полу -

условие невырожденности матрицы коэффициентов системы нений, определяющей параметры интерполяции и найдена оце-сверху меры обусловленности этой матрицы.

Построение численной схемы решения краевой задачи для ового уравнения в §2 основано на формуле Даламбера и фор, полученной из нее дифференцированием по временной пяря-ой 1 . Эти формулы записываются по временным слоям, а ции состояния и правых частей представляются с помогць") фполяционных тригонометрических многочленов по системе щий, зависящей от типа граничных условий. Доказана теоре->б отсутствии погрешности метода для указанной вычислите->й схемы для однородной краевой задачи при условии, что шьные данные задачи выбираются из класса тригонометричес-многочленов конечного порядка. Сделаны обобщения вычисли-ьных схем на случаи неоднородных граничных условий, сосре-оченных и подвижных воздействий, для волновых уравнений с еменныш коэффициентами. Предложен подход к численному ре-ию квазилинейных уравнений с потенциальным оператором. Он ован на итерационной процедуре с проверкой консервативнос-схемы на каздом иаге.

В §3 для идентификации сингулярных поверхностей теории имизации использован способ интерполяции участками сфер и нсверсальной ориентации самих поверхностей и многообразий в

ней. Сингулярные поверхности считаются образованными с ваш интегральных кривых канонической системы условий льности. Получены оценки точности идентификации и прив методика идентификации для автоматизации построений.

В главе П производится разработка метода конструи синтезируемого управления. С использованием понятий те интегральных многообразий сделано обобщение конструкци экстремалей на класс задач оптимального управления без ничений и с ограничениями на управление и состояние. Д ализации схемы синтеза в нелинейном и нестационарном с используются семейства полей экстремалей, зависящие от ального параметра р (коэффициента мощности поля). Дл; шения точности и упрощения расчетных формул I

экстремалей разбивается на трубки. Это осуществляется ] разбиения области В изменения параметра поля 5 . I ботанный подход позволяет решать задачи с терминальным образием цели размерности Щ $ п- •( , с фиксированным я сированнш временем окончания процесса управления.

В §1 управляемый процесс описывается дифференциал; уравнением

X = Ыо.Т], X6R,г, И* 1Г

Ставится задача управляемого перевода системы (I) из з; го начального состояния на ш -мерное гладкое многообр за фиксированное время и доставлящего минимум функции качества т

1<и}« I аъ + Х1ТП. _

(при Щ= 0, О ). Функции ^ » ^ » ф - да!

непрерывно дифференцируемые по всем своим аргументам. ! малью задачи оптимального управления здесь и далее счи-

:е канонической системы принципа максимума Понтрягина. В :тствии с общей концепцией теории поля, если экстремаль погрузить в некоторую трубку непрерывного по начальным г поля, то в этой трубке экстремаль доставляет абсолют-;нимум функционалу качества. Использование регрессивно-мцила позволяет свести задачу построения поля к решению : Коши для канонической системы. Часть исходных данных ос при £=Т) в этом случае остаются свободными. Способ ¡ания позволяет конструктивно (алгоритмически) решить ■ построения поля и синтеза по нему оптимального управ-

1од вариационным поле;« сформулированной задачи лонимает-•егральное многообразие (Ш) экстремалей (1,5), 5€ Бс ^ , Шо/П } » такое Э-параме-

жое множество, которое удовлетворяет условиям: I) отоб-ге р - взаимооднозначное и непрерывное из В на Р , [0,Т) ; 2) 1йаи р$ = ПН [0,Т) ; 3) если

,*) б-Р , -1.еГо,Т), *о р{1,$)еР , *еГо,Т]. ■

конструктивное построение поля осуществляется вычленени-Б векторов 5 е. Бг{о«51<ЗГ}еН.11*т"1 И

дания вектора сопряженных переменных . 2 (Т) и положения на И . Зависимость . £(Т). от 5 производится с ис-шанием сферической системы координат с параметром в

■ве радиуса. , ■ '/■";■..

. . ' о

! е м м-а . Яри условии варьируеыости экстремали X (5 =

и

так

¥ЛТ)

I,

1~ См»-»

0 -

z Е

= П

V, II) + т

к] II

[ - [ 0 ! Iг ] , а I, • . Гг" - единичные матрицы раз-

П.- т и Ш , ;соо'тветстзенно,:У(. , счше-Ч"

шений . . к , г ° . ,

t»t¡.+At, S = SK+¿S, [X\XS]

матрицы фундаментальной матрицы для линеаризованной сопря® ной системы условий оптимальности, в D найдется окрестно< •f(S') , для которой при фиксированном J) шр* семейство ;

Q

шений канонической системы образует поле, включающее X

Предложено несколько способов построения синтезируемо: управления. Общей основой их является аппроксимация зависи; сти Ир t) - ti^it.S) и установление взаимосвязи между X t , S . I способ (тригонометрической интерполяции) осно на выделении из U:(-t,S) периодической составляющей, для

О

которой и применяется многомерная тригонометрическая штер ляция на равномерной по S сетке. При нахождении по инфо мации о X значений t и S используется система соот

- дх

дх = х-х\'к xl,K: yin. Их -x^li.

«*., Р

Указанная процедура построения повторяется для нескольких ловых по j) полей. При реализации синтезируемого управл ния интерполяцией отыскивается то поле,к которому принадле экстремаль, содержащая фазовук точку. П способ (синтез по "маяковым трассам") основан на применении формулы Тейлора для отобралЕения вектора состояния системы в сопряженный ве тор. В качестве опорного решения для такого отображения вь рается оптимальное программное решение, полученное регресс ным образом и включенное в параметрически сформированное г ле экстремалей. Ш способ (синтез по поверхностям уровней ; равления) наиболее эффективен в случае стационарных задач оптимального управления (требующим при реализации лишь од го поля экстремалей), и при плавном изменении управляххцих ¡ действий. Отличительной особенностью способа является v.cm

! информации о состоянии системы на программных решени->менгы времени, соответствующие фиксированным значениям 4 компонент управления. При 17 способе формируется па-зтремалей пс принципу заполнения области возможных на-( состояний системы управления. В качестве варьируемых гроБ выбираются не только компоненты вектора 5 , но и груктура синтезируемого управления выбирается обычно в «личных степенных форм от компонент состояния системы весттии коэффициентами. Для их определения при расче-ета в дискретные моменты времени фиксируется информация оякк;: :: угтра?п>=™и. Составляется и решается методом на-их квадратов система уравнений (как правило линейная), ные значения коэффициентов используются в качестве уэ-при интерполяции или сплайн-интерполяции на весь време-треэок управления.

§2 предполагается, что ^ не зависит от (автоно-истема), И - 0-мерное и Ц, £ Ц" > где \/ - ограни! замкнутое множество в Н . Идея использования поля остается применима и з этом случае. Информация о точках жчения управления на экстремалях применяется для аппро-;ии линий и поверхностей переключения. При реализации юзникаю? следуйте трудности: I) способов задания пара-I вариации и пределов их изменения; 2) нахождение крити-: значений параметров, которые инициируют особые и ско-10 ретапш и методы исследования этих режимов; 3) устало-з максимальных по длительности интервалов движения сис-5ез переключения; 4) нахождение значений параметров, зчивающих заданный допустимый закон переключения упраз-

Конструкция поля осуществляется с использованием сопр; женных векторограмм вида

где = г 1Т) и А^т) .1

делены случаи регулярных и сингулярных полей переменной ра: мерности. Доказаны следующие утверждения

Л е м м а I . Полный набор различных с позиции задачи быстродействия значений 21Т) задается выбором 5 е II

Л е м м а 2 . Если $ и. в моменты переключения Ц^ имеет хотя бы одну ненулевую компоненту, то с каддым регул ным переключением число компонент параметра в сокращаете на единицу, а зависимость Aj.IT) от $ сохраняет прежни вид.

Теорема . Пусть выполнены сделанные предположен и условия лемм. Предположим, что при $"5* все переключени и.^ регулярные и ,¿6.1,1 обращаются в нуль л

переключении Ц^ в моменты . , ••• »

пргам К * ПН

Фк.ЭД

где

ФМ)

- фундаментальная матрица уравнения X а, ~ " ? х ^ с коэффициентами, вычисленными на экстремал! решении (при $ а 5' ),а ф ) .Тогда,

ли моменты Т ^ , I е |, к не совпадают с моментами п< ключений II ^ , £ * 'у , найдется такая окрестность^( для которой семейство экстремалей образует регулярное пол!

Построение синтезируемого управления осуществляется

(влечением маяковых трасс и иногообразий переключения.

Для задач с фазовыми ограничениями (§3) постановка §1 юлняется условитт Xlt) eQ(t)c Rn; (jJ^(t,XJ<0

Wj,(t, X ) - 0 , j. 6 • в результате условия оп-

иальности пополняются условиям! скачка в моменты 1 вихо-траектории системы на активные ограничения. При нахождении нтезируемого управления используется комбинация параметри-ских полей центрального (ЦП) при 171 » 0 или трансверса-ногс (ТП) при (П 2 1 и тангенциального (КП), построение 1Торых осуществляется,как и ранее,от множества цели. Экстре-ш КП "окай«ля:от" при этом фигуру ограничений, а стыковка >лей разных типов производится по линиям касания экстремалей Т (ТП) с фигурой ограничений. Приведены условия существовала комбинации полей.

Комбинированные поля экстремалей используются также npj ешении разрывных и сингулярно возмущенных задач управления §4). При формулировке разрывной задачи полагается, что функ-ля непрерывна на всей области определения за исключением (П-I)-мерной поверхности $Р ; IJJtt, X) ~ <? , iP 6 Я , ta которой допускаются разрывы первого рода, и что на !Р вн-

юлняется условие "пропивания" tlm tjj ' 2irn Ш > О

t(i * о f - о

Три М О-мерюм ЦП переходит на ¡Р в ТП специального вк-5а. Приведет условия существования комбинированного поля. Синтез управлений осуществляется путем аппроксимации полей по семейству экстремалей с помощью изохронных поверхностей. В ТП отсчет временной переменней производится от момента схода фазовой точки с поверхности {Р . Идентификация изохронных поверхностей ссэес^ается методом сг^.т^ннсЯ ;!Н?еглсляиии.

Задача оптимального управления сингулярно возмущс! системы опишздется соотношениями

Xе $ = ^и.Х.^.и), иЦ./Г:

Для решения задачи синтеза используются комбинации мед; (регулярна) и быстрых (сингулярных) полей экстремалей, вной акцент исследования сделан на методах получения ш ческих и приближенных решений задачи Коши или краевой ; В основе предложенного подхода лежит способ установлен! разделения движений системы. Этот способ включает проц< замены переменной I одной из компонент состояния да стных решений. Так для автономной динамической системы, сываемой уравнением Я^- —

Г(и) , V е I?" устанс еся движение (УД) соответствует решению, зависящему яву неявно от одной из компонент *и"к , К £ 1,П как 01 висимой переменной. Замена ^ на осудествляе1

использованием дифференциального соотношения = Л - С0ги1 (для линейных систем Я)"к = Л Я/",, ). Понятие спространяется также на случай неавтономных систем и а рно возмущенных систем. Для анализа УД и выделения ре г; и сингулярных составляющих решений привлекается метод ) раш Ньютона.

Для перенесения результатов, полученных в главе П случай распределенных систем управления (глава Ш) ввод! рассмотрение бесконечномерное параметрическое поле.

В §1 объектом исследования служит распределенный 1 тельный процесс, описываешй уравнением

ии+ Аи + ^с21 -Ео.ТЗ.

Д £ (V" —V ) - линейный ограниченный саыосопряжен-и положительно-определенный оператор, У , V - компонен-снащенного гильбертова пространства, ß - замкнутый иэ-нный оператор. Ставится задача минимизации функционала ка-ва ^

Jip) = И ^la.u^pdxd-J + f^(u.at)dX|T (2)

лассе управлений р, pt G LMZ;Н) . Под вариационшл/ полем сформулированной задачи (I), (2) мается ИМ Р = £ Ct.©) 1 в - Ölt.S). S € Й , i £ Z ,

удовлетворяющее ус-ям: I) отображение v' - v'u,3) определяет гомеоморфа™ на фазовое пространство элемента -fr , а отображение ty(t.S) - однозначное V t £ Z ; 2) отображение об-мо У i ® Z ; 3) для всякой компоненты ф элемента из условия 04ie,S) : 6(t„(S) 6 Р следует 9(t,S)€ ( 6 11, S) содержит компоненту -О1 (-fc, S ) ), V i i . В определении Q - подпространство гильбертова прост-тва веществешгых числовых последовательностей 11 , а tf -таенная переменная.

При исследовании вопросов существования локальных полей печены сведения из теории полугрупп. Конструктивное постое поля осуществляется по методу Галсргана, а при задании анальных условий используется представление функций рядз-^рье. Предложены тр! способа реализации синтезируемого зления, основанных на сферической /. тригонометрической рполяции и маяковых трассах.

В §2 полученные результата рас.трсстрангатся нн системы гтедейстЕнек (3?ДУ)

х « а), ^ (¿,ТЗ,

где Х*= Х(1), г>о-сопн , ?

Ц. 6 I/ , и - класс кусочно непрерывных функций н

Т-г 1 со значениями в К™ . Отображение ^ яб

сит от хи-1^и), о< ^ гдм.г,...,^ и . Ка

управления оценивается функционалом т

1(10= ГфШГ))* X": 1Я10))с1т?, угО-^лЯ:.

Отображения ^ , , считаются непрерывными рцвно дифференцируемыми до второго порядка включител; всем аргументам. Дифференцируемость по X* понимав: смысле Фреше. Рассмотрен вопрос существования локалы ля экстремалей. Предложен способ конструктивного пос параметрического поля экстремалей, основанный на три рической интерполяции состояния системы. Значительно нке уделено разработке численной схемы интегрирован« в прямом и обратном времени. Отличительной особенное четой схемы является учет согласованности перемент яния системы и изменение гладкости решения с приращ* ременной на величину кратную г . Еаги пнгегр; выбираются равными 1 и на каадом ваге производите] вание переменных состояния. Доказана

Лемма. Пусть имеет производную Фреше порядка по X* и принадлежит классу СИ по { . ¡пение З^ДУ принадлежит классу С 1 . I Ь ^ - 1 £[¿ + 1^4)1, ¿ + и при условии, что £ 4 К+1 Ни т ерл о л яци о да о е описание поля и реализация с»' цествляется по следутцей схеме. Устанавливается пр:

1 взаимооднозначное соответствие медцу оценкой те-юстояния X и оценкой терминального состояния 5 ! линейной интерполяции), а затем устанавливается оде соотпётствие И от 3 по методу степенной инте: как тензорного произведения одномер<ых фундаменталь-браических многочленов. Выкладки вначале проводятся ,попарного случая при фиксированном р , а затем 'Ся на нестационарный случай интерполяцией, .ектом управления в §3 служит волновой одномерный про-:еоднородной полуограниченной среде

и - С(С их)х - 0 , -ь > 0, х >0 Ы

ными условиями двух ВИДОВ и.14,0)-И Их11 0)= . Здесь: С - С(Х) > 0 - кусочно-непрерывная . стках непрерывности и липшицева, ограниченная функ-I) , - управления, которые выбираются из усло-

мального по времени гашения приходящей волны. Постраничного синтеза проводится с использованием метода а, в полной мере учитывающего <{изику процесса. Это по-определить управления в явной форме и только через в состояние колебательного процесса. С позиций энер-их понятий рассмотрен вопрос корректности синтезируе-авления.

тличии от постановки задачи в §1 в §4 управление вхо-аничные условия. Оператор ^ эллиптического типа

2ГП а управление входит в граничный оператор ице Г* ) (2 т. -1)-го порядка и выбирается из класса ', 1_.ЧГГ)) , где через Н обозначено функциона-остранство Соболева. Исследование вопросов существо-

вазшя поля осуществляется с применение!»! метода Галеркина. нейная систещ, полученная из канонической дифференцировш по параметру 5 , преобразуется в бесконечную систему обы венных дифференциальных уравнений к далее используются по групповые свойства операторов полученной системы.

Глава 1У посвящена исследованию дифференциальных игр Одним из центральных вопросов в теории игр является выбо£ стратегий игроков. Понятие стратегии определяет не толькс тод решения задачи построения синтезируемых управлений, ^ возможность обоснования таких построений (например, вопр< существования или наличие седловой точки). Для выбора ст; гий в §1 проведен логический и численный анализ нескольк типов стратегий в том числе к традиционных. При тестиров результатов существенно использованы неоптимальные против стрия игрока противника. Эффективность стратегий провере для нескольких стандартных задач дифференциальных игр с ниченияыи на управления игроков интегрального типа и тиг равенств. В качестве наиболее эффективной выделена интв! интерполяционная стратегия (ИИС), учитывающая предыстор; управления игрока-противника. Отличительной особенность] проводимых исследований является учет условий неопредел! сти протекания дифференциальных игр. Неизвестными могут энергетические к функциональные возможности игрока-прот ка и сам характер игры (кооперативный, антогонистически вероятностный).

Для проведения обоснования выбора стратегии ШС и руктивного построения соответствующих ей управлений в { влечены метода теории поля экстремалей и теории функцш

ок.

2 на основе конструкций поля экстремалей дана методи-:и эффективности стратегий преследования в линейной циальной игре

t)X + B(t)u. + Cv-, x^R" xiT)=o,-fce[i0)T] en

гчениямк на управления игроков интегрального типа и завенств. В случае интегральных ограничений (эквивален-;ставленных для управлений U, функционалом стоимос-зктом анализа слуотт общая нестационарная модель (I) с эннми управлениями И £ R m , R^. С использова--1ЩИИ Вейерштрасса, при специально введенных экстремаль-рных решениях, получена формула для вычисления прираще-кционала стоимости. Эта. формула применена для оценки вности различных типов стратегий при фиксированном за-равления . Детально рассмотрен случай стратегии, ной на учете предыстории управления V(T), Т G [-fc0 V) озе этого управления на интервал (t,T] как управле-кстремальным противодействием1 (КИС с гарантией). учай с ограничениям на управления игроков типа нара-|U.|^Jlt , рассмотрен в упрощенной постановке

ционарной модели (I) и скалярных управлений U п 1У. тве функционала стоимости выбрано Т . Определены т?"-:ентные W- C0fH"t ) по функционалу.и начальному сос-противодействия I? . /правление V" рассматривается |ультат экстремального противодействия уровня -Jit) . гьзованием основной идеи схемы ВЗ.Зеличенко получена формула приращения Т при неолтлмальнсм прстизодей-V в фоше днффесенциалып-Х угаэнений с известия: «ми условиями.

Реализация подхода для различных численных моделей ференциальных игр, таких как игры "Шофер - убийца", "Двг томобиля", "Гонка" и пути решения некоторых игр с препя1 яда осуществлены в §3. В первых двух указанных играх прс но построение стационарных полей экстремалей, а в треты нестационарного поля. При анализе игр с препятствиями о< ное внимание сконцентрировано на выделении активного иг] В заключительной главе У рассмотрены различные прш ния полевых методов и методов оптимизации в задачах уст< вости, управляемости и прикладных задачах управления си<

ми с сосредоточенными и распределенными параметрами.

\

В §1 решается задача восстановления функции Ляпуно: для управляемой динамической системы, описываемой уравн<

Х = £(Х,Ы), р0.0)*0. хеН* ие£>* 1е(0,Т]

Используется связь меаду функцией Ляпунова и сопряженны ременными условий оптимальности для задачи стабил

е1 --Э">Г0/вл4, 1-й.....П, гг~и

т

/вт = Iд.(х. а)сИ: + |-1Х(Т)|Г—- пил.

. Задача оптимальной стабилизации включает минимизацию фу онала качества ПГ при Т ^ 00 .Из формул ев (2) Г" К) определяется интегрированием

1-1,г,...,п

Для нахождения функций Ц) . из формулы(3^ функцию ф представлено в специальном виде й произведено сравнение уравнения системы (2) , с. остальными уравнениями систем.;.

да-определения функциональной зависимости £ от X .,из--шые в главе П имеют особенность, связанную с большим ин-алом [О ,Т 1 • Здесь учитывается стабилизация во времени ^ициентов зависимости (2) для остановки вычислительного есса.

В задаче исследования устойчивости численными мет ода;,и лено два аспекта. Первый связан с формированием начальных ущений наиболее неблагоприятных по отношению к выбранной

состояния и сводится к задаче стартового управления, ой связан с поиском наиболее неблагоприятного в заданной ике текущего возмущения на систему. В §1 рассмотрен вто-из названных аспектов для стационарной упругой системы и исследования устойчивости динамической системы на конеч-интервале при постоянно действующих возмущениях. Даны фо-шровки соответствующих вариационных задач и проводится их шз.

В параграфе рассмотрена также задача построения областей

шляемости и глобальных полей экстремалей. Под множеством

шляемости понимается Q = { J (, И) ^ 0 ] » гДе

f,, М ) - совокупность процессов управления ( 0, Т, XI'),

|) с ХЮ) у., Х1Т)е И . Исходной задаче с интеграль-

л ограничению.!!! на. управление Т .

J(u) = ig.U,U)£U « t, е> о - const

оставлялась задача оптимального, в смысле минимума функциям J| (Д.) , управления. Использовалось следующее очевид-предложение. Если Ц." решение задачи оптимизации и U,*) ~ t , то множество фазовых точек Х(0) образует ницу множества управляемости при условии, что Х^) могут

быть включены в поле экстремалей. В соответствии с регр ныы принципом задача отыскания множества управляемости заменяется задачей отыскания множества достижимости. Ко циентн мощности поля р в данном случае считаются зав: ми от Э и выбираются в соответствии с условием 1(11° В общем случае граница множества управляемости включает типа поверхностей: терминальную, боковую и торцевую. Ос: внимание в проводимом исследовании сконцентрировано на лении торцевой поверхности. Она определяется либо услов: 1111°) = £ , либо представляет огибающую поверхно поля экстремалей. Подробно анализируется последний случ привлечением теории дифференцируемых многообразий и тео ветвления. При некоторых ограничительных предположениях зана лемма устанавливающая условия пересечения соседних ремалей.

Последние параграфы главы посвящены численному реш задач синтеза систем управления с сосредоточенными и ра деленными параметрами.

В §2 рассмотрены следующие задачи оптимального упр ния системами с сосредоточенными параметрами. Первой ис вата задача оптимального синтеза следящего вентильного ропривода. Применение вентильных преобразователей (ВП) темах автоматического управления обуславливается их выс энергетическими и регулировочными харй*й№рйстйкайй й бы действием. ВП одновременно являются выпрямителями тока лителями мощности. С учетом упрощающих предположений ма тическая формулировка задачи описана соотношениями

х,-фи>-х<)/Т|, х,- хЛн.Ч-кл»

Ll^/zlazcsiaU.^), xio)~lo,o,s), X(T) = o, T->min

Т»,Ти. Kp,KSlUe, to.-const.

звание пакета оптимальных программных ресений произво-

вариацией значений %г(Т) , НЭ1Т) • Пакет исполь-я для сбора ин'Тюрмадии о поверхностях переключения (в еле и на особый режим) и для установления функциональ-внсимости мезду , Хг(0) и £г(Т)Д3ГП (в форме

тений интерполяции) с целью обеспечения условий = X1 Ю) "О . Идентификация поверхностей переключения юдилась способом сферической интерполяции и трансверса-ориентации.

Задача оптимального синтеза режима остановки реактора дована в сле.лфтацей постановке

QX, + 6u-cx,-dxfa, хг=-а,х^а,и, te(o/T} X,It), te[o,T3. а,8,с,d.,а, - const.

(ахоздения линии схода с фазового ограничения использова-итерационная процедура. Лшши переключения управления ¿вались линейной интерполяцией.

Била исследована также задача оптимального управления и ивания процесса дозирования комбикор.гов. ?.!атематическая улировка после ряда преобразований и упрощений свелась к

уочей w-c^sipw*. К=Ф(у0-ЬпО,

1 Ш.-Ш^СгК+С,^, ^ = IllU-i, 60,

t

iiWUJ-Wj'di — nUn , -tsCt.J], V,1i1S.(i),,C<r^Wrt-fiml

Пакет экстремалей использовался для аппроксимации релейно висимости. Для повышения качества функционирования систем равления производилось оценивание компонент состояния. По: измерениям считались стационарными случайными процессами, летающими наряду с обычными шумами и редко появляющиеся м помехи. Оценивание осуществлялось методом фильтрации по К ну.

В §3 осуществляется численное решение задач управлен с распределенными параметрами. Первой рассмотрена задача тимапьного управления локальным нагревом пластины. Матема' екая модель процесса нагрева полосовой зоны описывается к; вой задачей , , . . .

ч-щи.ы + и^, ию/П, и.кв-1

Управление ищется из условия минимума функционала 5 . т 00

в г- Ни(Т,Х,0)-Ш1Х>Г(±^ -у! 1 р*с1Ш, "¡Г- сот

-Г о -•«

при ограничениях на управление и состояние вида

I р I *с, , и(Т,в»0)»С». и(Т,Х>0)ЪЦНХ), Ч>10)* 1ии,о,о) - ии,0}£)14 се, с,„С,,с, - соп$1

На первом этапе проводился предварительный анализ одномер! краевой задачи с использованием соответствующих интегралы тождеств. На втором этапе подбором Т удовлетворялись на) кенные ограничения. Для реализации полученного закона упр; ления использовалось представление р|1,Х) в форме Синтез сводился в этом случае к определению С{,Ш и Т в кущий момент времени. . . :

В задаче управления сложными колебаниями, исследовало< взаимодействие распределенных, и' сосредоточенных .колебател!

звеньев. Математическая формулировка задачи -Описывалась ношения!,га - = - л? ехр{-]И(и-1рг} Г(Х-р).

) = Е 1Т)+на, р)- у)1 —

эмощью метода Фурье и уравнения Волътерра(при XР - ) м1--лческая система преобразуется в систему интегро-даМерон-льных уравнений переменной I . При расчете пакета зкст-алей в качестве варьируемых параметров выбирались величи-у.1Т) . ^(Т) и коэффициенты Фурье начштшгх условий для , .В имитационных расчетах использовалась простей-

[ структура синтезируемого управления

= + у, + 5) р).

Для обоснования численных способов, предложенных в рабо-получены оценки точности. Это относится к многомерной три-юметрической и сферической интерполяции, численному интег-эовшшю сингулярно возмущенных систем, систем с последейст-зм и опережением, интерполяционным способам синтеза, синте-по маяковым трассам и по поверхностям уровня (для сосредо-ченных систем). С естественными изменениями эти оценки мож-обобщить на другие типы систем управления. Изложение теоретических вопросов во всех главах сопрово-ается решением численных примеров. На этих примерах деыонст-руется методика построения синтезируемого управления и тех-|Логии проводимых вычислений. Основой проводимых расчетов [ужат результаты, полученные при решении соответствующих за-14 программного управления. с

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОМ

В работе систематически развивается направление, св. ное с приближенным решением задач оптимального синтеза у; ляемых систем. В основе предложенного подхода лежит испо, ванне теории параметрических полей экстремалей. Разработ. конструктивный способ построения полей путем применения рессивного принципа. Показана применимость подхода для ; ния широкого класса задач управления: без ограничений и I раничешями на управление или состояние; разрывными и га лярно возмущенными системами; систем с сосредоточенными I определенными параметрами; нестационарными и нелинейными; фиксированным и нефиксированным конечным моментом времет с многообразием цели различной размерности. Разработаны с собы реализации синтеза по различным аппроксимациям поля тремалей с применением многомерной интерполяции, сферичес идентификации, "маяковых трасс" и тейлоровских отображена поверхностей уровня управлений. Большое внимание уделено следованию вопросов существования полей и анализу их нак гегральных многообразий.

Основные результаты диссертации связаны с проблемой теза оптимального управления при мгновенных (начальных) в иущениях (главы П,Ш). В главе 1У рассмотрены задачи позиц ного управления в условиях неопределенности (при постоянн действующих возмущениях). Такие задачи трактуются как зад дифференциальных игр двух объектов (лиц). При исследовани: основной акцент сделан на исходном понятии - стратегии иг; ков. Анализ различных типов стратегий (логический и числе] иый) позволил выделить интегро-интерполяционный тип страт гий как наиболее эффективный и перспективный. Эта стратеп

читана на функционирование в условиях неопределенности и х измерениям и ыожот быть использована в адаптивных алго-.ах управления. В случае линейных дифреренциалыак игр при тральных ограничениях и ограничениях типа неравенств на шления получена методика оценки эффективности различных 1тегий. Методика применена для оценки эффективности гаран-званной интегро-интерполяцнонной стратегии.

Показана возможность применения методов теории поля к ре-ию задач восстановлешя функций Ляпунова и построению облай управляемости. Уделено внимание задаче численной провер-динамической и статической системы на устойчивость.

Для иллюстрации теоретических результатов и выявления эф-:гивности построенных правлений проведено ряд численных ра-зтов на ЭВМ модельных систем с сосредоточенными и распреде-■пшми параметрами и задач дифферещиальных игр.

Для конструктивного построения синтеза наряду с известш-методами численного анализа использованы модификации и обо-ения методов шгогомерной интерполяции, интегрирования эволю-онннх систем, систем с последействием и сингулярно возмущек-п: систем

Основные результаты диссертации опубликованы в следующих ьботзх

. Егоров Л.И., Зоменко Л.З. Об оптимальной стабилизации упругих систем // Динамика управляемых систем. - Новосибирск: Наука, Снб. отд-е, 1С75. - С.П2-121. . Егоров АЛ., Гоменко А.З. Оттамалыпй! синтез в задаче управления системой, описываемой уравнением гиперболического типа // Опг,ш;:зад;!я систем с распределенными параметрами.-'ч.унзе: Г.га, 1~с0. - С.75-£6.

). Зоменко А.З. Вариационны:!'метод з-задаче управлс-ггия нелл -

неЯнами колебаниями распределенной системы // Вестн. рьковского ун-та; Иехан., теория упр-я и матем. физи Харьков: Изд-во ХГУ, 1982. - II? 230. - С.35-41.

4. Фоменко A.B. Оптимальный синтез адаптивных систем II тод функций Л.М.Ляпунова в совр. матем.: Тез докл. Е ел'/* ,3, научн. конф. - Харьков, IS86. - С.180.

5. Фоменко A.B. Восстаиовлотю функций Ляпунова управля систем // Там же. - С.77.

6. Фоменко A.B. Приближенный синтез оптимальных систем ления // Оптимальное управление. Геометрия и анализ: докл. Всесоюз. школы. - Кемерово, 1986. - С.49.

7. Фоменко A.B. Пристрелочный метод решения задач оптим го управления с пограничным слоем // Методы малого п тра: Тез. докл. Всесоюз. научн. совещ. - Нальчик, 19 С.151.

8. Фоменко A.B. Синтез оптимального управления сложными лсбанияш // Актуальные проблемы модел. и упр-я сист распределенными параметрами: Тез. докл. Всесоюз. нау технич. конф. - Киев, 1987. - С.98.

9. Фоменко A.B. Интерполирование стратегий дифференциал игр в условиях неопределенности // Автоматика и теле ника. - 1987. - 9. - С.44-50.

10. Egoiov-A.I., FomenKo А. V. ConlioE fot а. dampii ргорй^а-iLve wavei // 7 hh IFAC WotksKop on io£ appiicaUons o^ nontineai pxoyiamminy. a "timii.Q.'t ion : Mibacis.- T6i£iü, Ш8.- P. ■

11. Фоменко A.B. Приближенный синтез оптимального улравл распределенными системами. - 1С;;ев, 1989. - 21 с. Шр ринт / АН УССР. Ин-г кибернетики: 89-16).

17. 5оменко A.B. Синтез оптимального управления с исполь

м параметрического поля и тейлоровских отображений // . АН СССР. Сер. техн. киберн. - 1989. - К? 2. - С.75-79. ксеев Г.Ф., Фоменко A.B. Синтез оптимального управле -локальным нагревом пластины // Матем. метода оптималь-о упр-я и их прилоя.: Тез. докл. Мевдунар. совстско-по-го семинара. - Минск, 1989. - С.135-136. енко A.B. Синтез оптимального быстродействия с исполь-анием полей экстремалей переменной размерности // Докл. УССР. Сер. А. - 1989. - К? И. - С.23-26. енко A.B. Управление демпфированием распространяющихся н в неоднородных средах/Автоматика.-1990. - 1П2.-С.46-49. енко A.B. Построение множеств управляемости с использо-ием конструкций поля экстремалей//Упр-е многосвязн. Симами: Тез. докл. У1 Всесоюз. совещ.-Суздаль,1990.-03-104.

енко A.B. Многомерная тригонометрическая интерполяция Укр. матем. ж-л. - IS90. -N54. - С. 560-571. енко A.B. Применение метода Далаыбера в численном ана-е // Дифференц. ур-я. - 1990. - К? 6. - C.I067-I073. енко A.B. Синтез оптимального управления разрывными темами с использованием комбинированных поле!: экстре-ей И Изв. АН СССР. Сер. техн. киберн. - 1990. - 3. -93-197.

енко A.B. Прилогение теории поля экстремалей к граннч-управляемнм задачам распределешоаш системами // Пробы комплексной автоматизации: Тез. докл. 1У Меадунар. чно-техл. хонф. - Киев, 1990. - С. 97-101. :енио A.B. Синтез оптимальных систем ¿"правления с послс-ствием по полю экстремалей // Управление в мехшглч. си-

лс.

стемах: Тез. докл. УТ1 Всесоюз. конф. - Свердлове C.IC7.

22. Фоменко A.B. Синтез сингулярно возмущенной систем ления с использованием медленных и быстрее полей лей // Изв. АН СССР. Сер. техн. киберн. - 1991. -С. 57-61.

23. Фоменко О.В. Олтимальний синтез у задачах керува* зовими обмеженнями // В'юник Ки1вського ун1версис зико-матемагичн1 науки. - КиХв: Либ1дь, 1991, - I С. 57-61.

Закаа/У/,? Тира* 100 ГЬдп. к пеЧ. £У.0£У2 Подразделение? оперативной полиграфии ЗЦКТЭЙ