Задача гарантированного динамического поиска тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Пивоварчук, Денис Геннадьевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2006 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Задача гарантированного динамического поиска»
 
Автореферат диссертации на тему "Задача гарантированного динамического поиска"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М. В. ЛОМОНОСОВА

На правах рукописи

щ

Пивоварчук Денис Геннадьевич

ЗАДАЧА ГАРАНТИРОВАННОГО ДИНАМИЧЕСКОГО

ПОИСКА

01.01.02 — Дифференциальные уравнения

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Москва - 2006

Работа выполнена на кафедре оптимального управления факультета вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова

Научный руководитель: доктор физико-математических наук,

профессор Григоренко Николай Леонтьевич

Официальные оппоненты:

доктор физико-математических наук, профессор Лотов Александр Владимирович

кандидат физико-математических наук, Хабаров Николай Васильевич

Ведущая организация:

Институт математики и механики УрО РАН, г. Екатеринбург

Защита диссертации состоится 2006 г. в 14.30

на заседании Диссертационного совета К 501.001.07 при Московском государственном университете им. М. В. Ломоносова по адресу: 119992, ГСП-2, Москва, Ленинские горы, МГУ, второй учебный корпус, факультет вычислительной математики и кибернетики, ауд. 685.

С диссертацией можно ознакомиться в библиотеке факультета вычислительной математики и кибернетики МГУ.

Автореферат диссертации разослан "

И .. а£г^сХо. 2006 г

Ученый секретарь Диссертационного совета,

доцент

В. М. Говоров

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Работа посвящена одной из задач гарантированного управления динамической системой в условия неопределенности — задаче гарантированного динамического поиска.

В литературе рассматриваются различные постановки задач динамического поиска. Большинство из них характеризуются следующими понятиями: динамическая система, описывающая процесс поиска, множество допустимых стратегий ищущего объекта, множество допустимых стратегий прячущегося объекта и условие, выполнение которого означает обнаружение прячущегося объекта ищущим. Цель ищущего объекта, при выборе своей стратегии, — обеспечить выполнение условия обнаружения, цель прячущегося объекта — избежать выполнения условия обнаружения. Задачи поиска характеризуются тем, что ищущий объект при выборе своей стратегии обладает только априорно известной до начала процесса поиска информацией, такой как множество возможных стратегий прячущего объекта и множество возможных начальных положений системы. Никакой дополнительной информации о текущем положение динамической системы и стратегии, выбранной прячущимся объектом, во время процесса поиска не поступает. Другая важная черта задач поиска состоит в том, что момент выполнения условия обнаружения не фиксирован. Таким образом, задачи поиска составляют отдельный класс задач управления. ,

Среди постановок задач динамического поиска можно выделить три основных класса: стохастические, игровые и гарантированные задачи поиска. Данное деление определяется различным понимаем решения задачи.

Примером стохастической задачи поиска является задача, в которой априорно известна (или удовлетворяет заданным уравнениям) функция распределения вероятности выбора прячущимся объектом заданной стратегии из множества допустимых стратегий. Под решением задачи понимается допустимая стратегия ищущего объекта, максимизирующая некоторый функционал, который отражает эффективность стратегии поиска. Например, таким функционалом может быть вероятность выполнения условия обнаружения на заданном отрезке времени. Стохастические задачи поиска исследовались в работах В. И. Аркина, О. Хеллмана1, В. А. Абчука, В. Г. Суздаля2, Л. А. Пет-росяна, Л. А. Емельянова.

В игровой постановке, задача поиска является игрой двух лиц с нулевой суммой (в случае одного ищущего игрока). В качестве функционала, который

'Хеялман О. Введение в теорию оптимального поиска — М-: Наука, 1985.

2Абчук В. А., Суздаль В. А. Поиск объектов — М.: Советское радио, 1977.

минимизирует ищущий и максимизирует прячущийся, часто рассматривают время прошедшее до момента выполнения условия обнаружения при выбранных стратегиях игроков. Под решением задачи понимается пара — стратегия ищущего и стратегия прячущегося игрока, — которые соответствуют сед-ловой точке функционала. Как правило, в игровой задаче поиска решение ищут в смешанных стратегиях, т.е. находят вероятностные распределения на множествах допустимых стратегий игроков. Игровые задачи поиска рассматривали: Р. Айзеке3, JI. А. Петросян4, Н. А. Зенкевич, А. Ю. Гарнаев, М. И. Зсликин, S. Gal, В. О. Koopman.

Задачу гарантированного поиска рассматривают в различных постановках, в зависимости от предположений о динамики прячущегося объекта. Так рассматривают задачи о поиске неподвижного объекта, о поиске объекта с заданным параметрическим семейством возможных траекторий, о поиске управляемого (другим лицом) объекта. Под решением задачи понимается допустимая стратегия ищущего объекта, обеспечивающая выполнение условия обнаружения при любой допустимой стратегии прячущегося объекта. Гарантированный поиск рассмотрен в работах Ф. Л. Черноусько, JI. А. Петросяна,

B. В. Скитовича, С. В. Чистякова, А. Ю. Гарнаева, Н. А. Зенкевича, О. А. Малафеева, Д. П. Кима, Е. В. Шикина, С. М. Губайдуллина, А. Г. Чхартишвили,

C. Б. Березина, П. М. Ларина, А. А. Скворцова, С. В. Местникова.

Задача гарантированного поиска неподвижного объекта предполагает, что

прячущийся объект в начальный момент времени выбирает точку своего положения из заданного множества и остается в этой точке в течение всего процесса поиска. Ищущий объект должен выбрать такую траекторию движения, чтобы гарантировать выполнение условия обнаружения для любой точки множества возможных положений прячущегося объекта. Следующей задачей гарантированного поиска является задача, когда прячущийся объект подвижен и выбирает траекторию своего движения из заданного параметрического семейства кривых. Соответственно, ищущий объект должен выбрать такую траекторию движения, чтобы гарантировать выполнение условия обнаружения для любой возможной кривой движения прячущегося объекта. В работах В. В. Скитовича и С. В. Чистякова5 предложен метод, который позволяет свести эту задачу к задаче поиска неподвижного объекта.

Задача поиска управляемого прячущегося объекта предполагает, что прячущийся объект выбирает допустимое программное управление, которое порождает его траекторию движения. Ищущий объект не обладает информаци-

эАйзекс Р. Дифференциальные игры — М.: Мир, 1967.

'Петросяя Л. А., Гаргаеп А. Ю. Игры поиска — Л.: Изд. ЛГУ, 1992.

5Скитопип В. В., Чистяков С. В. Игровые задачи сближения и поиска. М-: Изд-во МАИ, 1985.

ей о сделанном выборе. Он должен выбрать свою траекторию движения, гарантирующую выполнение условия обнаружения для любой допустимой траектории прячущегося объекта. Этой задаче гарантированно поиска в предположении, что динамика ищущего и прячущегося объектов является простой, посвящен целый ряд работ. В работах Ф. Л. Черноусько6 рассмотрена задача поиска в двумерном и трехмерном пространстве, когда прячущийся объект может перемещаться только в пределах заданной области. Большая серия работ написана Е. В. Шикиным7 и его учениками А. Г. Чхартишвили, С. Б. Бе-резиным8, П. М. Лариным9, А. А. Скворцовым10, в которых исследуется задача поиска на некотором классе поверхностей, в двухмерных и трехмерных областях, приводятся достаточные условия существования и численные методы построения траекторий поиска. Основной инструмент этих исследований — анализ области неопределенности, т.е. множества точек, где может находиться прячущийся объект в определенный момент времени. Метод аппроксимации области неопределенности для сложной динамики ищущего и прячущегося объектов рассмотрен в работах С. В. Местникова11.

В данной работе рассматривается задача гарантированного поиска управляемого прячущегося объекта, которая в общем виде формулируется следующий образом. Динамика системы описывается системой обыкновенных дифференциальных уравнений

г = (1)

Функция и — — программное управление, которое требуется выбрать из заданного множества допустимых управлений Ы, в соответствии с заданной целью. Функция v = ь(€) — неизвестное возмущение, которое может возникнуть в системе, причем известно множество возможных возмущений V. В начальный момент времени Ь = £о положение системы определено неточно. Известно, что начальная точка г(<о) принадлежит заданному множеству .^о. Обозначим решение дифференциального уравнения (1) к моменту времени 4 с начальной точкой ¿(¿о) = и функциями и(-), и(-) через г(£|£о, го, «(■).«(')) ■

вЧерноусько Ф. Л. Управляемый поиск подвижного объекта // Прикладная математика и механика. — 1980.-Т. 44, №1

7Чхартишвшш А. Г., Шик ли Е. В. Динамический поиск объектов. Геометрический взгляд на проблему. // Фундаментальная и прикладная математика. — 1995. — Т. 1, № 4

8Шикик Е. В., Березин С. В. Поиск объектов. Динамика- Геометрия. Графика // Фундаментальная и прикладная математика.— 2005.— Т. 11, № 1.

9 Ларин П. М. О неразрешимости задачи гарантированного поиска в достаточно большой области // Вестник Московского университета, Сер. 15, Вычислительная математика и кибернетика. — 2000. — № 1.

10Скворцов А. А. Динамический поиск в выпуклых областях // Фундаментальная и прикладная математика. — 1998. — Т. 4, № 2.

11Местников С. В. Аппроксимация области неопределенности в дифференциальных играх поиска // Дифференциальные уравнения. — 1992. — Т. 28, № 6.

Задачу гарантированного динамического поиска сформулируем следующим образом: найти момент времени Ts и найти такое допустимое управление us(-) G U, что для каждой начальной точки zq € Zo и для каждого возможного возмущения v(-) € V найдется момент времени t — Ï(zq, v(-)) € [îq,Ts], для которого выполнится терминальное условие (условие обнаружения)

Tc(t)z(t\to, Zq, «,(•), v(-)) 6 M{ï), (2)

где 7r(i) — матричная функция и M(t) — многозначное отображение, заданные на отрезке времени [¿о,?1*].

Отметим, что в соответствии с поставленной задачей, требуется найти такое программное управление и3(-) € Ы, до начала движение системы, которое обеспечит выполнение терминального условия (2), каким бы пи оказалось начальное положение системы z(to) S Zo и какое бы допустимое возмущение v(') € V ни возникло в системе. Причем момент выполнение терминального условия не фиксирован и, вообще говоря, зависит от пары (z(iQ),t;(-)). Выбор управления «.,(•) определяется только дифференциальным уравнением (1), множествами Zo, К, V, матричной функцией Tc(t) и многозначным отображением M(t).

Частным является случай, когда динамическая система распадается на две независимые части

Г x = g(t,x,u), .

\y = A(i,y,t;). W

В начальный момент времени t = ¿о для начальной точки x(îq) выполняется равенство x(to) — xq, а для начальной точки y(to) известно только то, что выполняется включение y(to) G Yo, где Yq — заданное множество.

Движение вектора x(t) определяется заданной начальной точкой a;(io) = xq и выбранной функцией «(•) £Ии не зависит от неизвестной функции v(-). Будем считать, что вектор x(t) описывает положение некоторого, управляемого нами, объекта, которого обозначим буквой S. Аналогично, движение вектора y(t), определяемое начальной точкой y(to) € Yq и функцией а(-) 6 V и не зависящее от функции и(-), определяет движение другого объекта, которого обозначим буквой II. Движение объекта H не контролируемо нами и, более того, не известно, так как не известны ни начальная точка y(to), ни функция и(').

В этом случае, задачу гарантированного динамического поиска сформулируем следующим образом: найти момент времени Т„ и пайти такое допустимое управление us(-) G II, что для каждой начальной точки уо 6 Yo и для каждого возможного возмущения г>(-) € V найдется момент времени

t = t(yo,v(-)) € [io, Ts], для которого выполнится терминальное условие

7TH(t)y(t\t0, у0, v(-)) е irs(t)x(t\t0, х0, «»(•)) + M(t), (4)

где 7Tff(t), 7rs(i) — матричные функции и M(t) — многозначное отображение, заданные на отрезке времени [¿о, Т1«]•

Задача (3), (4) допускает следующую геометрическую интерпретацию. В начальный момент времени ¿о объект H находится в некоторой точке y(to) G Yo • Затем он начинает движение с некоторым допустимым управлением и(-) е V. Объект S в начальный момент времени находится в заданной точке x(Lq) = Xq. Он не знает точного значения y(to), не знает выбранного управления и(-) и не получает никакой информации о траектории y(t) движения объекта H. Цель объекта S заключается в выборе управления щ{-) G U, обеспечивающее выполнение терминального условия (4) для любой возможной пары (y(to), v(-)) е Vf) х V. Или, другими словами, объект S выбирает управление us(-) так, чтобы найти движущийся объект H, если условием обнаружения объекта H является включение (4). Такая геометрическая интерпретация описанной задачи объясняет название работы. Будем называть объект S — ищущим, объект H — прячущимся, управление и(-) —управлением ищущего объекта, управление v(-) — управлением прячущегося объекта, управление «„(•), решающее задачу, — управлением поиска.

В традиционной постановке задач поиска динамика ищущего и прячущегося объектов считается независимой друг от друга. В работе сформулирована и исследуется более общая задача (в первой и третьей главе), когда динамику объектов нельзя разделить на независимые части. Постановка задачи формулируется как задача управления в условиях неопределенности в классе программных управлений. Подходы к решению задач управления в условиях неопределенности в классе программных управлений в случае, когда момент времени прихода на целевое множества задан, исследовались А. Б. Куржан-ским12, В. В. Скитовичем, С. В. Чистяковым и др. В задаче поиска момент времени прихода на целевое множество (т.е. выполнения условия обнаружения) не фиксирован. Методы решения таких задач нуждаются в дальнейшем развитии.

Вторая задача, которая рассматривается в работе и связана с задачей гарантированного поиска, заключается в построении множества начальных точек Zq, для которых заданное управление и(-) на заданном отрезке времени [io,T] является управлением поиска.

Эта задача пересекается с задачей построения множества начальных по-

12Куржанский А. Б. Управление и наблюдение в условиях неопределенности — М.: Наука, 1977.

зиций разрешимости задачи преследования в нелинейных нестационарных дифференциальных играх. Подход к построению множества начальных позиций в дифференциальных играх основан на понятии стабильного моста, введенного в работах Н. Н. Красовского и А. И. Субботина13. Методы построения стабильных мостов исследовались в работах Н. Н. Красовского, А. И. Субботина, Б. Н. Пшеничного14, В. В. Остапенко, В. Н. Ушакова15, А. А. Успенского, Т. Б. Токманцева, А. М. Тарасьева, В. С. Пацко, А. А. Ме-ликяна, Е. С. Половинкина.

При применении подобного подхода к задачам поиска необходимо учитывать, что нестационарность задачи поиска возникает в результате подстановки в правую часть дифференциального уравнения управляющей функции.

Цель работы. Цель работы состоит в получение условий на управление, решающее задачу гарантированного динамического поиска. Разработке конструктивных методов построения управления поиска. Разработке методов нахождения множества начальных позиций динамической системы, из которых разрешима задача поиска на заданном отрезке времени для заданного управления поиска.

Основные результаты работы.

1) Для линейной нестационарной системы дифференциальных уравнений доказана теорема о необходимом и достаточном условии, которому удовлетворяет кусочно-постоянное управление, решающее задачу гарантированного поиска, в которой условие обнаружения проверяется в конечном числе заданных моментов времени.

2) Предложен конструктивный метод нахождения управления поиска в задаче с линейной динамикой прячущегося объекта, простой динамикой ищущего объекта и двумерным терминальным множеством. Доказана теорема о достаточном условии разрешимости этой задачи.

3) Доказаны теоремы о точном представлении и приближенном построении с любой наперед заданной точность в метрике Хаусдорфа множества начальных позиций, из которых разрешима нелинейная задача поиска при заданном управлении ищущего объекта.

Методы исследования. В работе используется теория дифференциальных уравнений, теория многозначных отображений, выпуклый анализ, принцип максимума для задач оптимального управления, метод динамического программирования.

13Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры — М.: Наука, 1974.

"Пшеничный Б. Н., Остапенко В. В. Дифференциальные игры — Киев: Наукова думка, 1992.

"Ушаков В. Н-, Успенский А. А., Токманцев Т. Б. Стабильные мосты в дафференциальных играх на конечном промежутке времени. Труды института математики и механики УрО РАН Т.] О, № 2 — 2004.

Научная новизна, теоретическая и; практическая ценность работы. Результаты работы дополняют теорию гарантированного поиска и теорию управления в условиях неопределенности. В работе рассматривается задача поиска для динамических систем общего вида, которая в настоящее время мало изучена.

Необходимое и достаточное условие на управление, решающее линейную задачу гарантированного поиска, и методы представления множества начальных позиций разрешимости нелинейной задачи гарантированного поиска могут быть использованы как для дальнейшего аналитического исследования структуры решения задачи, так и для разработки численных методов.

Конструктивный алгоритм построения управления поиска для задач с двумерным терминальным множеством может быть непосредственно использован для построения управления поиска. В качестве примера применения алгоритма рассмотрен случай эллипсоидальных геометрических ограничений на управления объектов.

Апробация работы. Результаты работы были представлены в виде докладов на научной школе-конференции "Мобильные роботы и мехатрошше системы", Москва, Институт механики МГУ, 17-18 ноября 2003 г., международном семинаре "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби", Екатеринбург, 22-26 июня 2005 г., научном семинаре кафедры оптимального управления факультета ВМиК МГУ под руководством академика РАН Ю. С. Осипова и профессора М. С. Никольского.

Публикации. Основные результаты диссертации опубликованы в работах (1] — [4]. Все результаты вошедшие в диссертацию и в перечень опубликованных работ получены автором самостоятельно.

Структура и объем диссертации. Диссертация состоит из введепия, трех глав и библиографии. Общий объем диссертации 138 страниц, включая 3 рис. Библиография содержит 94 наименования.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении раскрываются цели и задачи работы, ее актуальность, а также кратко описываются основные результаты, полученные в работе.

В первой главе рассматривается задача поиска для линейной нестационарной системы

z = B(t)u + V

на заданном отрезке времени [¿о, Т], где вектор г G R", u(t) € U, U — выпуклый компакт в пространстве Rp, v{t) 6 V(t), V(t) — измеримое ограниченное многозначное отображение отрезка [to,T] во множество непустых

выпуклых компактов пространства R®, элементы матрицы B(t) — непрерывные функции на отрезке [to, СГ].

Такая система включает в себя как частный случай линейную систему

z = A(t)z + B{t)u + C(t)v,

где вектор z € R", u(t) E U, U — выпуклый компакт в пространстве Rp, v(t) € V, V — выпуклый компакт в пространстве Rg. Элементы матриц л(г) € Rnxn, B(t) е Rnxp, C(t) € Rnxi - непрерывные функции на отрезке [1к,Т].

Пусть задано непрерывное многозначное отображение M(t) на отрезке [¿о, Т] во множество непустых выпуклых компактов пространства Rm, матрица тг(£) € Rmx" с непрерывными элементами на отрезке [io, Т] и выпуклый компакт Zq в пространстве R".

Задача гарантированного динамического поиска формулируется следующим образом: найти такое допустимое управление us(l) на отрезке времени [<0i 71]. что для каждой точки z0 6 Zq и каждого допустимого v(-) существует момент временя t = t(zo,v(-)) 6 [¿о, Т], для которого выполняется терминальное условие

■к (t)z(t\tQ, z0, «,(•), «(•)) eM(t).

Сформулированная задача называется непрерывной задачей поиска. Совместно с непрерывной рассматривается дискретная задача.

Зафиксируем произвольное конечное разбиение отрезка [fo, Т]

из =

где ti-i < U для i ~ I,..., N к tpt = Т. Дискретная задача поиска для заданного разбиения ш формулируется следующим образом. Найти такое допустимое кусочно-постоянное управление uf(t) = щ для t е (i<_j, г = 1,..., N, что для каждой точки Zq £ Zq и каждого допустимого v(-) существует момент времени t = t(zo,u(-)) € w, для которого выполняется условие

7r(t)z(t\t0,z0, «,{•), «(■)) е М{1).

Решение дискретной задачи поиска й^'(-) для любого конечного разбиения си является решением непрерывной задачи поиска.

Выпуклые компакты M(i,), ijgu, г = 0,... ,N, представляются в виде

M(U) = {* е Rm| (х, Ф{) < с(М(и), V е Ф4},

где множества Ф1 С ¿^(О), г = О,..., Л?, являются компактами. Будем обозначать через с(А,ф) опорную функцию множества А в направление тр.

На основе выпуклого анализ получено следующее необходимое и достаточное условие, которому удовлетворяет кусочно-постоянное управление, решающее задачу поиска, если выполнение условия обнаружения проверяется в заданные фиксированные моменты времени к = 0,..., N.

Теорема. Пусть задано кусочно-постоянное управление й(-): и(£) =йц£ II, £ € к = 1,.... ./V. Тогда для каждой точки 2о € и каждого

допустимого v(■) существует момент времени I — у(-)) 6 ш такой, что

^(¿>(¿1*0,20,б(-)."(*)) еМ(г),

тогда и только тогда, когда

тах

1-0.....)

N

.7=1

Г "

тш лг Л { с(г0, V ацгТ(Ц)ф*) - с(М^0),а0ф°) + N \ N

£ аУШ* ) + а^Ш') -

/ 1=7

<0,

где множество V*, к = 1,..., N, определяется через интеграл Аумана от многозначного отображения

V" = Г*

Г'*

/ В{з)йз.

¿Ь-1

и матрица

Вк

Применение метода динамического программирования приводит к рассмотрению конечной последовательности рекуррентно заданных функций

Щх,а)= тах {с(£0,атгг(<0)^0 + х) - с(М(С0), а^0)} ,

Rk(x,a) = max min {Rk-i{akTrT(tk)i>k + x, ~ak + a) +

+ (Вкйк, а*тгT{tk)^k + x) + c{Vk, акът{1к)фк + x)-

~c(M(tk), akipk)},

k = l,...,N,

где функция Rk(x, а) определена на множестве £>к С R" х R1:

Dk = co((Gk, 0) U (0,1», i = 0

Gk-x = co(-TrT(tk)VkUGk), k = l,...,N,

Gn = {0}.

Основной результат первой главы сформулирован в следующей теореме. Теорема. (Необходимое и достаточное условие, которому удовлетворяет кусочно-постоянное управление, решающее задачу поиска, если условие обнаружения проверяется в заданные моменты времени, количество которых конечно)

Пусть задано кусочно-постоянное управление ü(-): ü(t) = щ 6 U, t 6 (tfc_i,ijfc], k = 1,..., Дг. Тогда для каждой точки z0 € Zq и каждого допустимого v(-) существует момент времени t = t(zo, v(-)) 6 ш такой, что

7r(T)z{i\t0,z0,ü(-),v(-)) е M(t),

тогда и только тогда, когда Ry(0,1) < 0.

В первой главе исследованы свойства множеств Dk и функций Rk(x,a), к — 0,..., N, которые отражены в следующих леммах.

Лемма. Множество Dk, к = 0,..., N, является выпуклым компактом. Лемма. Функция Rk(x, а), к — 0,..., N, является выпуклой на множестве Dk.

Лемма. Пусть (ж, а) € Dt, (Ах, Аа) 6 Dk и А > 0, тогда Rk{ Ах,Аа) = А Rk(x,a),

fc = 0,...,АГ.

Вторая глава работы посвящена задаче поиска в случае, когда динамика ищущего и прячущегося объектов является линейной и независимой и терминальное множество является двумерным выпуклым компактом.

В первой части второй главы рассматривается следующая динамика объектов

S : х = и,

Н: у = Су + Оу,

где х € II2, у 6 К"", «(<) € 17 С К3 — управление объекта 51, и (г) е V с И*3 — управление объекта Н. Здесь ¿7 — выпуклый компакт в пространстве И2 и V — выпуклый компакт в Д.4.

В начальный момент времени Ь — ¿о выполняются соотношения ^(¿о) ~ ^о, &?(£о) £ где хо ~ заданная точка и >о — заданное выпуклое компактное множество в К"".

Задача поиска объекта Н объектом 5 формулируется следующим образом: найти момент времени Т, и такое допустимое управление ма(-) на отрезке времени [¿о, Т,], что для любой начальной точки у0 £ Уо и для любого допустимого управления и(-) найдется момент времени I = <(уо, г-'(-)) € [¿о, > для которого выполнится условие обнаружения

ънуШУО, О) £ аг(г]х0, и*(-)) + М,

где М — заданное выпуклое компактное множество в К2 (терминальное множество) и 7Гя б И2*"" — матрица ортогонального проектирования на И2.

Предлагается метод построения управления поиска. Основным инструментом является понятие области неопределенности, которая отражает состояние процесса поиска к данному моменту времени.

Определение. Областью неопределенности П(£]«(-)) в момент времени I, отвечающей управлению ы(-), называется множество концов траекторий у(Т\у0, ь(-)), для всех начальных точек уо 6 Уо и всех допустимых управлений г>(-), таких, что 7тнУ(^Уо, *>(•)) ^ х^\х0, и(-)) + М для всех t<i.

Из определения следует, что управление м,(-) решает задачу поиска на отрезке времени [¿о, Т3], если

П(Т8К(0) = 0.

Вообще говоря, область неопределенности является нсвыпуклым несвязанным множеством. Предлагаемый алгоритм построения управления поиска позволяет описать динамику области неопределенности с помощью выпуклых множеств, которые, в свою очередь, эффективно описываются с помощью опорных функций.

Управление м5(-) строится последовательно на отрезках времени [£,■ _1,<<] таким образом, чтобы соответствующая последовательность областей неопределенности в моменты и

{«№.«.(•))}

состояла из выпуклых множеств и для некоторого номера г., стало верно соотношение ы5(-)) = 0- Чтобы на некотором шаге выполнилось условие пу-

стоты области неопределенности, нужно потребовать уменьшение множеств n(ti,us(-)), в некотором смысле, с каждым шагом. Например, под уменьшением области неопределенности Î1(t") по сравнению с областью Q(i') можно понимать условие

тTHQ(t") + eS +у С -киШ/).

Если это условие выполняется для некоторого е > ё > 0 и некоторого у е R2, то область неопределенности уменьшилась.

Построение следующего элемента последовательности областей неопределенности осуществляется следующим образом. Пусть fi(i') — элемент последовательности. Ищутся два выпуклых компакта © и W, удовлетворяющие следующим свойствам на отрезке времени [t', t"] :

1) В момент времени t' выполняется включение

тгС 9 + 2М.

2) Если irHy(t) G 0 + (t - t')W + 2M, то

тгяДяСФ, y{t)) С Э + (г - t')W + 2М,

где т > t и т € [i', t"}.

3) Если irHy(t) € 6 + (t - f)W, то

7гнЯя(г|ё, y(t)) С G + (г - t')W,

где т > t и t, т е [£', i"].

Здесь ,Кя(т|4, y(t)) — множество точек, куда в момент времени т может попасть прячущийся объект, если в момент времени t он находился в точке y(t). Условия 1, 2, 3 говорят о непроницаемости границы множеств © + (t — t')W + 2M, в + (t — t')W для прячущегося объекта, т.е. если прячущийся объект оказался внутри множества 0 + (t — t')W -f- 2M (аналогично © + (i — t')W), то с течением времени он не сможет его покинуть. Таким образом, изменяющееся во времени множество

(в + {t - t')W + 2M) \ (© + (i - t')W)

образуют коридор, который ограничивают область неопределенности и при этом покрывает ее часть.

Согласно условию обнаружения, в момент времени t прячущийся объект является обнаруженным, если его положение y[t) удовлетворяет условию

тгHy(t) £ x(f|х0, w(-)) + M.

Положение множества обнаружения х(<|хо,и(-)) + М определяется выбором управления и(-) ищущего объекта. В работе строится управление ищущего объекта, которое перемещает область обнаружения внутрь коридора, а затем осуществляет движение вдоль него, гарантируя обнаружение прячущего объекта, если он остается в коридоре. Управление, осуществляющее движение вдоль коридора, находится как решение задачи оптимального управления со смешанными ограничениями. После того, как гарантировано отсутствие прячущегося объекта в коридоре, получившаяся область неопределенности является следующим элементом в последовательности выпуклых областей неопределенности. При построении управления используется не опорная функция области неопределенности, которую в общем случае найти можно лишь приближенно, а опорные функции множеств 8 и И', которые находятся в аналитическом виде.

Предлагаемые конструкции, позволяют строить управления поиска в случае, когда поиск осуществляется несколькими ищущими объектами.

В качестве примера применения метода рассматривается задача поиска для случая, когда области управления ищущего и прячущегося объектов являются эллипсоидами. В этом случае все конструкции метода переписываются в терминах эллипсоидального исчисления, которое позволяет заменить теоретико-множественные операции аналитическими формулами.

Во второй части второй главы рассматривается простая динамика прячущегося объекта

Я: у-ь,

где у 6 И2, € V — сгВ2(0). Для такой динамика прячущегося объекта и заданной траектории х(Ь) ищущего объект описывается граница области неопределенности в виде параметрической кривой. Последовательность шагов поиска соответствует первой части. Отличие состоит в том, что управление выбирается таким, что осуществляет движение области обнаружения х{Ь) 4- М непосредственно вдоль границы области неопределенности, а пе вдоль ограничивающего ее коридора. Осуществимость такого движения предполагает жесткие требования гладкости границы области неопределенности. Эти требования можно удовлетворить, расширив границу области неопределенности и при этом наделив ее нужными свойствами.

Третья глава работы посвящена нелинейной задаче поиска. В пей предлагаются конструкции, которые позволяют построить множества начальных позиций, для которых заданное управление ищущего объекта является управлением поиска.

Рассматривается управляемая динамическая система, которая описывает-

ся системой нелинейных дифференциальных уравнений

i = f(z, и, v),

где г е Rn, u(t) € U С Rp, v(t) € V С R4, множества U, V — компакты. В начальный момент времени точка г(0) € Zq.

Задача поиска для заданного отрезка времени [0,формулируется следующим образом: найти такое допустимое управление us(-) на отрезке времени [0,0], что для любой начальной точки zu 6 Zq и для любого допустимого управления и(-) найдется момент времени t — í(zo,f(-)) € [0,0], для которого выполнится терминальное условие

z(í|aB, «.(■),«(•)) е AÍ,

где М — заданное замкнутое множество в пространстве R" (не обязательно ограниченное).

Глава посвящена решению следующей задачи: для заданного допустимого управления и(-) на отрезке времени t 6 [О, в] построить такое множество fto^, что управление «(•) решает задачу поиска для множества начальных позиций Zq = Oq^ .

Определение. Оператор , где в > 0 и «(•) — допустимое управление, ставит в соответствие каждому замкнутому множеству W S Rn множество Sq^í^W всех таких точек Zo 6 Rn, что для любого допустимого управления v(-) выполняется одно из следующих условий:

«(•),«(■)) ew\M

или для некоторого t G [0, б]

z(f|2b,u(-),«(-)) е М.

С помощью операций над множествами определение оператора SVu(-) записывается в виде

У {zo G Rn|2(i|2b, «(.),«(•)) € м}},

te[O,0]

где V[0, в\ — множество допустимых управлений v(-).

Согласно определению оператора Se,ü(-) > управление й(-), на отрезке времени t G [0, в], является решением для задачи поиска с начальным множество Zo = Se,ü{-)M и терминальным множеством М.

Затем рассматриваются два оператора, аппроксимирующие оператор ¿в.ад • В определение первого оператора пересечение по всем допустимым управлениям ь'(-) заменяется на пересечение только по кусочно-постоянным допустимым управлениям. Для этого вначале строится вспомогательный оператор

доопределение. Оператор З^.), где е > 0 и и(-) — допустимое управление, ставит в соответствие каждому замкнутому множеству IV 6 Л" множество IV всех таких точек го 6 И", что для любого постоянного управления = v € v, £ € [0, е], выполняется одно из следующих условий:

г(е\г0,и(-),ь)

или для некоторого £ 6 [0, е]

г(^2о,и(-),С) € М.

С помощью операций над множествами определение оператора ■§£,«(.) записывается в виде

В^УГ = П[{^о € Н."|г(е|го,«(•),«) СШ\М}У

кеУ

У {г0бКп|г(«|г0,'и(-)^)еМ}].

Определение. Для конечного разбиение и> отрезка [0,0] и допустимого управления и(-) обозначим

где

й = г = 1,

гц(0 = ы(г4_1+*), *б[0,<54], {=1,...,к.

Связь между оператором б^.) и оператором отражает следующая

теорема.

Теорема. Справедливо равенство

м

где пересечение берется по всем конечным разбиениям ш отрезка [0, в].

Следующем шагом аппроксимации оператора 5<?,щ(.) является замена траектории г(-|го, и(-),и(-)) ломанной Эйлера.

Для фиксированного числа к £ К и вектора и £ 17 рассматривается оператор

зд^Пки и (*1К и (г-л/(г>«,«))>].

ибУ геМ <е[0,Л] z<íWЩ

Затем для равномерного разбиения

и — {О, Л,..., (т — 1)к,тк}, =

отрезка времени [0, ¿] и допустимого кусочно-постоянного управление «(•) с участками постоянства, соответствующими разбиению а;, т.е. и(т) = щ(т — (г — 1)/г) ~ щ & и для г 6 ((г — 1)/г,гЛ], г = 1 ,...,тп, рассматривается оператор

V

т

В работе доказывается близость множеств Э^^М, в метрике

Хаусдорфа, если терминальное множество М — удовлетворяет условию телесности.

Определение. Пусть множество М — компактно. Обозначим

В(а, М) = дМ + а5,

1У(а,Л/) = В(а,М)ПМ, • В (а, М) —» — непрерывная функция,

К(г,ш,г,1аМ) = и 3(г + 1а,м(г)т'тг)-

0<т<ш

Множество М удовлетворяет условию телесности с положительными константами а, и), г и функцией 1а,м> если Для любого г 6 IV(а, М)

К (г, и, г, 1аМ) С М.

Теорема. Пусть множество М удовлетворят условию телесности с некоторыми константами, тогда существует такая константа во > О, что если Ь < во, то для любого г) > 0 существует такое натуральное число то, что для всех т > гпо справедливо неравенство

где тЬ, = I и р(.,.) — расстояние Хаусдорфа между множествами.

Автор выражает глубокую благодарность своему научному руководителю Николаю Леонтьевичу Григоренко за постоянное внимание к работе.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

[1] Пивоварчук Д. Г. Задача динамического поиска на плоскости с простой динамикой убегающего // Проблемы динамического управления. — М.: Издательский отдел факультета ВМиК МГУ, 2005. — С. 230-252.

[2] Пивоварчук Д. Г. Об одном подходе к исследованию нелинейной задачи динамическго поиска // Материалы научной школы-конференции "Мобильные роботы и мехатронные системы". — М.: Издательство Московского университета, 2003. — С. 264-288.

[3] Пивоварчук Д. Г. Операторный подход к исследованию нелинейной задачи поиска // Труды международного семинара "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби". — Т. 1. — Екатеринбург: 2006. — С. 126-135.

[4] Григоренко Н. Л., Пивоварчук Д. Г. Задача динамического поиска с линейной динамикой прячущегося игрока // Труды международного семинара "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби". — Т. 1. — Екатеринбург: 2006. — С. 211-226.

Напечатано с готового оригинал-макета

Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12.99 г. Подписано к печати 14.08.2006 г. Формат 60x90 1/16. Усл.печ.л. 1,25. Тираж 100 экз. Заказ 563. Тел. 939-3890. Тел./факс 939-3891. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 627 к.

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Пивоварчук, Денис Геннадьевич

Введение

1 Линейная нестационарная задача поиска

1.1 Постановка задачи.

1.2 Вспомогательные определения и утверждения.

1.3 Множество всех возможных траекторий динамической системы

1.4 Условие уклонения траектории от терминального множества

1.5 Необходимое и достаточное условие решения дискретной задачи поиска.

1.6 Декомпозиция необходимого и достаточного условие решения дискретной задачи поиска.

1.7 Свойства функций Rk{x, а).

2 Задача поиска в случае двумерного терминального множества

2.1 Задача поиска с линейной динамикой прячущегося объекта

2.1.1 Постановка задачи

2.1.2 Вспомогательные определения и утверждения.

2.1.3 Алгоритм построения управления поиска

2.1.4 Построение управления движения вдоль границы гладкого выпуклого компакта.

2.1.5 Построение управления поиска

2.1.6 Оценки скорости изменения области неопределенности

2.1.7 Построение ограничивающего множества.

2.1.8 Запись алгоритма поиска в терминах эллипсоидального исчисления.

2.1.9 Некоторые особенности численной реализации алгоритма поиска.

2.2 Задача поиска с простой динамикой прячущегося объекта

2.2.1 Постановка задачи.

2.2.2 Динамика области неопределенности на плоскости

2.2.3 Траектория обхода области неопределенности.

2.2.4 Примеры применения метода.

3 Операторные конструкции в нелинейной задаче поиска

3.1 Постановка задачи.

3.2 Вспомогательные определения и утверждения.

3.3 Операторные конструкций в задаче поиска.

3.4 Телесные множества и их свойства.

3.5 Аппроксимирующий оператор.

 
Введение диссертация по математике, на тему "Задача гарантированного динамического поиска"

Работа посвящена одной из задач гарантированного управления динамической системой в условия неопределенности — задаче гарантированного динамического поиска.

В литературе рассматриваются различные постановки задач динамического поиска. Большинство из них характеризуются следующими понятиями: динамическая система, описывающая процесс поиска, множество допустимых стратегий ищущего объекта, множество допустимых стратегий прячущегося объекта и условие, выполнение которого означает обнаружение прячущегося объекта ищущим. Цель ищущего объекта, при выборе своей стратегии, — обеспечить выполнение условия обнаружения, цель прячущегося объекта — избежать выполнения условия обнаружения. Задачи поиска характеризуются тем, что ищущий объект при выборе своей стратегии обладает только априорно известной до начала процесса поиска информацией, такой как множество возможных стратегий прячущего объекта и множество возможных начальных положений системы. Никакой дополнительной информации о текущем положение динамической системы и стратегии, выбранной прячущимся объектом, во время процесса поиска не поступает. Другая, важная черта задач поиска состоит в том, что момент выполнения условия обнаружения не фиксирован. Таким образом, задачи поиска составляют отдельный класс задач управления.

Среди постановок задач динамического поиска можно выделить три основ-' ных класса: стохастические, игровые и гарантированные задачи поиска. Данное деление определяется различным понимаем решения задачи.

Примером стохастической задачи поиска является задача, в которой априорно известна (или удовлетворяет заданным уравнениям) функция распределения вероятности выбора прячущимся объектом заданной стратегии из множества допустимых стратегий. Под решением задачи понимается допустимая стратегия ищущего объекта, максимизирующая некоторый функционал, который отражает эффективность стратегии поиска. Например, таким функционалом может быть вероятность выполнения условия обнаружения на заданном отрезке времени. Стохастические задачи поиска исследовались в работах В. И. Аркина, О. Хеллмана, В. А. Абчука, В. Г. Суздаля, Л. А. Петросяна,

JI. А. Емельянова. Варианты постановок таких задач и подходы к их решению рассмотрены в [ 1,84].

В игровой постановке, задача поиска является игрой двух лиц с нулевой суммой (в случае одного ищущего игрока). В качестве функционала, который минимизирует ищущий и максимизирует прячущийся, часто рассматривают время прошедшее до момента выполнения условия обнаружения при выбранных стратегиях игроков. Под решением задачи понимается пара — стратегия ищущего и стратегия прячущегося игрока, — которые соответствуют седло-вой точке функционала. Как правило, в игровой задаче поиска решение ищут в смешанных стратегиях, т.е. находят вероятностные распределения на множествах допустимых стратегий игроков. Игровые задачи поиска рассматривали: Р. Айзеке [3], JI. А. Петросян, Н. А. Зенкевич, А. Ю. Гарнаев, М. И. Зели-кин, S. Gal, В. О. Кооршап. Варианты постановок игровых задач рассмотрены в [60].

Задачу гарантированного поиска рассматривают в различных постановках, в зависимости от предположений о динамики прячущегося объекта. Так рассматривают задачи о поиске неподвижного объекта, о поиске объекта с заданным параметрическим семейством возможных траекторий, о поиске управляемого (другим лицом) объекта. Под решением задачи понимается допустимая стратегия ищущего объекта, обеспечивающая выполнение условия обнаружения при любой допустимой стратегии прячущегося объекта. Гарантированный поиск рассмотрен в работах Ф. JT. Черноусько, Л. А. Петросяна, В. В. Ски-товича, С. В. Чистякова, А. Ю. Гарнаева, Н. А. Зенкевича, О. А. Малафеева, Д. П. Кима, Е. В. Шикина, С. М. Губайдуллина, А. Г. Чхартишвили, С. Б. Березина, П. М. Ларина, А. А. Скворцова, С. В. Местникова.

Задача гарантированного поиска неподвижного объекта предполагает, что прячущийся объект в начальный момент времени выбирает точку своего положения из заданного множества и остается в этой точке в течение всего процесса поиска. Ищущий объект должен выбрать такую траекторию движения, чтобы гарантировать выполнение условия обнаружения для любой точки множества возможных положений прячущегося объекта. Следующей задачей гарантированного поиска является задача, когда прячущийся объект подвижен и выбирает траекторию своего движения из заданного параметрического семейства кривых. Соответственно, ищущий объект должен выбрать такую траекторию движения, чтобы гарантировать выполнение условия обнаружения для любой возможной кривой движения прячущегося объекта. В работах В. В. Скитовича и С. В. Чистякова [78] предложен метод, который позволяет свести эту задачу к задаче поиска неподвижного объекта.

Задача поиска управляемого прячущегося объекта предполагает, что прячущийся объект выбирает допустимое программное управление, которое порождает его траекторию движения. Ищущий объект не обладает информацией о сделанном выборе. Он должен выбрать свою траекторию движения, гарантирующую выполнение условия обнаружения для любой допустимой траектории прячущегося объекта. Этой задаче гарантированно поиска в предположении, что динамика ищущего и прячущегося объектов является простой, посвящен целый ряд работ. В работах Ф. Л. Черноусько [85] рассмотрена задача поиска в двумерном и трехмерном пространстве, когда прячущийся объект может перемещаться только в пределах заданной области. Большая серия работ написана Е. В. Шикиным [86] и его учениками А. Г. Чхартишвили, С. Б. Бере-зиным [87], П. М. Лариным [43], А. А. Скворцовым [77], в которых исследуется задача поиска на некотором классе поверхностей, в двухмерных и трехмерных областях, приводятся достаточные условия существования и численные методы построения траекторий поиска. Основной инструмент этих исследований — анализ области неопределенности, т.е. множества точек, где может находиться прячущийся объект в определенный момент времени. Метод аппроксимации области неопределенности для сложной динамики ищущего и прячущегося объектов рассмотрен в работах С. В. Местникова [49].

В данной работе рассматривается задача гарантированного поиска управляемого прячущегося объекта, которая в общем виде формулируется следующий образом. Динамика системы описывается системой обыкновенных дифференциальных уравнений z = f{t,z,u,v). (1)

Функция и = u(t) — программное управление, которое требуется выбрать из заданного множества допустимых управлений U, в соответствии с заданной целью. Функция v = v(t) — неизвестное возмущение, которое может возникнуть в системе, причем известно множество возможных возмущений V. В начальный момент времени t = t0 положение системы определено неточно. Известно, что начальная точка z(to) принадлежит заданному множеству Z0. Обозначим решение дифференциального уравнения (1) к моменту времени t с начальной точкой z(to) = z0 и функциями и(-), v(-) через z(t\to, zq, u(-), v(-)).

Задачу гарантированного динамического поиска сформулируем следующим образом: найти момент времени Ts и найти такое допустимое управление us(-) е U, что для каждой начальной точки zq е Zq и для каждого возможного возмущения v(-) € V найдется момент времени t = t(z0)v(-)) е [to,Ts], для которого выполнится терминальное условие (условие обнаружения)

K{t)z(t\tQ,z0,us{-),v{-)) е М{1), (2) где 7г(t) — матричная функция и M(t) — многозначное отображение, заданные на отрезке времени [£<), Ts].

Отметим, что в соответствии с поставленной задачей, требуется найти такое программное управление us(-) е К, до начала движение системы, которое обеспечит выполнение терминального условия (2), каким бы ни оказалось начальное положение системы z(t0) е Z0 и какое бы допустимое возмущение v(-) £ V ни возникло в системе. Причем момент выполнение терминального условия не фиксирован и, вообще говоря, зависит от пары (z(to),v(-)). Выбор управления и3(-) определяется только дифференциальным уравнением (1), множествами Z0, U, V, матричной функцией 7г(t) и многозначным отображением M(t).

Частным является случай, когда динамическая система распадается на две независимые части x = g(t,x,u), ^ V = h{t,y,v).

В начальный момент времени t = to для начальной точки x(to) выполняется равенство x(t0) = xq, а для начальной точки y(tQ) известно только то, что выполняется включение у (to) € Y0, где Уо — заданное множество.

Движение вектора x(t) определяется заданной начальной точкой x(to) = хо и выбранной функцией и(-) е U и не зависит от неизвестной функции v(-). Будем считать, что вектор x(t) описывает положение некоторого, управляемого нами, объекта, которого обозначим буквой S. Аналогично, движение вектора y(t), определяемое начальной точкой y(t0) е Yq и функцией v(-) £ V и не зависящее от функции и(-), определяет движение другого объекта, которого обозначим буквой Я. Движение объекта Я не контролируемо нами и, более того, не известно, так как не известны ни начальная точка у(to), ни функция v(-).

В этом случае, задачу гарантированного динамического поиска сформулируем следующим образом: найти момент времени Ts и найти такое допустимое управление щ(-) еЫ, что для каждой начальной точки у0 е Y0 и для каждого возможного возмущения v(-) е V найдется момент времени t = t(yQ, v(-)) е [£о, Ts], для которого выполнится терминальное условие где 7Гя(£), -кsit) — матричные функции и M{t) — многозначное отображение, заданные на отрезке времени [to,Ts]. Описанный частный случай сводится к общей задаче (1), (2), если положить

Задача (3), (4) допускает следующую геометрическую интерпретацию. В начальный момент времени to объект Н находится в некоторой точке y(to) € У0. Затем он начинает движение с некоторым допустимым управлением v(-) € V. Объект 5 в начальный момент времени находится в заданной точке x(to) = яо. Он не знает точного значения у (to), не знает выбранного управления v(-) и не получает никакой информации о траектории y(t) движения объекта Я. Цель объекта S заключается в выборе управления us(-) € Ы, обеспечивающее выполнение терминального условия (4) для любой возможной пары (y(to),v(-)) € Уо х V. Или, другими-словами, объект S выбирает управление щ(-) так, чтобы найти движущийся объект Я, если условием обнаружения объекта Я является включение (4). Такая геометрическая интерпретация описанной задачи объясняет название работы. Будем называть объект S —

7Гн(Ы*\*0, Уо, О) е KS(t)x(i\t0, х0, щ(-)) + M(t),

4)

K(t) = (-*s(t),KH(t)). ищущим, объект Н — прячущимся, управление и(-) — управлением ищущего объекта, управление v(-) —управлением прячущегося объекта, управление и3(-), решающее задачу, — управлением поиска.

В традиционной постановке задач поиска динамика ищущего и прячущегося объектов считается независимой друг от друга. В работе сформулирована и исследуется более общая задача (в первой и третьей главе), когда динамику объектов нельзя разделить на независимые части. Постановка задачи формулируется как задача управления в условиях неопределенности в классе программных управлений. Подходы к решению задач управления в условиях неопределенности в классе программных управлений в случае, когда момент времени прихода на целевое множества задан, исследовались А. Б. Куржан-ским [38], В. В. Скитовичем, С. В. Чистяковым и др. В задаче поиска момент времени прихода на целевое множество (т.е. выполнения условия обнаружения) не фиксирован. Методы решения таких задач нуждаются в дальнейшем развитии.

Вторая задача, которая рассматривается в работе и связана с задачей гарантированного поиска, заключается в построении множества начальных точек Z0, для которых заданное управление и(-) на заданном отрезке времени [to,T] является управлением поиска.

Эта задача пересекается с задачей построения множества начальных позиций разрешимости задачи преследования в нелинейных нестационарных дифференциальных играх. Подход к построению множества начальных позиций в дифференциальных играх основан на понятии стабильного моста, введенного в работах Н. Н. Красовского и А. И. Субботина [35]. Методы построения стабильных мостов исследовались в работах Н. Н. Красовского, А. И. Субботина, Б. Н. Пшеничного [72], В. В. Остапенко, В. Н. Ушакова [82], А. А. Успенского, Т. Б. Токманцева, А. М. Тарасьева, В. С. Пацко, А. А. Меликяна, Е. С. Половинкина.

При применении подобного подхода к задачам поиска необходимо учитывать, что нестационарность задачи поиска возникает в результате подстановки в правую часть дифференциального уравнения управляющей функции.

Краткое содержание работы.

В первой главе рассматривается задача поиска для линейной нестационарной системы z = B(t)u + v на заданном отрезке времени [to, Т], где вектор zgR", u(t) eU,U — выпуклый компакт в пространстве Rp, v(t) £ V(t), V(t) —измеримое ограниченное многозначное отображение отрезка [to,T] во множество непустых выпуклых компактов пространства R9, элементы матрицы B(t) — непрерывные функции на отрезке [to,T].

Такая система включает в себя как частный случай линейную систему z = A(t)z + B{t)u + C{t)v, где вектор z G R", u(t) € U, U — выпуклый компакт в пространстве Rp, v(t) £ V, V — выпуклый компакт в пространстве R9. Элементы матриц A(t) в Rnxr\ B(t) € Rnxp, C(t) е Rnx,J — непрерывные функции на отрезке to, П.

Пусть задано непрерывное многозначное отображение M(t) на отрезке [U,T] во множество непустых выпуклых компактов пространства Rm, матрица 7г(t) е Rmxn с непрерывными элементами на отрезке [t0,T] и выпуклый компакт Z0 в пространстве Rn.

Задача гарантированного динамического поиска формулируется следующим образом: найти такое допустимое управление us(t) на отрезке времени [to,T], что для каждой точки zq € Zq и каждого допустимого v(-) существует момент времени t = t(zo, v(-)) € [to, T], для которого выполняется терминальное условие

K{t)z{t\to, zQ, us{-), v(-)) € M(T).

Сформулированная задача называется непрерывной задачей поиска. Совместно с непрерывной рассматривается дискретная задача. Зафиксируем произвольное конечное разбиение отрезка [to, Т] и = {Ml, • • • ,tjv}, где ti-1 < U для г = 1,., N и t^ = Т. Дискретная задача поиска для заданного разбиения и формулируется следующим образом. Найти такое допустимое кусочно-постоянное управление uf(t) = щ для t е t{], г = 1,., N, что для каждой точки zq б Zq и каждого допустимого v{-) существует момент времени t = i(zQ, v(-)) £ и, для которого выполняется условие

Tr{t)z(i\to,zo,us{-),v{-)) е M(t).

Решение дискретной задачи поиска для любого конечного разбиения а; является решением непрерывной задачи поиска.

Выпуклые компакты M(ti), tj £ и, i = 0,. ,N, представляются в виде

M{U) = {хе Rm| < с(М(и),ф%ф* е Ф<}, где множества Фг С б^ДО), г = 0,., N, являются компактами. Будем обозначать через с(А,ф) опорную функцию множества А в направление ф.

На основе выпуклого анализ получено следующее необходимое и достаточное условие, которому удовлетворяет кусочно-постоянное управление, решающее задачу поиска, если выполнение условия обнаружения проверяется в заданные фиксированные моменты времени tk, к = 0,., N.

Теорема. Пусть задано кусочно-постоянное управление й(-): u(t) = tik £ U, t £ {tk~i,tk\, к = 1 ,.,N. Тогда для каждой точки zq £ Zq и каждого допустимого v{-) существует момент времени t = t(zQ,v(-)) £ и такой, что ir(t)z{i\t0,zQ,u(-),v{-))eM(t), тогда и только тогда, когда f N max min { c(Z0, У] а{тгТ(и)фг) - c(M(t0), аоФ°) + г=0,.Д/\ / n £

5=1 i=0 n \ n

В% Y, ОСг-КТШ ) + с( V, i=j / i=j

0, где множество Vk, k = 1,., N, определяется через интеграл Аумана от многозначного отображения V(t)

-tk

VK = f t к V(s)ds Jtk-i и матрица

Вк= Г B(s)ds. Jtk-i

Применение метода динамического программирования приводит к рассмотрению конечной последовательности рекуррентно заданных функций

Ro(x, а) = max {c(Z0, атт

Rk(x, а) = max min {Rk-i(akirT (tk)if)k + х, -ак + а) + ■фке-Ч>к аке[0,а] (Вкйк, ак1гт(Ьк)фк + х} + c{Vk, актгтЦк)фк + х)c(M(tk), акфк)} , к = 1,., N, где функция Rk(x, а) определена на множестве Dk С Rn х R1:

Dk = co({Gk, 0)U(0,1)), k = 0,.,N, Gk. i = со(-тгт(**)Ф* U Gk), fc = l,.,JV, Gn = {0}.

Основной результат первой главы сформулирован в следующей теореме. Теорема. (Необходимое и достаточное условие, которому удовлетворяет кусочно-постоянное управление, решающее задачу поиска, если условие обнаружения проверяется в заданные моменты времени, количество которых конечно)

Пусть задано кусочно-постоянное управление й(-): u(t) = йк 6 U, t € (tk-i,tk], к = 1 Тогда для каждой точки z0 в Z0 и каждого допустимого v(-) существует момент времени t — t(zo,v(-)) е со такой, что тогда и только тогда, когда /?дг(0,1) < 0.

В первой главе исследованы свойства множеств Dk и функций Rk(x,a), k = 0,.,N, которые отражены в следующих леммах.

Лемма. Множество Dk) к = Оявляется выпуклым компактом.

Лемма. Функция Rk(x, а), к = О,., N, является выпуклой на множестве Dk.

Лемма. Пусть (х, а) е Dk, (Ах, Ха) £ Dk и X > О, тогда

Rk(Xx,Xa) = XRk(x,a), k = 0,.,N.

Вторая глава работы посвящена задаче поиска в случае, когда динамика ищущего и прячущегося объектов является линейной и независимой и терминальное множество является двумерным выпуклым компактом.

В первой части второй главы рассматривается следующая динамика объектов

S : х = и, Н : y = Cy + Dv, где х G R2, у G R"H, u(t) в U С R2 — управление объекта 5, v(t) € V С Rq — управление объекта Н. Здесь U — выпуклый компакт в пространстве R2 и У — выпуклый компакт в Rq. •

В начальный момент времени t = to выполняются соотношения x(to) — хо, у (to) е Yq, где хо — заданная точка и Уо — заданное выпуклое компактное множество в Кпн.

Задача поиска объекта Я объектом S формулируется следующим образом: найти момент времени Ts и такое допустимое управление щ(-) на отрезке времени [£0, Т8], что для любой начальной точки уо е Y0 и для любого допустимого управления v(-) найдется момент времени t = t(y0, v(-)) в [£о> Ts], для которого выполнится условие обнаружения ппу(Цуо, v(-)) € ХШХо, w«(0) + К где М — заданное выпуклое компактное множество в R2 (терминальное множество) и 7г# € R2xnjT — матрица ортогонального проектирования на R2.

Предлагается метод построения управления поиска. Основным инструментом является понятие области неопределенности, которая отражает состояние процесса поиска к данному моменту времени.

Определение. Областью неопределенности в момент времени t, отвечающей управлению и(-), называется множество концов траекторий у(Цуо, v{-)), для всех начальных точек уо € Уо и всех допустимых управлений i>(-), таких, что Kny(t\yo,v(-)) £ x(t\x0,u(-)) + М для всех t<t.

Из определения следует, что управление us(-) решает задачу поиска на отрезке времени [t0, Та], если

0(Ts\us(-)) = 0. .

Вообще говоря, область неопределенности является невыпуклым несвязанным множеством. Предлагаемый алгоритм построения управления поиска позволяет описать динамику области неопределенности с помощью выпуклых множеств, которые, в свою очередь, эффективно описываются с помощью опорных функций.

Управление щ(-) строится последовательно на отрезках времени [U-i,ti] таким образом, чтобы соответствующая последовательность областей неопределенности в моменты U

0(U,us('))} состояла из выпуклых множеств и для некоторого номера is стало верно соотношение 0(tie, щ(-)) = 0. Чтобы на некотором шаге выполнилось условие пустоты области неопределенности, нужно потребовать уменьшение множеств в некотором смысле, с каждым шагом. Например, под уменьшением области неопределенности Гl(t") по сравнению с областью 0,(1?) можно понимать условие

KH0(t") + £S + yC7rH0(t').

Если это условие выполняется для некоторого г > е > 0 и некоторого у € R2, то область неопределенности уменьшилась.

Построение следующего элемента последовательности областей неопределенности осуществляется следующим образом. Пусть 0(t') — элемент последовательности. Ищутся два выпуклых компакта © и И^, удовлетворяющие следующим свойствам на отрезке времени [t', t"]:

1) В момент времени t' выполняется включение тгH0(t') С в + 2М. 14

2) Если 7rHy(t) ев+ {t- t')W + 2M, то тгHRH{r\t, y{t)) С 0 + (т - t')W + 2М, где т > t и t,r G

3) Если 7Гну(Ь) eQ + (t- t')W, то nHRH{T\t,y(t))cQ + (T-t')W, щет > tnt,r e[t',t"].

Здесь RH{r\t,y(t)) — множество точек, куда в момент времени т может попасть прячущийся объект, если в момент времени t он находился в точке y(t). Условия 1, 2, 3 говорят о непроницаемости границы множеств © + {t — t')W+2M, Q + (t-t')W для прячущегося объекта, т.е. если прячущийся объект оказался внутри множества @ + (t-t')W+2M (аналогично 0 + (t-t')W), то с течением времени он не сможет его покинуть. Таким образом, изменяющееся во времени множество в + {t - t')W + 2М) \(Q + (t- t')W) образуют коридор, который ограничивают область неопределенности и при этом покрывает ее часть.

Согласно условию обнаружения, в момент времени t прячущийся объект является обнаруженным, если его положение y(t) удовлетворяет условию

KHy(t)ex(t\x0,u{-)) + M.

Положение множества обнаружения x(t\x0, и(-)) + М определяется выбором управления и(-) ищущего объекта. В работе строится управление ищущего объекта, которое перемещает область обнаружения внутрь коридора, а затем осуществляет движение вдоль него, гарантируя обнаружение прячущего объекта, если он остается в коридоре. Управление, осуществляющее движение вдоль коридора, находится как решение задачи оптимального управления со смешанными ограничениями. После того, как гарантировано отсутствие прячущегося объекта в коридоре, получившаяся область неопределенности является следующим элементом в последовательности выпуклых областей неопределенности. При построении управления используется не опорная функция области неопределенности, которую в общем случае найти можно лишь приближенно, а опорные функции множеств © и W, которые находятся в аналитическом виде.

Предлагаемые конструкции, позволяют строить управления поиска в случае, когда поиск осуществляется несколькими ищущими объектами.

В качестве примера применения метода рассматривается задача поиска для случая, когда области управления ищущего и прячущегося объектов являются эллипсоидами. В этом случае все конструкции метода переписываются в терминах эллипсоидального исчисления, которое позволяет заменить теоретико-множественные операции аналитическими формулами.

Во второй части второй главы рассматривается простая динамика прячущегося объекта

Я: y = v} где у G R2, v{t) е V = aBf(0). Для такой динамика прячущегося объекта и заданной траектории x(t) ищущего объект описывается граница области неопределенности в виде параметрической кривой. Последовательность шагов поиска соответствует первой части. Отличие состоит в том, что управление выбирается таким, что осуществляет движение области обнаружения x(t)+M непосредственно вдоль границы области неопределенности, а не вдоль ограничивающего ее коридора. Осуществимость такого движения предполагает жесткие требования гладкости границы области неопределенности. Эти требования можно удовлетворить, расширив границу области неопределенности и при этом наделив ее нужными свойствами.

Третья глава работы посвящена нелинейной задаче поиска. В ней предлагаются конструкции, которые позволяют построить множества начальных позиций, для которых заданное управление ищущего объекта является управлением поиска.

Рассматривается управляемая динамическая система, которая описывается системой нелинейных дифференциальных уравнений z = f{z,u,v), где 2 € Rn, u{t) eU С Rp, v(t) G V С Rq, множества U, V — компакты. В начальный момент времени точка z(0) € Zq.

Задача поиска для заданного отрезка времени [0, в] формулируется следующим образом: найти такое допустимое управление и3(-) на отрезке времени [0,6), что для любой начальной точки zo £ Z0 и для любого допустимого управления v(-) найдется момент времени t = t(zQ, v(-)) £ [0, в], для которого выполнится терминальное условие z(t\z0,us{-),v{-)) е м, где М — заданное замкнутое множество в пространстве Rn (не обязательно ограниченное).

Глава посвящена решению следующей задачи: для заданного допустимого управления «(•) на отрезке времени t £ [0,9) построить такое множество , что управление и(-) решает задачу поиска для множества начальных позиций Zq = Qq^ ^.

Определение. Оператор Se>u^, где в > 0 и и(-) —допустимое управление, ставит в соответствие каждому замкнутому множеству W £ Rn множество Se^W всех таких точек zq £ Rn, что для любого допустимого управления v(-) выполняется одно из следующих условий: z(e\z0M-),v(-)) £W\M или для некоторого t £ [0, в) z(t\z0,u(-),v{-)) £ М.

С помощью операций над множествами определение оператора записывается в виде

•)eV[o,0]

J {z0£Rn\z(t\z0,u(-),v(-))£M}}, te[o,e] где V[0, в] — множество допустимых управлений v(-).

Согласно определению оператора 5$^.), управление £(•), на отрезке времени t £ [0,0], является решением для задачи поиска с начальным множество Zq = Setu(.)M и терминальным множеством М.

Затем рассматриваются два оператора, аппроксимирующие оператор S^.). В определение первого оператора пересечение по всем допустимым управлениям v(-) заменяется на пересечение только по кусочно—постоянным допустимым управлениям. Для этого вначале строится вспомогательный оператор

Доопределение. Оператор где е > 0 и и(-) —допустимое управление, ставит в соответствие каждому замкнутому множеству W е Rn множество S£,u{-)W всех таких точек zo € Rn, что для любого постоянного управления v(t) = v е V, t е [0, е], выполняется одно из следующих условий: z{e\z0,u(-),v) eW\M или для некоторого t е [0, е] z(t\z0,u(-),v) е М.

С помощью операций над множествами определение оператора записывается в виде

§e,vi-)w = П[Ь €Rn\z(s\z0,«(.),V) е W\M}и vev

U {z0eRa\z(t\z0,u(-),v)eM}]. te[0,e]

Определение. Для конечного разбиение ш отрезка [0, в] и допустимого управления и(-) обозначим

Su(-)w = SSuUl^SS2iU2{.).SSkjUk{.)W, где

5{ = Т{ — Ti-1, i = l,.,k, Ui(t) = u(t^i -И), i = 1, .,k.

Связь между оператором и оператором S^W отражает следующая теорема.

Теорема. Справедливо равенство

М 18 где пересечение берется по всем конечным разбиениям и отрезка [0, в\.

Следующем шагом аппроксимации оператора Se}U(.) является замена траектории z(*\zq, и(-), v(-)) ломанной Эйлера.

Для фиксированного числа he R и вектора и е U рассматривается оператор м^=П к U U (* - v))} U{ U(* - hf(z> u>*))}]• vev zeM ie[o,h] ■ z&w\M

Затем для равномерного разбиения lo = {0. h,., (m — l)h:mh}, mh = t: отрезка времени [0, t] и допустимого кусочно-постоянного управление и(-) с участками постоянства, соответствующими разбиению ш, т.е. и(т) = щ(т — (i-l)h) = щ€.и длят G ((i—l)h,ih], г = 1,.,ш, рассматривается оператор m

В работе доказывается близость множеств StiU^M, Ej^Af в метрике Ха-усдорфа, если терминальное множество М — удовлетворяет условию телесности.

Определение. Пусть множество М — компактно. Обозначим

B(a,M) = dM + aS,

W(a,M) = В(а, М)ПМ, L,m В(а, M)-*dS — непрерывная функция, К(г,и,г,1а!м) = (J S(z + laM(z)r,Tr).

0 <т<и>

Множество М удовлетворяет условию телесности с положительными константами а, и, г и функцией если для любого z G W(a, М)

K(z,U),r,latM) с М.

Теорема. Пусть множество М удовлетворят условию телесности с некоторыми константами, тогда существует такая константа во >

О, что если t < во, то для любого г]>0 существует такое натуральное число то, что для всех т > то справедливо неравенство p{St,u(-)M,E™u^M) < г], где mh = t и р(.,.) — расстояние Хаусдорфа между множествами.

Основные результаты работы.

1) Для линейной нестационарной системы дифференциальных уравнений доказана теорема о необходимом и достаточном условии, которому удовлетворяет кусочно-постоянное управление, решающее задачу гарантированного поиска, в которой условие обнаружения проверяется в конечном числе заданных моментов времени.

2) Предложен конструктивный метод нахождения управления поиска в задаче с линейной динамикой прячущегося объекта, простой динамикой ищущего объекта и двумерным терминальным множеством. Доказана теорема о достаточном условии разрешимости этой задачи.

3) Доказаны теоремы о точном представлении и приближенном построении с любой наперед заданной точность в метрике Хаусдорфа множества начальных позиций, из которых разрешима нелинейная задача поиска при заданном управлении ищущего объекта.

Основные результаты опубликованы в работах [20,62—64].

Автор выражает глубокую благодарность своему научному руководителю Николаю Леонтьевичу Григоренко за постоянное внимание к работе.

Основные обозначения

N — множество натуральных чисел Rn — п—мерное вещественное евклидово пространство ||х|| — евклидова норма вектора х, равна xi)1 ||x||i — норма вектора х, равная Ya=i \хг\ (х, у) — скалярное произведение векторов х и у (а) — сфера радиуса г и центром в точке а в n-мерном пространстве с евклидовой нормой (если г = 1, то обозначаем Sn) В™(а) — шар радиуса г и центром в точке а в n-мерном пространстве с евклидовой нормой S^ — единичная сфера в п—мерном пространстве с нормой || • ||i Ат — транспонированная матрица А I — единичная матрица Тг(А) — след матрицы Л с(А, ф) — опорная функция множества А в направление ф с{А,ф) = swpxeA (х,ф) со А — выпуклая оболочка множества А А + В — алгебраическая сумма множеств А и В

А + В = {c = a + b\ae A,b€ В} DA — произведение матрицы D на множество А

DA = {с = Da\a е А} А-В — геометрическая разность множеств Л и Б А-В = {с\с + В С А}

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Пивоварчук, Денис Геннадьевич, Москва

1. Абчук В. А., Суздаль В. Г. Поиск объектов.— М.: Советское радио, 1977.

2. Аввакумов С. Н. Гладкая аппроксимация выпуклых компактов//Труды института математики и механики. — Т. 4. — Екатеринбург: УрО РАН, 1996.—С. 184-200.

3. Айзеке Р. Дифференциальные игры. — М.: Мир, 1967.

4. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. — М.: Наука, 1979.

5. Андрамонов М. Ю. Методы глобальной мимнимизации для некоторого класса обобщенно выпуклых функций. — Казань: Издательство Казанского математического общества, 2001.

6. Афанасьев В. И., Колмановский В. Б., Носов В. Р. Математическая теория конструирования систем управления. — М.: Высшая школа, 1989.

7. Байокки К., Капело А. Вариационные и квазивариационные неравенства. — М.: Наука, 1988.

8. Балашевич Н. В., Габасов Р., Кириллова Ф. М. Алгоритмы программной и позиционной оптимизации систем управления с промежуточными фазовыми ограничениями //Журнал вычислительной математики и математической физики. — 2001. — Т. 41, № 10.— С. 1485-1504.

9. Беккенбах Э., Беллман Р. Неравенства. — М.: Мир, 1965.

10. Беллман Р. Динамическое программирование. — М.: Издательство иностранной литературы, 1960.

11. Бердышев Ю. И. Об одной задаче последовательной оптимизации без декомпозиции во времени // Кибернетика. — 1987. — № 4. — С. 32— 35.

12. Бердышев Ю. И. К задаче последовательного обхода нелинейным управляемым объектом совокупности гладких многообразий // Дифференциальные уравнения и процессы управления. Электронный журнал (http://www.neva.ru/journal).— 1999.— №2.

13. Бердышев Ю. И., Ченцов А. Г. Оптимизация взвешенного критерия в одной задаче управления // Кибернетика.— 1986.— № 1.— С. 59— 64.

14. Березин С. Б. Информационные множества в задаче динамического поиска объектов с несколькими ищущими // Вестник Московского университета, Сер. 15, Вычислительная математика и кибернетика.— 2001.— №3.

15. Благодатских В. И. Введение в оптимальное управление.— М.: Высшая школа, 2001.

16. Васильев Ф. П. Методы решения экстремальных задач.— М.: Наука, 1981.

17. Васильев Ф. П. Численные методы решения экстремальных задач. — М.: Наука, 1988.

18. Габасов Р., Кириллова Ф. М. Основы динамического программирования. — Минск: Издательство Белорусского университета, 1975.

19. Григоренко Н. JI. Математические методы управления несколькими динамическими процессами. — М.: Издательство МГУ, 1990.

20. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс. — М.: Наука, 1972.

21. Демьянов В. Ф., Рубанов А. М. Основы негладкого анализа и квазидифференциальное исчисление. — М.: Наука, 1990.

22. Дикусар В. В., Милютин А. А. Качественные и численные методы в принципе максимума. — М.: Наука, 1989.

23. Зеликин М. И. Об одной дифференциальной игре с неполной информацией // Доклады АН СССР. — 1972. — Т. 202, № 5.

24. Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. — М.: Наука, 1979.

25. Киселев О. И., Поляк Б. Т. Эллипсоидальное оценивание по обобщенному критерию// Автоматика и Телемеханика.— 1991.— № 9.— С. 133-144.

26. Киселев Ю. Н. Линейная теория быстродействия с возмущениями. — М.: Издательство МГУ, 1986.

27. Киселев Ю. Н. Оптимальное управление. — М.: Издательство МГУ, 1988.

28. Кларк Ф. Оптимизация и негладкий анализ. — М.: Наука, 1988.

29. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. — М.: Наука, 1981.

30. Коробов В. И., Маринич А. П., Подольский Е. Н. Управляемость линейных автономных систем при наличии ограничений на управление // Дифференциальные уравнения. — 1975. — Т. 11. — С. 11.

31. Красовский Н. Н. Теория управления движением. — М.: Наука, 1968.

32. Красовский Н. Н. Игровые задачи о встрече движений. — М.: Наука, 1970.

33. Красовский Н. Н. К задаче унификации дифференциальных игр // Доклады АН СССР. — 1976. — Т. 226, № 6. — С. 1260-1263.

34. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. — М.: Наука, 1974.

35. Кряжимский А. В., Осипов Ю. С. Экстремальные задачи с отделимыми графиками // Кибернетика и системный анализ. — 2002. — № 2. — С. 32-55.

36. Кунцевич В. М., Пшеничный Б. Н. Решение одного класса задач сближения в условиях неопределенности // Кибернетика и системный анализ. — 1995. — № 3. — С. 63-70.

37. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. — М.: Наука, 1977.

38. Куржанский А. Б. Об аналитическом описании пучка выживающих траекторий дифференциальной системы // Даклады АН СССР. — 1986. — Т. 287, №5.—С. 1047-1050.

39. Куржанский А. Б., Осипов Ю. С. К задаче об управлении с ограниченными фазовыми координатами // Прикладная математика и механика. — 1968. — Т. 32. — С. 194-202.

40. Куржанский А. Б., Осипов Ю. С. К задачам об управлении при стесненных координатах // Прикладная математика и механика.— 1969. —Т. 33.—С. 705-719.

41. Куржанский А. Б., Осипов Ю. С. К задачам программного преследования в линейных системах // Известия АН СССР, сер. Техническая кибернетика. — 1970. — № 3. — С. 18—29.

42. Ларин П. М. О неразрешимости задачи гарантированного поиска в достаточно большой области // Вестник Московского университета,Сер. 15, Вычислительная математика и кибернетика.— 2000.— №1.— С. 44-47.

43. Ли Э. В., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972.

44. Лотов А. В. Численный метод построения множеств достижимости для линейных управляемых систем с фазовыми ограничениями // Журнал вычислительной математики и математической физики. — 1975.—Т. 15, №1.

45. Люстерник Л. А., Соболев В. И. Краткий курс функционального анализа. — М.: Высшая школа, 1982.

46. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. — М.: Наука, 1983.

47. Меликян А. А., Черноусько Ф. Л. Некоторые минимаксные задачи управления с неполной информацией // Прикладная математика и механика.— 1971. — Т. 35.— С. 952—961.

48. Местников С. В. Аппроксимация области неопределенности в дифференциальных играх поиска // Дифференциальные уравнения.—1992. — Т. 28, № 6. — С. 967-972.

49. Милютин А. А.,ДМитрукА. В., Осмоловский Н. П. Принцип максимума в оптимальном управлении. — М.: Издательство ЦПИ при мех.-мат. факультете МГУ, 2004.

50. Моисеев Н. И. Элементы теории оптимальных систем.— М.: Наука, 1975.

51. Назин А. В., Назин С. А., Поляк Б. Т. О сходимости внешних эллипсоидальных аппроксимаций областей достижимости линейных дискретных систем // Автоматика и Телемеханика. — 2004. — № 8. — С. 39—61.

52. Никольский М. С. Управление линейными объектами с возможным нарушением в динамике // Труды института математики и механики УрО РАН. — Т. 3. — Екатеринбург: 1995.

53. Никольский М. С. Об одной задаче осуществления заданного движения, гибкие системы. //Доклады академии наук. — 1996. — Т. 350, № 6.— С. 739-741.

54. Об одном алгоритме численного решения линейных дифференциальных игр / Е. С. Половинкин, Г. Е. Иванов, М. В. Балашов и др. //Математический сборник. — 2001. — Т. 192. — С. 95-122.

55. Овсеевич А. И., Черноусько Ф. Л. Двусторонние оценки областей достижимости управляемых систем // Прикладная математика и механика. — 1982. — Т. 40, № 5. — С. 737-744.

56. Оптимальное управление движением / В. В. Александров, В. Г. Болтянский, С. С. Лемак и др. — М.: ФИЗМАТЛИТ, 2005.

57. Орлова Г. Б., Силин Д. Б. Приближенное вычисление выпуклой оболочки положительно однородной функции // Вестник Московского университета. Сер. 15, Вычислительная математика и кибернетика. — 1997. — № 2. — С. 32-35.

58. Панасюк А. И., Панасюк В. И. Асимптотическая магистральная оптимизация управляемых систем. — Минск: Наука и техника, 1986.

59. Петросян Л. А., Гарнаев А. Ю. Игры поиска. — Л.: Изд. ЛГУ, 1992.

60. Петросян Л. А., Зенкевич Н. А. Оптимальный поиск в условиях конфликта. — Л.: Изд. ЛГУ, 1987.

61. ПивоварчукД. Г. Об одном подходе к исследованию нелинейной задачи динамическго поиска // Материалы научной школы-конференции "Мобильные роботы и мехатронные системы". — М.: Издательство Московского университета, 2003. — С. 264-288.

62. ПивоварчукД. Г. Задача динамического поиска на плоскости с простой динамикой убегающего // Проблемы динамического управления. — М.: Издательский отдел факультета ВМиКМГУ, 2005. — С. 230-252.

63. ПивоварчукД. Г. Операторный подход к исследованию нелинейной задачи поиска // Труды международного семинара "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби".— Екатеринбург, 2006. — Т. 1. — С. 126-135.

64. Половинкин Е. С., Балашов М. В. Элементы выпуклого и сильно выпуклого анализа. — М.: ФИЗМАТЛИТ, 2004.

65. Понтрягин Л. С. О линейных дифференциальных играх i // Доклады АН СССР. — 1967. — Т. 174, № 6. — С. 1278-1280.

66. Понтрягин Л. С. О линейных дифференциальных играх и // Доклады АН СССР. — 1967. — Т. 175, № 4. — С. 764-766.

67. Понтрягин Л. С. Обыкновенные дифференциальные уравнения.— М.: Наука, 1974.

68. Понтрягин Л. С. Линейные дифференциальные игры преследования // Математический сборник. — 1980. — Т. 112. — С. 307-330.

69. Пшеничный Б. Н. Линейные дифференциальные игры // Автоматика и телемеханика. — 1968. — № 1. — С. 65—78.

70. Пшеничный Б. Н. Необходимые условия экстремума.— М.: Наука, 1969.

71. Пшеничный Б. П., Остапенко В. В. Дифференциальные игры. — Киев: Наукова думка, 1992.

72. Решетняк Ю. Н. Суммирование эллипсоидов в задаче гарантированного оценивания // Прикладная математика и механика. — 1989. — Т. 53, № 2. — С. 249-254.

73. Рокафеллар Р. Выпуклый анализ. — М.: Мир, 1973.

74. Савинов В. Б. Дифференциальная игра преследования одним преследователем нескольких убегающих // Труды института математики и механики УрО РАН. — Т. 3. — Екатеринбург: 1995.

75. Силин Д. Б., Тринько Н. Г. Модификация алгоритма грехема для овы-пукления положительно однородной функции //Журнал вычислительной математики и математической физики.— 1994.— Т. 34, №4.—С. 631-636.

76. Скворцов А. А. Динамический поиск в выпуклых областях // Фундаментальная и прикладная математика.— 1998.— Т. 4, № 2.— С. 785-790.

77. Скитович В. В., Чистяков С. В. Игровые задачи сближения и поиска. — М.: Изд-во МАИ, 1985.

78. Сотсков А. И. О критерии минимакса и некоторые приложения к задачам оптимального управления // Кибернетика. — 1969. — № 4. — С. 110-116.

79. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. — М.: Наука, 1981.

80. Ушаков В. Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Извести АН СССР, сер. Техническая кибернетика. — 1980. — № 4. — С. 29—36.

81. Ушаков В. Н., Успенский А. А., Токманцев Т. Б. Стабильные мосты в дифференциальных играх на конечном промежутке времени // Труды института математики и механики УрО РАН. — 2004. — Т. 10, № 2.

82. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой частью. — М.: Наука, 1985.

83. Хеллман О. Введение в теорию оптимального поиска. — М.: Наука, 1985.

84. Черноусько Ф. Л. Управляемый поиск подвижного объекта // Прикладная математика и механика. — 1980. — Т. 44, № 1.

85. Чхартишвили А. Г., Шикин Е. В. Динамический поиск объектов, геометрический взгляд на проблему. // Фундаментальная и прикладная математика. — 1995. — Т. 1, № 4.

86. Шикин Е. В., Березин С. Б. Поиск объектов, динамика, геометрия, графика // Фундаментальная и прикладная математика.— 2005.— Т. 11, №1.— С. 3-34.

87. Bridgland Т. F. Trajectory integrals of set valued function // Pacific journal of mathematics. — 1970. — Vol. 33, no. 1. — Pp. 43—68.

88. Gal S. Search games with mobile and immobile hider // SI AM J. Control and optimization. — 1979.— Vol. 17, no. 1. — Pp. 99-122.

89. Garnaev A. Remark on the princess and monster search game I I International Journal of Game Theory. — 1992. — Vol. 20. — Pp. 269276.

90. Krayzhimskii A. V., Paschenko S. V. On the problem of optimal compatibility // J. Ill-Posed Problems.— 2001.— Vol. 9, no. 3,— Pp. 283-300.

91. Kurzhanski А. В., Varaiya P. Ellipsoidal techniques for reachability analysis: internal approximation // Systems & Control Letters 4.— 2000. —Vol.41.—Pp. 201-211.

92. Kurzhanski А. В., Varaiya P. On ellipsoidal techniques for reachability analysis, part i: External approximations // Optimization Methods and Software. — 2001. — Vol. 17. — P. 177-206.

93. Schmitendorf W. E. Differential games without pure strategy saddle-point solutions // Journal of optimization theory and applications.— 1979. — Vol. 18, no. 1. — Pp. 81-92.