Методы адаптивной расчетной стабилизации и быстрой идентификации в робототехнических системах тема автореферата и диссертации по математике, 01.01.11 ВАК РФ

Пенев, Георги Димов АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Ленинград МЕСТО ЗАЩИТЫ
1990 ГОД ЗАЩИТЫ
   
01.01.11 КОД ВАК РФ
Автореферат по математике на тему «Методы адаптивной расчетной стабилизации и быстрой идентификации в робототехнических системах»
 
Автореферат диссертации на тему "Методы адаптивной расчетной стабилизации и быстрой идентификации в робототехнических системах"

МИНИСТЕРСТВО ВЫСШЕГО И СРЕДНЕГО СПЕЦИАЛЬНОГО ОБРАЗОВАНИЯ РСФСР

ЛЕНИНГРАДСКИЙ ОРДЕНА ЛЕНИНА И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

УДК 517.9

ПЕНЕВ Георги Димов

МЕТОДЫ АДАПТИВНОЙ РАСЧЕТНОЙ СТАБИЛИЗАЦИИ И БЫСТРОЙ ИДЕНТИФИКАЦИИ В РОБОТОТЕХНИЧЕСКИХ СИСТЕМАХ

Специальность: 01.01.11 — Системный анализ и автоматическое управление

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук

ЛЕНИНГРАД

1990

Работа выполнена на факультете прикладной математики — процессов управления Ленинградского государственного университета.

Официальные оппоненты: доктор физико-математических наук, профессор Г. А. Леонов (Ленинград); доктор физико-математических наук, старший научный сотрудник А. А. Меликян (Москва); доктор технических наук, профессор А. Л. Фрадков (Ленинград).

Ведущая организация — Ленинградский институт авиационного приборостроения.

Защита диссертации состоится «Я» шоиз 19^ Г. в -/У" часов

на заседании Специализированного совета Д 063.57.33 по защите диссертаций на соискание ученой степени доктора физико-математических наук при Ленинградском государственном университете по адресу: Ленинград, Васильевский остров, 10 линия, дом 33, ауд. 23 ■

С диссертацией можно ознакомиться в фундаментальной библиотеке ЛГУ им. А. М. Горького (Ленинград, Университетская наб., д. 7/9).

Автореферат разослан^? 19

Ученый секретарь Специализированного совета

А.П.Жабко

'6 став

гертдций

ОЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность теш и научная новизна результатов. В теоретических исследованиях и прикладных работах, связанных с задачами автоматического управления и роботизации промышленного производства, большое внимание уделяется проблема управления в условиях априорной параметрической неопределенности динамическими системами, описываемыми'дифференциальннми ила конечно-разностными уравнениями. Успешное решение этой проблема является одним из важнейших условий создания реальных технических устройств и роботов, способных адаптироваться к изменяющимся характеристикам динамики объектов управления и внешней среды. В последние годы теория адаптивного управления, обогащаясь новыми идеями, методами и подходами, выросла в самостоятельный раздел математической теории управления. Крупный вклад в становление, развитие и применение этой теории внесли советские математики.

Однако из анализа существующих работ следует, что многие важные вопросы теории адаптивного управления не решены. Одной из актуальных проблем является проблема минимизации (максимального, по возможности, сокращения)' времени адаптации в процессе самообучения системы. Известны два основных типа адаптивных систем: прямые й непрямые системы, синтезируемые на основе применения безыденитификационного и идентификационного подходов. В прямой адаптивной системе данные наблюдений в процессе управления используются непосредственно для изменения параметров закона управления. В непрямой адаптивной системе данные наблюдений используются для идентификации параметров объекта управления и затем вычисляются параметры закона управления. В тех и других системах время адаптации определяется скоростью сходимости алгоритмов адаптации или идентификации, имеющих обычно асимптотический характер. Применение таких алгоритмов приводит к тому, что период адаптации является неопределенно продолжительным. Тем не менее, до недавнего времени теория адаптивного управления ограничивалась рассмотрением задач синтеза управления, обеспечивающего выполнение целевых условий лишь начиная с некоторого неопределенного заранее момента времени. Кроме того, в основном рассматривалось наличие неопределенности параметров . уравнений динамики объектов управления. Аналогичные постановки

задач недостаточно полно отражают требования об эффективности управления робототехническими системами. В процессах адаптивного управления роботами, тяжелыми и уникальными станками и другими сложными электромеханическими системами важное значение приобретает точность отслеживания программных движений в течение всего времени осуществления реального движения. При атом условия функционирования систем осложнены наличием неопределенности характеристик внешней среды, а часто и структурно-функциональной неопределенности (наряду с параметрической) уравнений _ динамики объектов управления.

Формирование управляющих воздействий является лишь одной из задач, решаемых системой управления роботом. .В отличие от обычных автоматических систем робототехническая система в общем случае решает некоторые задачи искусственного интеллекта: анализ и интерпретация сенсорной информации, построение проблемно-ориентированной модели внешней среда, планирование действий, программирование движений и т.п. Быстродействие алгоритмов решения этих задач является одним из важнейших условий эффективности роботов.

В диссертации проблема минимизации времени адаптации занимает центральное место. Использованием дискретных коррекций и непрерывных алгоритмов самонастройки впервые построены система адаптивного управления, обеспечивающие отслеживание программных движений нелинейных.нестационарных моделей динамики роботов в течение всего времени движения. В таких системах адаптация при-, водит к ограниченному числу дискретных коррекций и исчезанию динамической ошибки слежения при неограниченном времени функционирования. Применением минимально-параметрических моделей.ди-.нашки систем и метода целевых неравенств получены принципиально новые быстродействующие алгоритмы адаптации дискретно-управ-яяемых сиотем при дискретных измерениях выходных сигналов. Получены новые быстродействующие алгоритмы идентификации линейных дискретных и нелинейных непрерывных систем -при дискретных данных измерений выходных сигналов в ограниченном (в ряде случаев минимальном) числе дискретных моментов времени. Построены также новые, быстродействующие алгоритмы идентификации трехмерных сцен и управления роботом в задаче оптимальной адаптивной прокладки мэр-прута в среде с препятствиями и в задаче стабилизации

программных движений, заданных в декартовых координатах. Разработанные в диссертации методы позволяют строигь адаптивное управление линейными и нелинейными нестационарными системами с гарантированным качеством слежения программных движений в условиях не только параметрической неопределенности, но и структурно-функциональной неопределенности объектов управления. Алгоритмы идентификации являются простыми, рекуррентными, позволяют получать оценки параметров с гарантированной точностью за ограниченное (в некоторых случаях минимальное) дискретное время.

Решение указанных задач опирается на фундаментальные исследования А.М.Ляпунова, В.И.Зубова, В.А.Якубовича, Р.Калмана и .других советских и зарубежных ученых по устойчивости, стабилизации и адаптации динамических систем.

Практическая ценность. Полученное в диссертации результаты могут быть использованы яри проектирований прямых и непрямых адаптивных сиотем управления'роботами, стшдаш с числовым программным управлением и другими техническими объектами. Это позволит обеспечить гарантированную точность отслеживания программных движений в условиях неопределенности или быструю автоматическую настройку существующих регуляторов.

Структура работы. Диссертация состоит из введения, восьми разделов (глав), заключения и списка литературы, содержащего 378 наименований. Машинописный текст без списка литературы занимает 270 страниц. Общий объем диссертации 304 страниц . Нумерация подразделов (пунктов), форлул и утверждений автономная в каядой главе, первая цифра обозначает номер главы, вторая - порядковый номер подраздела или утверждения в данной главе.

СОДЕРЖАНИЕ РАБОТЫ '

Рассмотрим более подробно основные результаты работы.

Во введении обоснована актуальность тс:ды, сформулированы цели и задачи, дается краткая характеристика основных разделов диссертации.

Первая глава посвящена изложению и математическому обоснованию метода адаптивной расчетной стабилизации програмгяшх движений (ЦЦ) исполнительних механизмов (К/1) и двигательных систем роботов. Она включает 6 пунктов.

В п. 1.1 данк >:з.те;,-атпческпо формулировки задач адаптивной

расчетной стабилизации. В соответствии с общим определением, введенным В.И.Зубовым, ЦД расчетно устойчиво, если реальное движение осуществляется в заранее заданной "малой" окрестности ПД в течение всего времени движения. Предполагается, что ИМ описывается векторнш дифференциальным уравнением вида

АН,?,*)? + и , (I)-

где и(1)— п. -мерные векторы обобщенных координат и

управления в момент времени / , ¿еТ , Т - время функционирования робота, например Т= [Ь0 ,+ оо) , А - симметрическая положительно определенная матрица при всех / , р , £ , 5 - вектор неизвестных конструктивных параметров ИМ (масс и длин звеньев и т.п.), <у = с1ф/сИ .

Вводятся комнактные множества допустимых векторов обобщенных координат и обобщенных скоростей, {<£}, (2,¿ = <? }

и У=-[и} - класс кусочно-гладких векторных функций, удовлетворяющих неравенствам

II иг^) II < С0 , \\й(Щ\ 4 с, (2)

при некоторых с , с1 < + оо (во втором неравенстве ■£ не является точкой скачка управления). Для определенности считается, что & в (2) и у в (I) непрерывны. Норма векторов в (2) и ниже - евклидова.

Основная задача адаптивной расчетной стабилизации состоит в построении управления и так, чтобы при всех ¿еТ выполнялись бы неравенства

, II(3)

где - программное движение, £0, - заданные положительные числа, характеризующие требуемую точность слежения ПД;

Наряду с основной задачей рассматривается вспомогательная задача, заключающаяся в построении управления, обеспечивающего . выполнение при всех -¿еТ вспомогательного неравенства

и? со II ££ , <4)

где £>с , - заданная п -векторная функция. ' ' Функция ^ в (4) выбирается тале, чтобы выполнение неравен-, ства (4) влекло бы справедливость (3). Поэтому в пунктах 1.2-1.6 даны решения вспомогательной задачи и рассматриваются два способа определения функции Р .

В п.1.2 построены алгоритмы управления, решающие вспомогательную задачу и содержащие лишь один параметр, характеризующий конкретный ИМ. Предполагается, что выполнены следующие четыре условия:

а) для решения задач Коми

при любых хд, ха € /? п , удовлетворяющих неравенствам - %(*о) II < £о > (¿с) II <е, > И при любой

кусочно-непрерывной векторной функции , й £,

6ёТ, справедливо, что эсС£)е&0 , эс С-6) е <21€ при всех £ ё Т .

б) при любом фиксированном значении вектора £ элементы матрицы А и компоненты векторных функций / , £ вместе с юс частными производными по всем аргументам являются непре]эывшми ограниченным - фунюдаята в области

teT, <}<=&<, . > ГД0 . от-

крытые множества, содержащие ооответственно 0.о , при любом компактном (2 г , о С/ <2. (.<?),

^ Ч<Ъ0 '

в) для минимальных и максимальных собственных значений Л (А) и Л (А ) матрицы А == А у, £ ) справедливы неравенства

0< а,(£) € Ы? , з.(АНа.(к)<+<х>,

г) для в (4) выполнено неравенство Ц ) II< £.

При построении ряда алгоритмов, основанных на определении

величин скачка Аи(£)=и(£+с>)-иС£-о) управления в точках множества Т£ — {t : Ну II } применяется

Те орет 1.1. Если выполнены условия а)-г), го при всех ¿е Т справедливо неравенство (4) при любом и е II. , величина скачка которого при любом í с Т£ определена равенством

й 1С({) - - об , (5)

где о^. < 2 аг($) .

Аналогично строится управление в условиях, когда в (I) / - неизвестная кусочно-гладкая векторная функция от ^ , т? определена неточно, ^ +/Н. , - неизвестная ограниченная кусочно-гладкая векторная функция и при всех 4. £ Т

известна ->£(£ ^ . Исследуются также возможности замены в (5) ' «^на сценку А матрицы А и применения некоторой рекуррентной процедуры выбора подходящего значения «*£" , если оно неизвестно.

В п.1.3, имеющем вспомогательный характер, описаны применяемые при адаптивном управлении роботами линейно-параметризованные формы (ЛПФ) уравнений динамики ИМ. ЛПФ определяются введением некоторых новых параметров, относительно которых уравнения динамики ИМ линейны. Для ИМ, представляющих собой простые разомкнутые кинематические цепи, предложен способ построения ЛПФ, содержащих минимальное число новых параметров, и получен ряд тождеств, применяемых в процедурах идентификации.

Б п.1.4 ЛПФ используется для построения расчетно устойчивых адаптивных.систем управления с исчезающей динамической ошибкой слежения,

С1т ->7(-6)=о. (6)

г^+оо (

Уравнения динамики представлены в общей форме

Аа.уЛ) ?+§ а,= (7)

где У - заданная векторная функция, не обязательно линейная относительно вектора новых неизвестных параметров ( Р линейна относительно хм для любой ЛПФ).

Оптимальное управление и" , обеспечивающее при любых начальных условиях выполнение равенства о при всех ■¿е Т имеет вид

Так как вектор неизвестен, управление определяется аналогичным равенством .

- (8)

и алгоритмом настройки вектора ос ,

= ) при н^с-оц^е , о)

&ос= ? при ' (ю)

где векторные функции Ц , подлежат определению.

"Доказана теорема о расчетной устойчивости ПД системы (7) (выполнении (4) при всех {. е Т ) при управлении (8)-(Ю), обеспечивающем исчезание динамической ошибки ^ при

Для конкретных ЛШ> уравнений динамики ИМ робота приведены вира-' жвши векторных функций % , Уц в (9), (10).

В конце п.1.4 показано, что решение вспомогательной задачи является также решением основной задачи адаптивного управления, валя векторная функция £ в (4) определена равенством

9= Ь си)

где , Н1 - симметрические положительно определенные матрицы.

Зункция (II) иозет быть применена, если в (3) параметры £а , £-т не зависят от £ . Однако часто необходимо считать, что они переменные, например, если реальное и программное движения должны быть "однонаправленными", ^ 0 ^ * означает транспонирование). В общем случае, когда £е , £г - заданные функции времени, применим изложенный в пунктах 1.5, 1.6 способ формирования вспомогательного целевого неравенства.

В п. 1.5 векторная фикция £ определена соотношэгаямн

(12)

^ЯФУгР*)при

I о при -б^ + тг £ £¿+1 г

= (в+ ) , р1 (у) - туи (1-м +1) •

Здесь V > О , ¿ь - некоторые моменты времени, при кото-

^ ^ л

рых выполнено Ц II — Еа или II•£-,//= , '

' • КУ/Г удовлетво-

ряют неравенствам о< Щ < . ¿=» о, 1 .

В п.1.6 рассматривается обобщение метода адаптивной расчетной стабилизации ЦД при управлении такими сложными нелинейными нестационарными системами, как двигательные системы роботов, включающие Ш и приводы. Наиболее характерным динамическим свойством рассматриваемых классов систем является справедливость равенства

А А-и(£>* (13)

в котором ¿ - точка скачка управления, г^и. А—А*>0,

А= А у, .).

Основная цель управления определяется неравенствами

II ?к>а) - (14)

Задача решается построением управления, при котором выполнено вспомогательное неравенство

ц(г)- , (ш)

причем £ выбирается так, чтобы справедливость (14) вытекала бы из выполнения (15) при всех ¿еТ . Управление строится в классе кусочно-постоянных векторных функций путем определения величины скачка равенством (5) при ^4 у , X

Векторная функция X , ненулевая лишь на некоторых отрезках №кЛк+гг1 I . определяется равенством вида

в котором -у. - , - заданный полином степени

» J= о,1,...* 0на является решением задачи минимизации функционала

4><

с закрепленными концами.

Метод адаптивной расчетной стабилизации непосредственно предназначен для управления системами в непрерывном времени. Но он может быть использован для управления в дискретном времени путем конечно-разностной аппроксимации величины в (5) и применения конечно-сходящихся алгоритмов адаптации, изложенных в третьей глава. Это особенно удобно делать при налитая многократных, измерений выходного сигнала вектора обобщенных координат в течение времени постоянства (непрерывности) управления. Однако в реальных системах шаг дискретности управления может быть настолько малый, что выполняется' лишь одно измерение выходного сигнала. В связи с этим большое значение для теории адаптивного управления нелинейными нестационарными системами имеет возможность дискретизации соотношений вида (13).

Построению, математическому исследованию и применению дискретных аналогов соотношения (13) посвящена глава 2.

В п.2.1 вводится класс систем Hfm) , удовлетворяющих соот- ' ношзнию

АХ <m>(i) = Р ¿U,

в котором в общем случае коэффициент "передачи" J3 - прямоугольная матрица, вектор з: выходных сигналов и его производные

?си> непрерывны при ¿<т , управление и куоочно-непрерывно, t - точка скачка и .

При кусочно-постоянном управлении,

, telk=[k8,(K+i)&yt S>o ,

построена локальная дискретнач динамическая модель системы из класса , та » f , определяемая конечно-разностным урав-

нением

= • (I«

В (16) ос г— V - оператор обратной разности ,V2l=z-r ,

<ут * 1

V {-гГ^СПо^>-.J-vs.

возмущение, удовлетворяющее неравенству

в котором Т"(т) - определенная в работе величина, зависящая только от т , и М удовлетворяет условию

В п.2.2 при построении управления использована линейная часть (16), представленная в форме

Приведенная выше линейная модель является мянитлально-параметря-ческой, так как содержит лишь один параметр ji , характеризующий конкретную систему в H<m1 • З70 позволяет строить робаст-ную систему управления при известном значения ft и адаптивную скстсг/iy - на основе оценивания параметра р изложенным в п.2.1

способом, если он неизвестен. Для построения робастного управления применяется

Теорема 2.3. Дня любой системы из класса Н<гп) , ш »1 , с заданным скалярным постоянным коэффициентом передачи , для которой выполнено (17), управление

обеспечивает отслеживание ПД с точность», определяемой

неравенством I I £ М Т(т) 8т/(т\) .

Аналогично строится управление, если - матрица (заданная или оцениваемая).

В п.2.3 показано, что изложенный в п.2.2 метод может рассматриваться как метод, основанный на прогнозе реакции системы на ступенчатое воздействие. Для повышения точности прогноза предложен способ применен&я конечно-сходящихся алгоритмов (КСА) решения бесконечных систем неравенств.

В пунктах 2.4, 2.5 исследуются линейные системы,

, Су ,

при векторных входных и выходных сигналах,- В'п.2.4 установлен следующий критерий принадлежности системы к классу Н^' •

Теорема 2.6. Линейная.система принадлежи классу Н0"'тогда и только тогда, когда СР^й- о ищс-о^пы, СРт'10. ^О , Доказано, что в (16) ^ — ОС^™*1)при ограниченных и ч В п.2.5 исследуется асимптотика поведения параметров дискретных передаточных функций линейных- систем в £[Г1ТОпри исчезающем шаге дискретности управления, 8-* о . На основе полученных результатов строится класс законов управления, обеспечивающих экспоненциальную устойчивость БД, требуецую точность: слежения ПД или диссшативность замкнутой системы'при заданных значениях коэффициента , порядка п объекта и относительной стег-пени т передаточной функции непрерывной системы.

В п.2.6 соотношение (16) использовано для получения оценок производных , *8 , с- 1,7)1-1 , выходного сигнала ,

при заданных его дискретных значениях-и при кусочно-постоянном управлении с шагом дискретности ^ , .

Одним из эффективных методов синтеза адаптивного управления динамическими объектами, в частности роботами, является метод

целевых неравенств В.А.Якубовича (см.монографию: Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. - М.: Наука, 1981.- 448 е.). Развитии этого метода с целью сокращения периода адаптации систем посвящена глава 3.

В п.3.1 приведен общий метод построения КСА решения систем "условных" неравенств ^ (т) и "безусловных" неравенств

i^frj 6 о , где , т - искомое решение. Условные

неравенства долиты выполняться, начиная с некоторого неопределенного заранее момента ¿¿'z-o , а безусловные - при всех £ . Предложенный алгоритм является супперпозицией любого КСА решения условных неравенств и КСА решения безусловных неравенств, обеспечивающего после каждой коррекции алгоритма выполнение безусловного неравенства. Строится используемый при адаптивной стабилизации линейных динамических объектов КСА решения системы условных неравенств при ^ I! ßf , где В , zr , Щ * Fi ~ '^РИЦк соотвзтствувдши размерами, £ - заданное положительное число и при каздом i известны лишь , при выбранном на t -м шаге вначошгл т — ^. Для применения алгоритма не требуется прорывания процесса адаптации, имевшего место во многих работах.(см.цитлрованную выше монографию).

В п.3.2 изложен КСА адаптивной стабилизации дискретной системы

= А + В ик + & , ,

где и^ , е Я7" , ** € ¡V1 , А', В , С - матрицы соответствующим! размерами, ^.- неконтролируемое возмущение, при каждом к известны только и^ , , к— о,1, .

При любом ВОЗМУЩ81ПШ, удовлетворяющем УСЛОВИЮ II ^ll^f II (| при некотором Р £ [0,1) , построскпыЗ рекуррентный КСА обеспечивает без прерывания процесса адаптации исчозание выходного сигнала при исчезающем управлении, о , itA —* о при/<-» + оо . В частном случае, когда , yh <s f{ , предполагается шиь, что пара ( А , В ) вполне управляема.

В п.3.3 основное вшкание уделяется повышению быстродействия КСА решения бесконечных систем неравенств

I cjx +Tj I <£ , 1, г,de)

з которых ar , Cj £ R'" , ^ € R. , € >°п'

. Предполагается, что существуют такие ос.^е R' и ,

что выполнены неравенства '

1с/х* I * 3£ ' <>1> • (19)

В простейшем случае, когда в (19) ¡>=0 . предложен алгоритм, определенный соотношениями

где при <¿¿£0 , ПРИ » , лю-

бой вектор в [Vх , суммирование проводится по 1,к~1 , удо-влетворящим условию ¿¿^Фо . В-этом случае неравенства (I?) вырождаются в совмастну» систему линейных алгебраических уравнений, решение которой определяется при минимальном числе шагов алгоритма.

Теорема 3.7. Если в (19) _р=0 , то алгоритм (20) дает решение системы (18) при не более чем п исправлениях вектора. . Точнее с/х*о+1 + = ° • 3- 1,2,... . где -наименьшее целое число, для которого *апх [г,,с^ ]- %апк [сг,сл,... 3. При этом для числа исправлений « выполнено неравенство

% ъаптс ..., ск } .

Исследованы условия, при которых решение системы (18) при ?>0 может быть получено оптимально "по быстродействию" с помощью некоторой модификации алгоритма (20). При этом определяется верхняя оценка для £ , у< £ <1 . Аналогично строится КСА решения системы (18) в общем случав, когда £ - любое число в интервале [0,1) .

В главе 4 изучается проблема финитной идентификации линейных дискретных моделей динамических объектов управления. Решаются задачи идентификации параметров уравнений, описывающих систем в переменных "вход - выход". Основная идея построения алгоритмов идентификации заключается в том, чтобы определить некоторые простые тестовые сигналы, позволяющие практически всегда идентифицировать вполне управляемые и вполне наблюдаемые системы за нала-

ред заданное (иногда минимальное) время, а при нормальном функционировании системы - выполнить такое линейное преобразование разомкнутой системы, о помощью которого реальное управление преобразовалось бы к виду тестового воздействия.

& п.4.1 дана математическая формулировка задачи идентификации. Рассматриваемые системы описываются уравнениями в пространстве состояний

= + , (21)

^ +¿4+& » • (22)

где управление и^ <= Ит , вектор состояния ос^еИп , вектор выходных сигналов ¿Л £ , А > Ё> > С > с1 - неизвестные матрицы соответствующими размерами, , д.^ - неконтролируемые возмущения, г? - время, £=0,1,... (при и^ ,^ е /2 в (22) используется обозначение С-с*, с е Яп ).

Уравнение, описывающее систему в переменных "вход - выход", имеет вид

+ (23)

Здесь - неизвестные постоянные, «¿^ £ Я , ¿^ ,

- неизвестные £хт -матрицы ^'^с^п. , % - возмущение ( еоли в (21), (22) £ , £ =0 ).

Задача идентификации (оценивания) параметров ставится следующим образом: найти значения (оценки) параметров уравнения (23) при ~ О , £.¿ — 0 (ненулевых , ^ ), если известны лишь ^ >-при ¿-0,1,... . Финитная идентификация означает решение сформулированной задачи при заданных конечных множествах входных и выходных сигналов, и^ , г/^ , ¿ - О, , •¿¡<+00. ,

В п.4.2 исследуется задача идентификации системы в случае, когда , ¿¿¿^ Я и в (23) О , при тестовом воздействии

, и^о , ¿-п >х+2?г , (24)

где ^ - символ Кронекера, £¿-{=0 лишь при ¿ = 5 , <Г/= 1

. При управлении (24) вектор - а~коэффициентов знаменателя передаточной функции системы (23) удовлетворяет системе линейных уравноний

йй = -е-, Q. -, ганкелева матрица, бг е R"*1

fs+?i

'Уе+S.n-I

, е- = »

m

тельно « , >л у , 4 , с .

Теореш 4.1. При управления (24) системой (21), (22) однозначно разрешимо уравнение (25) относительно вектора а тогда и только тогда, когда система вполне наблюдаема и пара ( А , 0с$+1 ) вполне управляема.

Теорема 4.2. При управлении (24) системой (21), (22) уравнение (25) однозначно разрешимо относительно а. при любом ^ тогда и только тогда, когда система вполне управляема, вполне наблюдаема и г^ не является собственным значением матрицы

Здесь V(А, х)А [х, Ах, . . ..А™*] .

Теореш 4.3. При управлении (24) и при любых иА

S-n ^ s-i , значения параметров рекуррентными соотношениями

оС •

& в (23) определяются

h:

и.

где к-п,п-1,..., 1,0 и вторая сумма равна нулю при к-п

Те орет 4.4. Если пара ( А ,6 ) в (21) вполне управляема, то компоненты вектора с = С* в (22) определяются равенствами

В случае полной управляемости предполагается, что пара ( А , é ) представлена в форме

0\Е

-а"

где t - единичная квадратная ыатрща порядка П-1 .

Важным свойством метода идентификации, выраженного теорегдами 4,1-4.4, является ого быстродействие: зп+1 неизвестных параметра определятся по 3~п+1 паре значении входпнх и выходных

сигналов , ^ , 5~п Ь • 3 этом смысла метод

является оптимальным по быстродействию.

В п.4.3 исследуется точность оценивания с помощью тестовых воздействий параметров линейной системы с одним входным и с одним выходным сигналами при наличии ограниченных возвдтцений.

В п,4.4 решается задача идентификации линейной системы в режиме нормального функционирования. Исходная система преобразуется к виду

* Я- '

Здесь — уи,аг, 4 •• ■ +/£, и аналогично определены

^ ' ¥-£ ' ' & Параметры У1 г > » определя-

ются так, чтобы новое "управление" и^ имело бы вид тестового воздействия (24). Для этого должно быть выполненным равенство

гапк1 и,ег ] = гатгк 37 , (26)

V-

и* • • - Щ4П-1

Быстродействие алгоритма определяется числом /У , при котором справедливо (26). Предложен простой рекуррентный алгоритм аддитивного "возмущения" реального управления, обеспечивающий справедливость (26) при М-^тг+1 . При этом "возмущение" отсутствует, если (26) имеет место.

' В п.4.5 решается задача идентификации системы (21), (22) с многими водными и выходами сигналами с помощью многомерного тестового воздействия, и оценивается точность идентификации.

'■ В п.4.6 -применяется аналогичное, описанному в п.4.4 линейное преобразование многомерной системы 'для построения алгоритма идентификации ее параметров в режиме нормального функционирования.

В п.4.7 предложен рекуррентный алгоритм решония "скользящих" систем уравнений,' возникающих при оценивании параметров нестационарных систем.. Рассматривается последовательность систем линейных уравнений с неизвестной / х № - матрицей X ,

% (Х)*=0 , ё -3,11+Z , ... .

Алгоритмом посладевательно определяются решения Xf . , ... этих систем, причем для вычисления Хк , кЯ требуется выполнить при п-// лишь 0(п1) элементарных операций (умножений и сложений).

В п.4.8 описан метод наилучшего гарантированного оценивания решений конечномерных и бесконечномерных систем линейных уравнений при наличии неизвестных аддитивных возмущений, множеством которых является шар с неизвестным радиусом. Задача сведена к безусловно! минимизации построенных функций.

Быстродействующие алгоритмы идентификации нелинейных моделей динамики роботов разработаны в главе 5.

В я.5Л рассматривается система

А х + B>U +f(x) (27)

при кусочно-постоянном управлении и е fLm, яеRn,fi[ft...fn]*, = x *Gi х , ' = G* » ¿- /¡п. . Предложен способ двухэтап-ной идентификации, состоящий в том, что на первом этапе идентифицируются матрицы A t В по заданным значениям скачков управления и производных вектора х в минимальном числе моментов времени, а на втором этапе идентирпэдзуйтся параметры векторной функции ■fi'X.) • .

Для идентификации полиномиальной f(bc) в (27) ив более общем случае, когда она разложима в ряд, в п.5.2 предложены и исследованы алгоритмы решения континуальных систем уравнений или неравенств (при кадкой in R задано уравнение или неравенство, которое удовлетворяют неизвестные параметры).

В п.5.3 исследуется возможность адаптивной кусочно-линейной аппроксимации нелинейной нестационарной системы, описываемой уравнениями вида

, (28)

где Rn, и&Ц , % е Ц , f > <}■ , х - неизвестные функции.

Преда слагается, что система (28) "приводит", т.е. существует нелинейное преобразование, приводящее ее к виду

где постоянные пхп -матрица А и вектор ^ , а также функция Т и вектор £ , описывающий состояние, неизвестны.

При кусочно-постоянном управлении строится линейная дискретная модель системы на каждом интервале постоянства управления при выполнении на этом интервале 2п+Я измерений выходного сигнала. Установлено, что дискретные передаточные функции построенных моделей имеют один и тот же знаменатель. Это позволяет после идентификации знаменателя выполнять на каждом шаге только идентификацию числителя передаточной функции. Быстродействие построенного алгоритма определяется тем, что для его компьютерной реализации на каздом шаге требуется выполнить лишь ОСпь) элементарных операций.

В пунктах 5.4 и 5.5 изучается задача идентификации параметров плоских и пространственных Ш роботов. При решении задачи учитывается, что часть параметров, таких как длины звеньев, практически не изменяются при функционирования робота и могут быть заранее заданы, тогда как значения масс и моментов инерции трудно определяются экспериментально и могут изменяться во времени. Получены линейные идентификационные уравнения и исследованы условия идентифицируемости по данным о выходных сигналах и управлении в минимальном и любом наперед заданном числах моментов времени, в которых управление тлеет скачок.

В главе 6 изложен метод синтеза управлений, стабилизирующих ТД ИМ робота при заданных ограничениях на вектор обобщенных координат.

' В пунктах 6.1-6.3. построены законы, управления (ЗУ), обеспечи-зающие экспоненциальную.или асимптотическую устойчивость программного движения, с помощью функций Ляпунова, удовлетворяющей заданного "эталонному" дифференциальному уравнению. Полученные ЗУ позволяют автоматически удершвать траекторию движения в за-:анной области. При этом дай класса манипуляторов, представляющих :обой простые разомкнутые кинематические цепи, ЗУ инвариантны )тносителыю многих параметров Ш, В задаче о самонаведении ро-Зота, , <^ = 0 . ЗУ-имеет вид

и= С С?) (<?-%)-'<* п*-1 V 9 , <29>

где

+ с?-?,)* ч =

= У0 ехр(-г<>С / Цст)!1*^^),

уч ,<¿>0 , , /¡С<?) - матрица кинетической энергии,

С ($)- градиент потенциальной энергии ИМ, Уо - начальное значение функции V .

В этом, случае для стабилизации ОД достаточно задать начальное значение кинетической энергии ИМ и идентифицировать лишь неизвестные параметры векторной функции с ($). Управление (29) весьма эффективно в условиях, когда силового "уравновешивания" Ш не требуется ( с(^ = 0 при всех р ),

В п.6.4 синтезируется ЗУ ИМ робота, стабилизирующего при заданных ограничениях на вектор у ЦД эс^ , определенного в естественных (декартовых) координатах. Быстродействие построенного ЗУ обусловлено тем, что дая его применения не требуется решать трудоемкую обратную кинематическую задачу и находить ВД при наличии ограничений и, возможно, препятствий.

В л.6.5 показано, что метод условной стабилизации иоаэт быть использован для решения задач управления ¡¿обильным роботом в среде с препятствиями и сложными механическими системами, описываемыми векторными дифференциальными уравнениями высокото порядка.

В главе 7 представлен метод построения адаптивной системы принятия решений в задача оптимальной прокладки маршрута робота в среде с препятствиями.

В п.7Л дана математическая формулировка задачи. Внешней средой считается трехмерное пространство, в котором проекции препятствий на горизонтальную плоскость ограничены попарно непересекающимися многоугольниками. Движение робота, изображаемого точкой на плоскости, происходит в свободной от препятствий области. В наядой точке робот получает лишь информацию о препятствиях (координаты вершин многоугольников), находящихся в зоне видимости робота. В начальный момент времени роботу задается извне целевая точка ^ и после достижения кацдой точки задается , к?/1 . Робот долган сакообучкться за конечное время переходить по кратчайшему пути из текущей точки в очеред-¡гуо цаловуо точку.

В п.7.2 вводится динамический граф с расширяющимися множествами вершин и робер, определяемых попавшими к текущему моменту в зону видимости робота вершинами шогоугольников. Внешняя среда моделируется с помощью матрицы смежности и матрицы весов ребер графа. Знания робота выражаются матрицей оптимальных весов путей, соединяющих вершины. Полученные простые рекуррентные алгоритмы перестройки модели среды и системы представления знаний (оценок упомянутых матриц) позволяют роботу быстро "осваивать" новую информацию.

В п.7.3 изложен быстродействующий алгоритм построения маршрута, оптимального в рамках сформированной к текущему моменту модели среды.

В п.7.4 описаны алгоритмы, обеспечивающие адаптивность робота в рассматриваемом классе задач. Сформулирован и обоснован общий критерий адаптивности робота.

В п.7.5 показано, что построенные алгоритмы адаптации применимы в более общем случае, когда проблемная среда описывается простым ориентированным графом.

Глава 8 посвящена изложению метода идентификации параметров объектов трехмерных оцен на основе применения математической модели бинокулярной системы технического зрения. Предложен метод идентификации, основанный на применении некоторых простых инвариантных признаков, для обнаружения которых достаточно определить пространственные координаты небольшого числа (часто не более трех) характерных точек объекта сцены или характерный для него цвет. Это имеет большое значение для быстродействия зрительной системы.

В п.8.1 дано математически стилизованное представление о бинокулярной системе.

В п.8/2 изучается задача получения всех пар соответствующих элементов (линейных отрезков "сетчаток", характерных точек) на двух изображениях сцены.

В п.8.3 сформулирована задача идентификации трехмерной сцены, объектами которой являются многогранники. Рассматривается некоторое конечное множество шогогранников, вершины которых заданы в декартовой системе координат. Классы многогранников определяются всевозмо:шкш положениями заданных многогранников в трэхшрногл пространстве. Еадача идентификации заключаогся в

определении классов представленных на сцене многогранников и параметров, характеризующих положение каддого объекта сцены.

В п.8.4 предложено решение задачи идентификации в два этапа. На первом этапе идентифицируется класс многогранника, на втором - его положение. Для решения задачи вводятся некоторые характерные признаки класса (положения) многогранника, называемые "маркерами". Подробно исследована возможность построения маркеров по заданным расстояниям между тремя вершинами многогранника. Применение таких простых признаков весьма эффективно в смысле быстродействия, так как позволяет осуществлять идентификацию класса и положения многогранника по минимальной информации о вершинах многогранника. Разработаны также критерии видимости граней многогранников, применимых при упрощении двух изображений сцены после идентификации каждого объекта путем зануления его проекций. Отмечено, что метод применим в более общем случае, когда вместо многогранников рассматриваются любые объекты, имеющие достаточное число характерных точек дая построения маркеров классов и положений.

В заключении формулируются следующие основные результаты, выносимые на защиту:

1. метод адаптивной расчетной стабилизации программных движений исполнительных механизмов и двигательных систем роботов, основанный на применении законов управления, инвариантных относительно параметров объектов управления, и на применении алгоритмов самонастройки законов управления и целевых неравенств;

2. метод минимально-параметрических моделей синтеза адаптивного управления, позволяющий путем идентификации минимального числа параметров строить алгоритмы адаптивного, отслеживания программных движений нелинейных нестационарных систем из класса £'т,при регистрации выходных сигналов в дискретные моменты времени, в том числе алгоритм адаптивного модального управления линейными системами;

3. метод построения быстродействующих конечно-сходящихся алгоритмов, основанных на применении процесса ортогонализации Грака-Шмидта, в частности, алгоритм решения скользящих систем линейных алгебраических уравнений;

4. быстродействующий метод финитной идентификации параметров передаточной функции линейной дискретной системы управления,

применимый при управлении нелинейными, нестационарными система-' ми с многократными измерениями выходных сигналов на интервале постоянства управления;

5. метод идентификации массо-инерционных характеристик ма-нипуляционного робота по данным измерительной системы в заданном, в частности минимальном, числе моментов времени;

6. метод стабилизации программных движений в обобщенных и декартовых координатах исполнительного механизма манипуляцион-ного робота при наличии ограничений (стационарных и динамических) на конфигурации исполнительного механизма;

7. рекуррентные алгоритмы адаптации системы принятия решений в задаче оптимальной прокладки маршрута робота в среде с препятствиям, применимые к условиям проблемной среда, описываемой простым ориентированным графом;

8. маркерный метод идентификации объектов трехмерных сцен, основанный на применении метрических инвариантов (маркеров) классов и положений объектов.

Апробация результатов работы. Основные результаты диссертации -докладывались на 4-й и 5-й Бессоюзных конференциях по нейро-кибернетикэ (Ростов на Дону, 1970, 1973), на Всесоюзном совещании по робототехническим системам (Минск, 1981), на Всесоюзной конференции "Теория адаптивных систем и ее применения" (Ленинград, 1983), на 5-ä Всесоюзной конференции по управлению в механических системах (Казань, 1985), на 3-й национальной конференции с международным участием "Автоматизация-76" (НРБ, Албона,

1976), на симпозиуме■"Механизмы организации движений" (Ленинград, 1976), на международном симпозиуме ИФАК (ГДР, Лейпциг,

1977), на международном симпозиуме'ГОШ (НРБ, Албена, 1977), на конференции с международным участием "Роботы-79" (НРБ, Стара За-гора, 1979), на 3-й национальной научно-технической конференции с международным участием "Организация и автоматизация экспериментальных исследований - 81" (НРБ, Pyes, 1981), на международном симпозиуме ИФАК по искусственному интеллекту (Ленинград, 1983), на' международной школе молодых ученых "ПРАКТРО-87" (НРБ, Сандайсют, 1987) и др.

Диссертация и отдельные её положения обсуздены на Научных семинарах факультета прикладной математики - процессов управления и кафедр теории управления, механики управляемого движения,

теоретической кибернетики Ленинградского государственного университета,. в Ленинградском механическом институте, в Центре робототехники Высшего машинно-электромеханического института в г.Софии НР Болгарии.

Основное содержание диссертации опубликовано в 19 научных работах:

1. 0 некоторых задачах адаптивного управления. - Докл.АН СССР, 1971, г.198, Й 4, о.787-790 (совм. с Якубовичем В.А.).

2. Некоторые задачи синтеза адаптивного управления динамическими объектами.- В кн.: Методы вычислений. Вал.9. - Л.: Изд-во Ленингр. ун-га, 1974, с.105-115.

3. Адаптивная стабилизация одного класса нелинейных и нестационарных динамических систем,- В кн.: Вопросы кибернетики. Адаптивные системы,- М-: Научный совет по комплексной проблеме "Кибернетика" АН СССР, 1976, с.94-99.

4. Некоторые конечно-сходящиеся алгоритмы решения бесконечных систем неравенств с высокой скоростью сходимости. - Вестник Ленингр. ун-та, 1977, }ё 7, с.70-78.

5. Адаптивное управление квазилинейными нестационарными динамическими системами.- Беотник Ленингр. ун-та, 1978, № 7, с.43-48.

6. Некоторые задачи адаптивной стабилизации линейных дискретных систем,- В кн.: Механика управляемого движения. Вып.З. - Л.: Изд-во Ленингр. ун-та, 1979, о.159-174.

7. Алгоритмы адаптивной стабилизации полностью достижимой линейной дискретной системы.- Вестник Ленингр. ун-та, 1980, № I, с.Ш-ПЗ,

8. Идентификация линейных систем управления,- В кн.: Идентификация и оценивало на лараметри. Т.2. (Докл. Ш национальной научно-технич. конференции с медцунар. участием "Организация и автоматизация на оксперименталните изследвания - 81", 27-30 мая 1981 г., г.Русе, НРБ) - Русе, НРБ, 1981, с.67-73.

9. Алгоритмы адаптивной стабилизации линейных дискретных динамических систем.- В кн.: Деформация сплошных сред и управление даазением.- Л.: Изд-во Ленингр. ун-га, 1984, с.178-188.

10. Алгоритмы идентификации нелинейных систем управления. -Зестнак Ленингр. ун-та, Сер.1, 1986, вкп.З, с.39-46.

11. Алгоритмы идентификации дискретных моделей приводимых систем.- Веотнжк Ленингр. ун-та. Cep.I, 1986, вып.2, Q.II3-II6.

12. Адаптивное отслеживание программных движений нелинейных нестационарных систем,- В кн.: Вопросы механики и процессов управления. Вып.10.- Л.: ЛГУ, 1987, с.129-138.

13. Алгоритмы адаптивного управления и оптимизация движения робот а-манипулятора.- В кн.: Механика управляемого движения. Вып.З.- I.: ЛГУ, 1979, с.143-159 (совм. с Неокесарийскшл В.Н.).

14. Построение идентичных множеств сетчаток в бинокулярной зрительной системе,- Вестник Ленингр. ун-та, 1985, Л 15, с.29--35 (совм. с Столяровой H.A.).

15. Методы построения пар идентичных точек сетчаток.- Вестник Ленингр. ун-та. Cep.I, 1986, вып.4, с.78-82 (сонм, с Столяровой H.A.).

16. Применение принципа срочной идентификации в управлении сложными двигательными системами(улравлепие по скорость-Биофизика, 1979, т.24, №3, с.533-539 (совм. о Таировым О.П.).

17. Механизмы адаптивного управления сложными двигательным системами (управление по положению и ускорению).- Биофизика, 1979, т.24, В 4, с.733-740 (совм. с Таировым О.П.).

18. Локальная дискретная аппроксимация решений одного класса дифференциальных уравнений в условиях неопределенности.-

. В кн.: Четвертая конференция по дифференциальным уравнениям и их применениям. Аннотации докладов и сообщений.-Русе, НРБ: Болт. АН, 1989, с.224.

19. Algorithms of adaptive correction of the robotB knowledge and decieion-making systems.- Proc.of the 3PA0 Syapoa.on Artificial Intelligence, Leningrad, USSR, Oct. 4-6, 1983.-Iiondon« Pergamon Press, 1984, p.323-330.