Исследование статистической игры распознавания тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Белянкин, Георгий Андреевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1996 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Исследование статистической игры распознавания»
 
Автореферат диссертации на тему "Исследование статистической игры распознавания"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В.ЛОМОНОСОВА

Факультет Вычислительной Математики и Кибернетики

Р Г Б ОД

На правах рукописи УДК 519.8

Белянюга Георгий Андреевич

ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКОЙ ИГРЫ РАСПОЗНАВАНИЯ

01.01.09 - математическая кибернетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Москва 1996

Работа выполнена на кафедре исследования операций факультета Вычислительной математики и

кибернетики Московского Государственного Университета им. М.В.Ломоносова

Научный руководитель: кандидат физико-математических наук

доцент Морозов В.В.

Официальные оппоненты: доктор физико-математических наук

Горелик В.А.

кандидат физико-математических наук Бенинг В.Е.

Ведущая организация: ГП Московский Институт Теплотехники

Защита состоится " 13 " декабря 1996 г. в У/ часов на заседании Специализированного Совета Д 053.05.38 по математике в Московском государственном университете им.М.В.Ломоносова по адресу: 119899 Москва, Ленинские горы, МГУ им.М.В Ломоносова, 2-й уч. корпус, факультет ВМиК, ауд. 685.

С диссертацией можно ознакомиться в научной библиотеке факультета ВМиК. Автореферат разослан " 13 " ноября 1996 г.

Ученый секретарь Специализированного Совета

профессор , Н.П.Трифонов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы

Задача классификации объектов является одной из актуальных задач теории распознавания образов, дискретной математики и математической кибернетики. В настоящее время разработано большое число методов ее решения при условии пассивности объектов распознаваемых классов, когда их поведение описывается лишь статистическими закономерностями и эффективность классификации, в первую очередь, зависит от статистических различий объектов распознаваемых классов. В то же время в множестве задач классификации, когда, кроме статистических различий, в объектах распознаваемых классов присутствует возможность целенаправленного активного противодействия распознающей системе, отсутствуют разработанные эффективные методы решения таких задач. В связи с чем разработка методов решения статистико-игровых задач является весьма актуальной. В настоящей диссертации предлагаются методы решения статистико-игровых задач, базирующихся на статистической теории распознавания и теории антагонистических игр с нулевой суммой.

Цель работы

Целью работы является разработка методов решения, исследование вопроса о существовании седловых точек и определение оптимальных стратегий игроков в статистико-игровых задачах типа распознавание-противодействие. Действующими лицами такой игры являются распознающая сторона, выбирающая параметры классификаторов и противодействующая сторона, выбирающая числовые характеристики

з

закона распределения пространства признаков для объектов распознаваемых классов. Функция выигрыша определяется как вероятность ошибки распознавания.

'" Научная новизна

В настоящей работе на базе функции риска сформулирована статистико-игровая постановка задачи типа "распознавание-противодействие". Новизна сформулированного направления заключается в том, что в этих задачах учитывается как вероятностная, так и игровая неопределенности. Впервые в задачах классификации использован класс билинейных решающих правил. Показано, что вероятность ошибки распознавания для этого класса решающих правил меньше, чем для линейного и при небольших размерностях наблюдаемого вектора признаков мало отличается от вероятности ошибки распознавания для оптимальных байесовых классификаторов. Разработан метод решения статистико-игровой задачи с опеределением оптимальных стратегий, участвующих в конфликте сторон. Метод позволяет вычислять оптимальные стратегии аналитически с использованием приведенных ниже формул.

Теоретическая и практическая ценность Полученные результаты представляют ценность как для теории многомерных статистических игр, так и для теории распознавания образов. Аналитические выражения для стратегий игроков и разработанный программный комплекс могут быть использованы на практике при решении задач классификации в реальном масштабе времени.

Методика исследования В работе используются методы статистической теории распознавания, классической теории игр, теории оптимизации, теории вероятностей и математического анализа. Особое внимание было уделено аналитическому решению рассматриваемых задач.

Апробация работы . Результаты настоящей работы докладывались на Международной конференции студентов и аспирантов "Воробьевы горы - 95" (Москва, апрель 1995); на Восьмой международной конференции по непараметрическим методам в кибернетике (Красноярск, октябрь 1995); на Первой международной конференции по исследованию операций (Москва, апрель 1996); на Втором Сибирском Конгрессе по прикладной и индустриальной математике (Новосибирск, июнь 1996). Доклады по теме диссертации включены в программу Двадцатой международной конференции по компьютерной и индустриальной математике (Кёнчжу, Южная Корея, октябрь 1996). Работа проводимая по тематике диссертации поддержана Российским Фондом Фундаментальных Исследований (грант N 95-01-00732а).

Публикации

Основное содержание работы изложено в работах [1-4].

Структура и объем работы Диссертация состоит из введения и трех глав (14 параграфов), а также списка литературы, включающего 33 наименования. Общий

объем работы составляет 108 страниц. Изложение иллюстрируется 12 рисунками. В приложении приведены тексты программ на языке Паскаль.

СОДЕРЖАНИЕ РАБОТЫ Во введении делается обзор имеющихся результатов по теме диссертации, обосновывается ее актуальность, формулируется цель работы и излагается ее краткое содержание. Здесь же описывается формальная постановка задачи, даются необходимые определения и вводятся соответствующие обозначения.

Данная задача формулируется в виде многомерной статистической игры двух лиц, которых мы в дальнейшем будем называть игроком 1 и игроком 2. Игрок 1 создает некоторую совокупность объектов или явлений, которая может быть заранее разбита на два непересекающихся множества - классы 1 и 2. При этом он стремится с помощью средств противодействия, принадлежащих распознаваемым объектам, наилучшим образом снизить эффективность распознавания указанных объектов. Под стратегией игрока I мы будем понимать набор конкретных параметров средств противодействия х=(а,Ь,БД) е Х=АхВх5хЛ, определяющих многомерные плотности распределения вероятностей числовых значений признаков распознавания:

/, (г) = «2лГ№Тп ехр{-<2(г)/2) /г (~) = ((2яГ|Я|Г,/2 ехр{-Т{т) / 2)

где = Т(г) = (:-Ь)Ц-\2-Ь)т

Игрок 2 разрабатывает систему распознавания объектов или явлений, созданных игроком 1 и при этом стремится наиболее

эффективно решить задачу классификации. Под стратегией игрока 2 мы в дальнейшем будем понимать вектор параметров, задающий множество V. При этом, если наблюдаемый вектор z е V, то объект относится ко второму классу, а в противном случае - к первому. Функция выигрыша определяется как вероятность ошибки распознавания:

F(x,y) = pi J fx(z)dz + рг f/2(z)dz V Em\V

Задача состоит в решении игры Г-<X, Y,F(x.y)>, т.е. в определении оптимальных стратегий обоих игроков.

В главе 1 рассматривается одномерный вариант статистической игры распознавания. В этом случае стратегия первого игрока х-(а.Ьлт), где а и b - математические ожидания, a î и г - дисперсии гауссовых законов распределения вероятностей числовых значений признаков для двух классов объектов. Стратегией второго игрока является подмножество числовой прямой V, с помощью которого производится классификация объектов.

В §1 исследуются элементарные свойства одномерной игры, не зависящие от вида множества V. Показывается, что если существует стратегия х такая, что

D(x) = - Ь)2 -(s-г) In (fist pi г)) < 0 , (*)

то первый игрок может снизить эффективность распознавания до min[pi,p2]. Наилучшим ответом второго игрока на эту стратегию будет являться или V=E! или V-0. Находится точка, в которой достигается минимум выражения D(x), что позволяет быстро проверять выполнение условия (*).

В §2 рассматривается одномерная статистическая игра распознавания с решающим правилом классификации, определяющим стратегию второго игрока, в виде полупрямой (у,+0°) или (~со,_у). На множество стратегий первого игрока накладываются следующие ограничения: отрезки изменения математических ожиданий

[я,а],и>М>а <Ь считаются непересекающимися; дисперсии считаются принадлежащими отрезкам [«,«], [г, г]. Таким образом, ^ = У={(у,р) 1 уеЕ1, р е{1,2}}. Причем пара

(у,1) задает классификационное множество (у,+оо), а пара (у.2) -множество (-ао,у). В предположении р!<рг показывается, что стратегия р-\ всегда лучше, чем р =2.0сновным результатом данного параграфа является доказательство существования седловой точки

5*=5, г* = г, у -уг (5,г), при у2,г)йа;

5* такое, что у2(я',г)=а, г*=г, у*=а, при у2(£,г)>а£у2(5,г);

5*=5, г'=г, у'=у2(я'У), при Ь2у2и,г)>а;

/=5, г* такое, что у2(з, г')=Ь, у"=Ь, при у2(я,г)>Ь^.у2{в,г)-,

г'=г, у'=у2^',г'), при у2(з,г)>Ь, где у2~ наибольший из корней уравнения р1 /¡(г) =р2/2(г). В § 3 исследуется одномерная статистическая игра распознавания с решающим правилом классификации в виде отрезка [уиу2] или дополняющего его до полупрямой множества. Отрезки изменения математических ожиданий считаются совпадающими : [-с,с].

а = а ,Ь =Ь,

Дисперсии считаются фиксированными и равными э, г. 5<г. Таким образом, множество стратегий первого игрока >ф-}х{/-},

множество стратегий второго игрока У= {(у; ,у:) | у/,Е1}. Если у; <у2, то классификационным множеством будет интервал (у/ а если )>1>у: , то множество (-оо,у:)и( у^, Основным результатом этого параграфа является определение оптимальных стратегий первого и второго игроков, нахождение максимина и минимакса. Показывается, что в общем случае седловая точка в чистых стратегиях отсутствует.

В § 4 в предположениях предыдущего параграфа исследуется смешанное расширение игры. Седловая точка ищется для стратегий вида :

= о,

где ф(1) - функция плотности для вероятностного распределения математического ожидания первого объекта, 1с - индикатор точки с.

Основным результатом этого параграфа является доказательство существования седловой точки в описанном выше классе стратегий при выполнении некоторого ограничения на функции плотностей.

В § 5 рассматривается вариант одномерной статистической игры, когда множество стратегий второго игрока удовлетворяет условиям: существуют такие с',с", что [с',с"]сА , [с', с" ]сВ и |с"-с'\> З^я-г\.

Показывается, что в этом случае игра имеет е- седловую точку в независимости от решающего правила второго игрока-. Применение смешанных стратегий вида:

./с'+с" ^ и-С' + С"

позволяет первому игроку совместить функции плотностей и, тем самым, увеличить вероятность ошибки распознавания до ее предельного значения, т.е. до минимальной априорной вероятности появления одного из объектов.

В главе 2 рассматриваются многомерные статистические игры распознавания с линейными или кусочно-линейными решающими правилами. Особое внимание уделяется введенному классу билинейных классификаторов:

Н= <ЬТ < /2}. В § 1 рассматриваются игры, которые оператором проектирования - < п, х >, где х" е Е1,п е Ё\ х е Е" могут быть сведены к одному из рассмотренных одномерных случаев. Показывается, что на них могут быть распространены результаты, полученные в Главе 1.

В § 2 исследуется вопрос об определении оптимальных стратегий первого и второго игроков в случае применения билинейного решающего правила. Множество стратегий первого игрока имеет вид:. Х=АхВх{5}х{11}, где А.ВеЕ?, 5,Ямножество стратегий второго игрока - У={(к,1] I, .¡¿еЕ1} задает классификационное

множество V - [г\/, < кгГ < 12) ■

Основным результатом параграфа являются аналитические формулы для оптимальных стратегий игроков. Показано, что значения компонентов оптимальной стратегии второго игрока к, могут

быть найдены по следующим формулам:

к^ф-аХБ+аЯУ1

. _ Нка'-СУкЬ'+^/о "...... П-'-С, '

где

Аз

а-

Р\

\2=112~каТ

(кат-кЬт)2-(Н-С)1п

°Рг

Щ

в=тт н^кяк7.

Компоненты оптимальной стратегии первого игрока а, Ь могут быть вычислены исходя из следующего соотношения:

(а,Ь) = ащ щт к(Ь-а)2

АхВ

§ 3 посвящен оценке качества работы билинейного решающего правила. Основным результатом является сведение выражения для функции выигрыша к сумме табличных интегралов:

РА фс

где

1 * I2

\12к

о

п

В § 4 в предположениях предыдущего параграфа, и на основании полученных в нем утверждений, исследуется вопрос о существовании седловой точки в статистических играх с билинейным решающим правилом. Рассматривается двумерный случай, для которого показывается, что практически при любых значениях параметров в игре существует или седловая точка, или в- седловая точка.

В § 5 факты, полученные в § 5 главы 1, распространяются на многомерный случай. Основным результатом данного параграфа является доказательство существования е- седловой точки при условии, что радиус максимального шара, принадлежащего и множеству А и множеству В, более чем в три раза превосходит корень из максимального по модулю собственного значения матрицы Б-Л, умноженного на т. Как и в главе 1, вероятность ошибки распознавания, в случае применения первым игроком • соответствующей стратегии, увеличивается до максимально возможного уровня, равного шт[р],р2].

Глава 3 посвящена оценке максимально возможной погрешности при переходе от оптимального байесовского решающего правила к линейному или билинейному.

В § 1 приводится способ упрощения для вероятности ошибки распознавания в случае использования распознающей системой байесовского классификатора. Основным результатом данного параграфа является сведение многомерного интеграла к сумме одномерных интегралов по бесконечной полупрямой. Выражение получается очень громоздким и хотя подинтегральные выражения стремятся к нулю при возрастании аргумента, вычисление этих интегралов сопряжено со значительными трудностями. В Приложении

3 приводится программа на языке Pascal, разработанная специально для вычисления таких интегралов.

В § 2 сравниваются вероятности ошибок распознавания билинейных и байесовских решающих правил для двумерного пространства признаков. Показывается, что максимальное отличие двух вероятностей не превышает 0.0998. Это значение достигается при совпадающих значениях математических ожиданий и корреляционных матрицах, совпадающих и равных произведению единичной матрицы на константу. Однако, при увеличении размерности пространства признаков эта оценка возрастает (например, при ш=10 максимальное отличие составляет 0.2837).

В § 3 для таких математических ожиданий и корреляционных матриц аналитически вычисляется многомерный интеграл вероятности ошибки распознавания.

В § 4 показывается, что билинейное решающее правило всегда лучше линейного решающего правила.

Автор выражает глубокую благодарность кандидату физико-математических наук доценту В.В.Морозову за научное руководство и большую помощь в подготовке данной работы.

Основные результаты диссертации

1. исследован целый ряд постановок одномерных и многомерных статистических игр распознавания при различных предположениях о структуре множеств стратегий игроков;

2. введено в рассмотрение билинейное решающее правило. В многомерных играх с таким правилом получено аналитическое

выражение для оптимальных стратегий обоих игроков и значений функции выигрыша;

3. получены оценки максимального отклонения вероятностей ошибок распознавания в играх с билинейным и байесовским решающими правилами;

4. разработан комплекс алгоритмов и программ, позволяющий рассчитывать оптимальные стратегии игроков и значение функции выигрыша.

Основные результаты работы опубликованы в следующих работах автора:

1. Морозов В.В., Белянкин Г.А., Бежуашвили Б.Т. Теоретико-игровой подход к задаче распознавания. // Вычислительная техника и вопросы кибернетики, вып.28, Математические модели дискретных систем. С-Пб., 1994. с.88-103.

2. Белянкин Г. А. Вычисление вероятности ошибки "распознавания для билинейного решающего правила. Вестник МГУ. Сер. 15 Вычислительная математика и кибернетика. № , С. 30-37.

3. Белянкин Г.А., Медведков И.А. Использование билинейного классификатора в статистических играх распознавания объектов.// Тезисы докладов Второго Сибирского Конгресса по Прикладной и Индустриальной Математике., 1996, С. 158.

4. Белянкин Г.А., Медведков И.А., Морозов В.В. Игровая постановка задачи статистического распознавания и ее решение для ряда классификационных правил.// Сборник трудов Первой Московской Конференции по Исследованию Операций, С.7-12.