Вырождение оптимальных Е-планов в случае полиномиальной регрессии тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Майгула, Наталья Валентиновна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1994 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Вырождение оптимальных Е-планов в случае полиномиальной регрессии»
 
Автореферат диссертации на тему "Вырождение оптимальных Е-планов в случае полиномиальной регрессии"

САНКТ - ПЕТЕРБУРГСК1Й ГОСУДАРСТВЕННЫЙ .УНИВЕРСИТЕТ

РГ Б ОД

!"«•{ ИГ'--/,

На правах рукошси

! МАЙГУЛА Наталья Валентиновна

ВЫРОЖДЕНИЕ ОПТИМАЛЬНЫХ Е-ПШЮВ В СЛУЧАЕ ПОЛЖОШАЛЬНОЙ РЕГРЕССИИ

01.01.09 - математическая кибернетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

САНКТ-1ЕТЕРБУРГ 1094

Работа выполнена на кафэдре теории управления факультета прикладной математики - процессов управления Санкт-^зтербургского университета.

Научный руководитель: член-корреспондент Российской АН,

доктор физико-математических наук, профессор Б.М.Зубов

Официальные -оппоненты: доктор физико-математических наук,

профессор В. Ф. Демьянов (СШЗГУ),

кандидат физико-математических на.ук, доцент Т.К.Виноградова (СМГЭУ).

Ведущая организация: Санкт-Петербургский эконачико -

математический институт РАН.

Защита состоится " 2<Р" Щ-СНлЦ 1994 г. в M часов на заседании специализированного совета ■ K--063.57.i6 по присуждению ученой степени кандидата физико-математических наук в Санкт-Петербургском государственном университете по адресу: 1900Û4-, г.Санкт-Петербург, В.О., 10-я линия, д. 33; ауд. .88.

С диссертацией можно ознакомиться в научной библиотеке университета (г. Санкт-Петербург, Университетская набережная, Д. 7/9)

Автореферат разослан " 2.Ц. » .JMXJI_1994 г.

Ученый секретарь специализированного совета

К-063.57.16, доктор физ.-мат. ' наук Ь.ФЛ'с-рш.-кой.

ОБЩАЯ ХАРАКТЕРИСТИКА РЛбОТЫ

АКТУАЛЬНОСТЬ ТЕШ. При современном уровне развития науки и техники. многие исследования в физике, биологии, химии, металлургии и т.д. требуют постановки сложных и дорогостоящих экспериментов. Усложнение экспериментальных, установок вызвало резкое повышение стоимости экспериментальных исследований. Поэтому проблема извлечения наибольшего количества сзздэкий об изучаемых процессах при ограниченных затратах является в настоящее время весьма актуальной. Все больье требований предъявляется к точности результатов исследований. Во многих областях вл'чний сейчас уже явно неприлично представлять для опубликования экспериментальную работу, игнорируя статистические методы анализа данных.

Методы эмпирического поиска . оптимальных условий протекания процессов долгое время оставались неформализованными-. Экспериментатор выбирал тот или иной путь исследования, базируясь только на своем опыте и кнтуицш. Существенно новые возможности для решения этих задач открылись после использования идеи планирования эксперимента. Планировании экеяарймеяга было предложено Р.Фтером в 20-х годах нашего столетия для решения агробиологических, задач. 3 настоящее время это направление математической ел..истина бурно развивается, имеется ряд хорошо сформулированных критериев оптимальности планирования для ряамчных ситуация я для них разработаны алгоритмы, пользуясь которыми исследователь может располагать экспериментальные точки н пространстве независимых переменных и проводить обработку результатов лаблюданий. Среди кадашю отммяльноста гшна

Е-критерий является одним из малоизученных вследствие того, что для определения оптимального плана требуется реяжть максминную задачу. Предложенная в диссертации двойственная задача помогает преодолеть ряд трудностей при решении прямой задачи. Оказалось, что и двойственней еадача, заключающаяся в определении полиномов наименьшего уклонения, может быть решена, используя результаты решения прямой задачи.

Впервые идея использования двойственности в задаче Е-шшнирования была предложена А.Б.Ковригиным ИЗ. Зта же тема была развита у В.Б.Меласа 121.

ЦЕЛЬ РдбОТЫ:

- доказать новые теоремы в планировании эксперимента, используя Е-критерий;

- исследование характера вырождения оптимального Е-плана в случае полиномиальной регрессии, когда ХсВ1, где X -множество планирования;

- построение полиномов наименьшего уклонения для малых размерностей;

- постановка численного эксперимента для определения

критического значения параметра вырождения.

МЕТОД ИССЛЕДОВАНИЯ РАБОТЫ основан на применении теоремы двойственности Дж.фон Неймана о существование седловэгз решения. В диссертации широко используются многочлены Чебышева Т ,(х).

л -1

НАУЧНАЯ НОВИЗНА. В диссертации получены следующие новые результаты.

1. Определено множество шгадирования X, где не происходя!

л

вырождение Е-плана. Точки плана строятся в этом -случае в точках альтэрнанса полинома Чебшгева Тп_1(х), нормированного

условием: евклидова норма вектора коэффициентов равна единице.

2. Доказано, что для симметричного промежутка ранг вырождения не больше 2.

3. Доказано, что если множество планирования X - отрезок, то оптимальный Е-план имеет роию п точек.

4. С помощью численного эксперимента получены критические значения-параметра, в пределах которых план нь вырождается.

ПРИЛ01ЕНИЯ. Результаты диссертации могут найти применение для планирования экспериментов в различных научных областях Благодаря двойственности, исходная задача определзния оптимального Е-плана эквивалентна задаче построения полинома наименьшего уклонения. Поэтому результаты диссертации могут быть применимы к задаче поиска тагах полиномов.

ЛПРОБАЦЙЯ РАБОТЫ. Результаты диссертации докладывались н;з семинарах кафедр теории правления; моделированит экономических систем; математической теории моделирования систем управления; на 1У Областной конференции молодых ученых (г.Иваново, 1990г.); на весенних научных конференциях студентов и аспирантов прикладной математики - процессов управления СПбГУ (1989 - 1994гг.).

ПУБЛИКАЦИИ. Основные результаты диссертации опублйковюи в статьях [1-7].

СТРУКТУРА И ОБЪЕМ РАБОТЫ. Диссертация состоит из введения, шести глав и списка литературы из 36 наименований. Объем работы состав.адэт 74 страши;; мавяксшсного текста.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы, цель работы и обзор работ, примыкающих к теме диссертации, приводится краткое содержание диссертации.

■ Вводится функционал Е-критерия в следующем виде:

max min (А?,?), (1)

А «511=1

где матрица А выбирается из множества информационных матриц, \

собственный вектор, соответствующий минимальному собственному числу матрицы А: X (А).

Вводится понятие вырожденного плана. Вырожденным

называется план, у которого кратность А , (А) больше единицы.

Вводится понятие - чэбышевского плана, т.е. плана,

построенного с помощью полинома Чебашева Тп_1(х) с нормированным вектором коэффициентов.

Глава .1 посвящена основным понятиям теории планирования экспериментов. Пусть X - компактное множество, называемое- множеством планирования. Рассматривается классическая регрессионная модель

Y = W -г £,

где Y - вектор наблюдений, F - матрица плана эксперимента,

составленная из базисных непрерывных функций i ('!.,._____

с - вектор ошибок измерений (некоррелированных и одинаково распределенных). Неизвестные параметры 6 оцениваются по методу наименьших квадратов. Функционал МНК имеет вид:

Ф = (Y-F9)T(Y-F9).

fi

Полученная оценка 9 имеет дисперсионную матрицу

D(è) = aa(PTF)_1. Вводится множество нормированных информационных матриц плана s

А(&) = -4-(I'tF) = £ д î(x )îT(x ), (2)

где-х , 1=1,...,п, - точки плана, д(, 1=1.....п„ - веса, д

п

£ д =1. Доказывается i=i

Теорема 1. Если множество i(X) имеет размерность, равную п, то существует набор д, для которого \ , (А)>0.

min

Глава 2 посвящена критериям оптимальности планов. Б § i дается характеристика основных критериев оптимальности планов. Доказывается

Теореыа 2. Все перечисленные критерии можно свести к одному виду:

mir* шах SpfD-U,

□ I.

где D и Ь - неотрицательно определенные матрицы, пробегающие некоторое сзоз заданное множество матриц. .

В §2 исследуется двойственность задачи Е-планирования. Рассматривается двойственная задача в виде

rnln ¡пах Sp(AM). (3)

к А

где MêM(ç)=iM|SpM=l; IM): £ ï.ç'-îç1)7. 0*1,, Е *,=">: под

' 1 • 1

неравенством МгО подразумевается, что M - неотрицательно определенная матрица, А - информационная матрица из мнокоотвэ (2) . Доказываются

Теорема 3. Задачи (1) и (3) имеют решение.

Теорема 4. Задачу Е-плонирсвпния (1) можно свисти к 7

двойственной задаче (3). Л также существует седловое решение прямой (1) и двойственной (3) задачи (А*,М*).

Глава 3 посвятна постановке задачи оптимального планирования по Е-критерию для XdR1 и полиномиального вектора

Г(х) = (1,х.....х""1)'г-

Замечание 1. Согласно теоремам 2 н Д, выражение (Г) можно переписать в следующем виде: шах' min (Л5.0 =

А II 4 II-1

min шах (МГ.Г). (4)

м г

В такой формулировке задача построения оптимального Е-плана в случае полиномиальной регрессии эквивалентна построению

полинома R(x)=(Mr,i) , наименее уклоняющегося от нуля, нормированного условием: евклидова норма вектора коэффициентов равна 1, причем точки плана сосредоточены в точках максимального уклонения полинома R(x).

Заиечаше 2. Кроме предложенной нормировки, можно

рассматривать и другие, например, £ 1^1= 1; или £ =

«(!,..., 1,....Т)т. где единица стоит на 1-м месте; если 1=п, то

г "И

задача поиска оптимального Е-плана эквивалентна поиску полинома, наименее уклоняющегося от нуля, со старшим коэффициентом, равным единице. Доказываются

Леша. Информационную матрицу А можно представить в виде ' A=W•д•I -WT.

п

где W - матрица Вандермонда, составленная по точкам плана.

»•'••• /Jn)T- вектор весов, 1п- единичная матрица размерности [ты.]. 0

Teopeua 5. Пусть X=(-1,1), i(x)=(1,x,...,xn_1)т„ Л -

информационная матрица Е-плана. Если матрица А не является вырожденной, то rangtX , (А)] = 1.

m 1 fi

Следствие. Пусть X—[—1,1], тогда rangtI , (А)]=1.

m I п

Teopsua 6. По решении задачи (4) можно найти решение прямой задачи (1) в результате решения линейной системи алгебраических уравнений, т..е. найти оптимальный Е-ллан.

Предлагается метод решения линейной системы алгебраических уравнений из теоремы б с помощсю полиномиальных коэффициентов многочлена Лагранжа.

Леша. Для п>2 полином наименьшего уклонения R(x) = = (Mf,f)*const .

Teopeua 7. Пусть X - отрезок. Если полином наименьшего уклонения .R(x)=(Mjf.f)t»cohst на X, то оптимальный план с информационной матрицей А, составляющий пару для • R(x) в выражении (4), сосредоточен ровно в п точках на X.

Заиечание . Исключением из этой теоремы является размерность.п=2, т.к. в stom случае существует ситуация, когда искомый полином RUbconst. Этот случай рассмотрен в глаЕе

Б работе в основном исследуется вырождение Е-плонов но симметричном промежутке . Пусть X - C-p.pl, где р - некоторый параметр. Матрица плана будет иметь следующий звд:

А =

О Е М.х'

Е Vtf ' О

Е о е /j.x!

I i 1

Теорема 8. Если rangГ X , (A)J-i, то й(х)=-(5,Га):

min "

является квадратом полинома Чебшвева с нормировкой: евклидова норма вектора коэффициентов равна 1.

Теорема 9. Оптимальный E-план с информационной матрицей А в постановке задачи (1) единственный.

Теорема 10. Если rangíX (А)]=1,' то прямая и двойственная задачи имеют единственное решение, которые определяют седловую пару (Л*,М*).

Леша 1. Путь Ш) - пол!шомиальный вектор, матрица А -информационная матрица E-плана дпя X=[0,pi. Пусть Аа информационная матрица для зеркально отображенного относительно оси 0Y промежутка [0,pJ, т.е. для Х-[--р,03. Тогда A v. А2 имеют одни и»те же минимальные собственные числа.

Леша 2. Матрица А-1 на одностороннем промежутке типа X = [~р,0] или X = tO.p] Н9 имеет элементов, равных нулю.

Теорема 11. Для одностороннего промежутка Х---Е0,р) rang[XmJn(A)]=1 для любой размерности п.

Следствие. Для Х=[-р,рЗ rang[Xmijj(A) 3 ¿2.

Теорема 12. Если М - неотрицательно определенная матрица, след которой 5рМ=1, имеет вдоль нечетных диагоналей, перпендикулярных главной диагонали, элементы, сумма которых в отдельно взятой диагонали равна нулю, то свойства матрицы М, т.е. ее определенность и след, не изменятся, если в качестве этих элементов написать нули.

Глава 4 посвящена аналитическому построению оптимального Е-ллана и полинома наименьшего уклонения для случая п-2,3.

3 §1 решается прямая задача о помощью двойственней.

Для случая п=2 сделан следующий вывод:

1. При р2<1: план единственный: х --р, г и = /1=1 ¡2 ~л

¡0 ' "" - 1

полином наименьшего уклонония единственный: R(x)-x2.

2. При р2-1: план единственный: х =-1, х =1, ц = ,и »1/2» полиномов наименьшего уклонения много.

3. При ря>1: планов .много: любое х еГ-р,р], для весов существует ограничение: v д(х2 > 1, полином нэименыяего уклонения единственный: И(хЬ1.

Замечание. Случай п-2 является особым случаем, т.к. здесь возникает ситуация, когда после вырождения плана полином наименьшего уклонения вырождается в константу.

Вывод для случая п=3. 1. При р2£ 2 полиномом наименьшего уклонения является квадрат полинома Чебишева с нормировкой

. -I2

R(x)

х2-

_ pV4/p4+i . A/v'+y

точки плана расположены в альтернаксе этого полинома; вс-са определяются однозначно (см.'Теорему 6).

2. При р2й 2 пoJlИнoм наименьшего уклонения имеет вид:

Шх)= 1- р'2 ♦ --Ц х2 + -- х4.

1-р2 (р3- 1)р2

3. Разность между чебышеьлшм и оптимальным планами определяется соотношением:

V л2 = (р4- ¿Р2+ 4)Л(р4+ 4)р2] , ■ (5) и с ростом параметра р отличие между гас® несущественно, т.е. и чебышевский план дает приемлемые результаты в смысле оптимальности плана. Случай п=2 является исключением и таким свойством не обладает.

Данэ постановка задачи для случая г/оляюг.жаш!ой

регрессии четвертого порядка. Наряду с параметром р в случае п=4 появляется параметр q, который означает положение точки плана внутри промежутка [0,р]. Требуется найти

и

N

при наличии ограничений

ш1п И(р ), н

РЛр^Щ2)

т,* О, I т,= 1 _

Случай п=4 интересен тем, что после вырождения здесь происходит не только перераспределение частот течек плана, но и само положение точек плана меняется. В этом случае можно пайти .оценку критического значения параметра вырождения через наименьшую по модулю точку чебышевского альтерканса: ркг^ 2.

В §2 построен полином наименьшего уклонения для случая п=3. когда Р=Ркг. где р критическое значение прюаметра вырождения плана. Этот полином имеет вид:

И(х) =

3-/1/4р*+ С

гХ/4р*+ с

в

где

-/

1/4р4+С+-Н 2^/4р4+ С - ра 1/4р4.

С - (р"3- 1)а

В §3 аналитически исследуется характер вырождения по прямой задаче.

Гльва 5 посвящена построению полиномов наименьшего уклонения для несимметричного промежутка. В рассмотрен случай п-2.

12

В

Пусть г и р) соответственно, середина и половина длины дашогс промежутка. Тогда для X = полиномом

наименьшего уклонения является

х-г

?(х)=—— . /Т+г2

В §2 производится аналитическое построение критического значения параметра вырождения при п=3.

Основная идэя этого построения заключается в том, что ищется остаток от деления характеристического полинома для исходной информационной матрицы на характеристический полином от главного минора этой матрицы порядка 12x2]. Первое положительное значение параметра р при равенстве нулю этого остатка и даст искомое критическое значение р .

Глава б посвящена поиску критического значения параметра вырождения с помощью численного эксперимента.

Согласно теории, изложенной в главе 3, имеем следующее свойство оптимального Е-плана: если ранг его минимального собственного числа равен 1 (т.е. план является невырожденным), то поиск плана сводится к построению полинома Чебышева Р{х) = ({;,Г(х)) с нормировкой 11511=1 л решению системы

уравнений для ц , 1=1.....п (см. Теорему 6). Точки плана в

этом случае располагаются в точках альтернанса полинома Чебышева. Причем, для п - четного справедлива оценка р^г через' наименьшую по модулю точку чебышевского альтернанса:

1

Р

|х . |

т! п 1

Вырождение в этом случае происходит обязательно. ЧебышевскиЯ

план сильно отличается от оптимального, т.е. использования

13

чеОышевского. плана приводит к большим сшибкам. Для п -нечетного общего утверждения о вырождении нет. Как показали исследования главы 4 §1, для п-3 чебншевский план вырождается, ко его отличие от оптимального мало (см. (5)).

Численный эксперимент помогает ответить на зопрос о значении ркг для любого п. Для симметричного случая можно определить значение множества планирования Х=(-р ,р ], а для несимметричного счучая - значения I и р , когда оптимальный Е-план строится по полиному Чебышбва, где г и ркг-еоответствэкно, середина и половина длины промежутка, на котором строится план.

Основные результаты диссертации опубликованы в следующих работах:

1. Майгула Н.В. Вырождение полиномиальных Е-планов на симмэтричном промежутке,- ВИНИТИ №409-В90, 1990г.

2. Майгула Не В, Вырождение полиномиальных Е-планов.-Сборник тезисов докладов на П Областной конференции молодых ученых (г.Иваново, 1990г.), стр.40

3. Майгула Н.В. Поиск критического значения параметра вырождения Е-плана.- ВИНИТИ №2913-В92, 1992г.

4. Майгула Н.В. Аналитическое построение Е-планов на симметричном промежутке.- ВИНИТИ №2328-В93, 1993г.

5. Майгула Н.В. Об одном методе поиска критического значения параметра вырождения полиномиального Е-плана.- В иурнэло СПОГУ "Математические методы моделирования и анализа управляемых процессов"» 1994.

С. Уайгулэ К.В. Об одном методе унификации критериев 14 4

оптимальности планирования эксперимента.- ВИНИТИ №!2-В9<', 1994г.

7, Майгула Н.В. Управление процессом наблюдения (планирование эксперимента).- Сборник тезисов докладов на XX'/ (юбилейной) научной конференции ''Управление дтаамитескит системами" факультета Прикладной математики - процессов управления СПбГУ, г.Санкт-Петербург, 1994г. & )12лХ>с7~Ц..

1. Ковригин А.Е. Построение оптимальных Е-штноз, ВИНИТИ

№3544-79, 1979.

2. Мелас З.Б. одна теорема двойственности и Е-опткмальность.

Заводская лаборатория 1ГЗ, 1982.

ЛИТЕРАТУРА

РГП ИИЯФ,зак.248,тирЛ00,уч.-изд.л.0,7; 18/У-19Э4г. Бесплатно