Некоторые статистические критерии и их свойства в моделях многомерного гауссовского анализа тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Кашицын, Павел Александрович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2013
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
Московский Государственный Университет имени М.В. Ломоносова Механико-математический факультет
На правах рукописи УДК 519.237.3
-У
Кашицын Павел Александрович
НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ КРИТЕРИИ И ИХ СВОЙСТВА В МОДЕЛЯХ МНОГОМЕРНОГО ГАУССОВСКОГО АНАЛИЗА
Специальность: 01.01.05 - Теория вероятностей и математическая статистика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
3 ОКГ 2013
Москва — 2013
005533*01
005533957
Работа выполнена в Московском Государственном Университете имени М.В. Ломоносова на кафедре теории вероятностей механико-математического факультета.
Научный руководитель: доктор физико-математических наук,
профессор Тюрин Юрий Николаевич.
Официальные оппоненты: доктор физико-математических наук,
профессор Пирогов Сергей Анатольевич, главный научный сотрудник ИППИ РАН;
кандидат физико-математических наук Уфимцев Михаил Валентинович, старший научный сотрудник, МГУ им. М.В. Ломоносова, факультет ВМК МГУ,
кафедра автоматизации научных исследований.
Ведущая организация: Национальный исследовательский
университет "Высшая школа экономики".
Защита состоится 25 октября 2013 года в 16 часов 45 минут на заседании диссертационного совета Д 501.001.85 при Московском государственном университете М.В. Ломоносова по адресу: 119991, ГСП-1, Москва. Ленинские горы, Главное Здание МГУ, механико-математический факультет, аудитория 10-24.
С диссертацией можно ознакомиться в Фундаментальной библиотеке МГУ имени М.В. Ломоносова (Ломоносовский пр-т, 27, сектор А, 8 этаж).
Автореферат разослан 24 сентября 2013 года.
Ученый секретарь диссертационного с
доктор физико-мат™...................._ тг _
профессор ' ^ В.Н. Сорокин
диссертационного совета Д 501.001.85 при МГУ, доктор физико-математических наук, д ^ ^
Общая характеристика работы Актуальность темы
Многомерный статистический анализ — это раздел математической статистики, который изучает многомерные наблюдения. В гауссовком анализе также делается предположение о том, что распределение многомерных наблюдений, или векторов, является нормальным.
Проблемы, связанные с проверкой гипотез в многомерном гауссовском анализе, исследуются учеными с момента оформления этой пауки в самостоятельную область в первой половине 20-го века. Основополагающие результаты в этой области были получены Р. А. Фишерем1, С. С. Уилксом2, С.Н. Роем3, М.С. Бартлеттом4, Г. Хотеллингом5.
Результаты исследований того времени были подведены к 60-м годам 20-го века, в монографиях С.Н. Роя6 и Т.В. Андерсона7. В монографии Т.В. Андерсона линейные модели были изложены в форме регрессионного анализа без общего понятия линейных моделей и линейных гипотез. Общее понятие линейной модели и линейной гипотезы было недавно предложено Ю.Н. Тюриным8.
Проблемы, связанные с проверкой гипотез в многомерном гауссовском анализе, включают в себя следующие задачи:
• Проверка многомерных гипотез о наличии линейных связей между математическими ожиданиями наблюдений (линейные гипотезы);
• Проверка многомерных гипотез о наличии связей типа неравенств между математическими ожиданиями наблюдений (конические гипотезы) ;
• Проверка гипотез о независимости многомерных признаков (гипотезы о структуре ковариационной матрицы).
] R.A. Fisher. "The general sampling distribution of (lie multiple correlation coefficient".
Proc. Roy. Soc., A121, pp.G54-G73, 1928.
2S.S. Wilks. "Certain generalizations in the analysis of variance". — Biometrika, 24, pp. 471-494, 1932.
3S.N. Roy. "Analysis of variance for multivariate normal populations. The sampling distribution of the requisite p-stat.istics on the null and non-null hypothesis1'. — Sankhya, G, pp. 35-50, 1942.
4M.S. Bartlett. "On the theory of statistical regression". — Proc. Roy. Soc. Edmb., pp. 2G0-283, 1933.
5H. Ilotelling. "The generalization of Student's ratio". - Arm. Math. Stat., 2, pp. 360-378, 1931.
GS.N. Roy. Some Aspects of Multivariate Analysis. — N.Y.: Wiley, 1957.
7T.B. Андерсон. Введение в многомерный статистический анализ. — М.: Фпзмат-лпт, 1963.
8Ю.Н. Тюрии. Многомерная статистика: гауссоасхие линейные модели — Издательство МГУ, 2011.
В ходе многолетних исследований были выработаны основные требования, предъявляемые к критериям, которые могут быть использованы при проверке гипотез в многомерном гауссовском анализе:
• Инвариантность критерия по отношению к аффинным преобразованиям наблюдений, у которых сдвиги не меняют гипотетическое множество;
• Свобода критерия от неизвестных параметров модели при гипотезе.
Следствием условия инвариаитиости оказывается то, что статистические критерии должны быть функциями от собственных значений произведений матриц, распределенных по Уишарту. Свобода распределения от параметров модели при гипотезе для таких критериев достигается автоматически. Изучению свойств распределения Уишарта посвящены работы Дж. Уишарта9, С. С. Уилкса10, А. Т. Джеймса11 и других.
В последние годы привлекают к себе внимание многомерные задачи, наблюдения в которых не являются независимыми, по имеют заданную ковариационную структуру. М. С. Сривастава1'2 и Д. фон Розен13 решили задачу оценивания параметров модели, в которой совместная ковариационная структура наблюдений задается в виде произведения Кронексра двух положительно определенных матриц. В 1-й главе настоящей диссертации для описанной структуры зависимых наблюдений была разработана теория линейных моделей. Эта теория, естественно, включает оценивание неизвестных параметров.
Во 2-й главе исследуется свойство монотонности функции мощности ипварнаптпых критериев, возникающих при проверке гипотез в моделях многомерного гауссовского анализа как для независимых наблюдений, так и для зависимых наблюдений с заданной копариацигаюй структурой. В 1980 г. И. Олкин и М.Д. Перлмап14 сформулировали гипотезу о монотонности функции мощности ипварнаптпых критериев, верность которой в общем виде до сих пор не доказана и не опровергнута. В настоящей диссертации доказана монотонность функции мощности для широкого класса инвариантных критериев. Этот класс включает в себя все основные известные критерии, которые используются в прикладных задачах.
eJ. Wishart. "The generalised product moment distribution in samples from a normal multivariate population". — Biomctrica, 20A (1-2), pp. 32-52, 1928.
10S.S. Wilks. "Sample criteria for testing equality of means, equality of variances and equality of corariauces in anormal multivariate distribution". Ann. Math. Statist.. Vol. 17. pp. 257-281, 1946.
UA.T. James. "Distributions of matrix variates and latent roots derived from normal wimples". Ann. Math. Statist, Vol.35, No.2, pp.475-501, 1364.
12M.S. Srivastava. "Estimation of interclass correlations in familial data". — Biometiika, Vol.71, pp. 177-185, 1984.
I3M.S. Srivastava, T. Nahtman, D. von Rosen. "Estimation of interclass corrélations in familial data". — Math. Meth. of Statist.. Vol.17, No. 4, pp. 357-370, 2008.
"I. Olkin, M.D. Perlman. "Unbiasedness of invariant tests for MANOVA and other multivariate problems". Ann. Math. Statist., Vol.8, pp. 132G-1341, 1980.
Полученные результаты обобщают соответствующие результаты И. Ол-кипа, М.Д. Перлмапа, С.Н. Роя15, Т. В. Андерсона16, П. Гроепбума17 и Д. Р. Труа17.
В последние десятилетия интенсивно развивается теория проверки гипотез о положении с ограничениями типа неравенств. Вначале данные гипотезы рассматривались как альтернативные к пулевым гипотезам в линейных моделях. Однако в приложениях часто возникают самостоятельные задачи, когда требуется проверить гипотезу о принадлежности параметра некоторому заданному выпуклому конусу. Теория конических гипотез в одномерном случае разрабатывалась такими учеными как Т. Робертсои18,10, Ф.Т. Райт18, Р. Л. Дэйкстра19. Однако единого подхода к проверке многомерных конических гипотез в гауссовском случае до сих пор разработано пе было. В 3-й главе настоящей диссертации вводится понятие многомерного матричного конуса, и с его помощью решается задача о проверке многомерных конических гипотез в той общности, которая достаточна для решения прикладных задач.
Таким образом, тема диссертации представляется актуальной с теоретической точки зрения, и имеет практическую значимость.
Цель работы
Целыо данной диссертации является исследование новых свойств статистических критериев, возникающих при проверке лииейпых и конических гипотез для моделей многомерного гауссовского анализа с зависимыми наблюдениями, которые имеют заданную ковариационную структуру.
Научная новизна
Основные результаты диссертации являются новыми и состоят в следующем:
1. В модели многомерных зависимых наблюдений с ковариационной структурой, заданной в виде произведения Кропекера двух положительно определенных матриц, предложен альтернативный метод получения состоятельных и несмещенных оценок с помощью техники,
15S.N. Roy, W.F. Mikhail. "On the monotonia character of the power functions of two multivariate tests". - Ann. Math. Statist, Vol. 32, pp. 1145-1151, 1901.
10S. Das Gupta, T.W. Anderson, G.S. Mudliolkar. "Mouotonicity of the power functions of some tests of the multivariate linear hypothesis". — Ann. Math. Statist., Vol. 35, pp. 200-205, 196-4.
1' P Groeneboom, D.R. Truax. "A nionotonicity property of the power function of multivariate tests". — Indag. Math., Vol.11, pp.209-218, 2000.
18T. Robertson, F.T. Wright. "On approximation of the level probabilities and associated distributions in order restricted inference". — Biomclrika, Vol. 70, No. 3, pp. 597-006,1983.
ieT. Robertson, F.T. Wright, R.L. Dykstra. Order restricted statistical inference. — .John Wiley and Soils, 1988.
разработанной С.Н. Роем. Для указанной модели зависимых наблюдений разработаны методы проверки линейных гипотез. Доказана теорема об ортогональном разложении случайной матрицы с зависимыми столбцами. Предложенный подход проиллюстрирован па примере задачи многомерного дисперсионного анализа.
2. Доказана монотонность функции мощности для широкого класса инвариантных критериев многомерного гауссовского статистического анализа. При исследовании функции мощности инвариантных критериев получен ряд новых результатов, касающихся стохастических свойств нецентрального распределения Уишарта.
3. Введено понятие матричного конуса и исследованы его основные свойства. На базе введенного понятия ставится задача о проверке многомерных конических гипотез, обобщающая соответствующие одномерные аналоги. Распределение критической статистики исследовано при гипотезе.
Методы исследования
В работе применяются общие методы теории вероятностей и математической статистики, функционального анализа, а также элементы матричной и линейной алгебры. Широко используется теория стохастических порядков случайных векторов.
Теоретическая и практическая значимость
Работа носит теоретический характер. Одновременно она направлена на приложения математической статистики. Предложенные в диссертации критерии могут быть полезпы для решения практических задач, в которых распределение многомерных наблюдений с хорошей точностью можно считать нормальным.
Апробация работы
Основные результаты работы докладывались па следующих семинарах и конференциях:
• Большой семинар кафедры теории вероятностей МГУ под руководством академика РАН, проф. А.Н. Ширяева в 2013 г.
• Семинар «Непараметрическая статистика и временные ряды» под руководством проф. В.Н. Тутубалииа, проф. Ю.Н. Тюрина и доц. М.В. Болдипа в МГУ — неоднократно делал доклады в 2008-2013 гг.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2013 г.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2012 г.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2011 г.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2010 г.
• Международная конференция «Теория вероятностей и ее приложения» в МГУ, посвященная столетию со дня рождения Б.В. Гпедеико в 2012 г.
• Международная конференция по многомерной статистике в Тарту, Эстония в 2011 г. (the 9th Tartu conference on Multivariate statistics).
Публикации
Результаты диссертации опубликованы в б работах автора., из которых 2 входят в перечень ВАК. Работ, написанных в соавторстве, ист. Список публикаций приведен в конце автореферата.
Структура диссертации
Диссертация состоит из введения, трех глав, списка обозначений и списка литературы, насчитывающего 75 наименований и организованного в алфавитном порядка. Вначале приведен список используемой литературы па русском языке, затем - зарубежные источники. Результаты, полученные автором диссертации, оформлены в виде Теорем и Лемм; необходимые известные факты сформулированы в виде Утверждений с указанием источника цитирования. Нумерация утверждений, лемм, теорем и формул начинается в каждой главе заново и состоит из двух чисел: первое число относится к помору главы, второе - к номеру соответствующего утверждения (леммы, теоремы или формулы). Общий объем работы составляет 97 страниц.
Краткое содержание диссертации
Диссертация посвящена статистическим критериям и их свойствам, которые возникают в многомерном гауссовском анализе, в частности в следующих трех случаях:
• Проверка линейных гипотез;
• Проверка гипотез о независимости многомерных признаков;
• Проверка конических гипотез.
Первая глава диссертации состоит из девяти разделов. В ней вводится вспомогательный аппарат матричных алгебраических модулей, а также исследуются методы проверки многомерных линейных гипотез для зависимых наблюдений.
В Разделах 1.1-1.3 изложены необходимые сведения из многомерного статистического анализа, которые попользуются в дальнейших разделах работы.
В Раздачах 1.4-1.9 построена теория линейных моделей для набора зависимых наблюдений, совместное распределение которых имеет ковариационную структуру, заданную в виде произведения Кроиекера двух положительно определенных матриц.
Рассмотрим левый алгебраический модуль элементами которого являются (р х п)-матрицы над кольцом (р х р)-матриц из с естественными операциями матричного сложения и умножения на (р х р)-матрицу слева.
Определение. Подмодуле С, называется подмножество М^, замкнутое относительно операций суммы и умножения на (рхр)-матрицу слева:
1. {X 4- У) е С для любых X, У е С.
2. КХ € С для любых X е С, К е
Определение. Матричным скалярным произведением двух (р х п)-матриц А', У € будем называть (р х р)-матрицу
(Х,1% = Х<}У',
где ф — положительно определенная (пхп)-ма.трица (обозначение: С) >- О гини С) е Р,,^. Будем говорить, что матрица (} опредемет введенное матричное скалярное, произведение.
Определение. Ортогональным дополнением к подмодулю С С назовем подмодуль
С1 = {У| V е (К Х)0 = 0 для любого X 6 С}.
Определение. Проекцией X е на подмодуль С С К; назовем (р х п)-матрицу Я = рго^А'), если
1. г € С;
2. х-ге с1.
Ю. Н. Тюриным20 было показано, что для любого подмодуля С С М?, существует линейное подпространство Ь С М" такое, что (д1,..., др)' 6 С, 9; £ К", г = 1 ,р, тогда и только тогда, когда 6 ¿,1 = 17р. Линейное
20Ю.Н. Тюрин. Многомерная статистика: гауссооскне линейные модели. — Издательство МГУ, 2011.
подпространство L будем называть порождающим для матричного подмодули £.
Размерностью матричного подмодуля С. С RJJ (обозначение: dim С) будем далее называть размерность порождающего его линейного подпространства L С R,1,.
В Разделе 1.3 приводится ряд свойств нецентрального распределения Уишарта, которые используются в дальнейшем в настоящей работе.
Определение. Случайная (р х р)-матрица И',,(п, Е, Д) имеет нецентральное распределение Уишарта с н степенями свободы, ковариационной матрицей Е и параметром нецентральности Д, если данная матрица может быть представлена я виде:
п
Wp(«, Е, Д) = 52(6 + + "»*)'.
t=i
где случайные векторы сугпь независимые одинаково распреде-
ленные (и.о.p.) jV,,(0,Е), и параметр нецентралъности
Д = Z-hfM'Z'l,
где М = (mi,..., тп). В случае, ec.nu Д = О, распределение Уишарта называется центральным и обозначается Wj,(n,E).
В Разделе 1.4 рассматривается набор зависимых наблюдений ____хя,
ковариационная структура совместного распределения которых определяется произведением Кроиекера двух положительно определенных матриц:
Cov(x{,Xj) = Ф = bhj) >-0, Е v 0.
Точнее, рассмотрим (р х </)-матрицу X = (.ri,..., состоящую из наблюдений .г'|,...,г„ где рд-вектор vec(X) = (х[,..., x'q)' по предположению
является нормально распределенным со средним vec(M) -- (т\.....m'q)' и
положительно определенной ковариационной матрицей Л. Предположим, что (pq х рдг)-матрица Л может быть задана в виде произведения Кроиекера двух положительно определенных матриц, т.е. К = Ф ® Е, где (ij х д)-матрица Ф ~ (-¿'у) и (р х р)-матрица S = («Ту), и матрицы Ф,Е по предположению являются положительно определенными. Таким образом, случайная матрица X имеет многомерное нормальное распределение
Л' ~ N$(M, Л), Л = Ф® Е.
В монографии М. С. Сриваставы и С. Г. Хатри21 используется эквивалепт-ное обозначение
X ~ NPt<1 (Л/,Е, Ф), которым мы будем пользоваться в дальнейшем.
21 M.S. Srivrustava, C.G. Khatri. An Introduction to Mvltivariatc Statistics. — North Holland, New York, 1979.
Лемма 1.3 Пусть Y ~ Np,q(M,A, В), где А, В - неотрицательно определенные матрицы (обозначение: Л >р О, В О или Л 6 Р§р, В е PSJ. IWa К' ~ ^„(ЛГ, В, А).
Далее в Разделе 1.5 с использованием указанной леммы 1.3 при предположении об одинаковой распределенности наблюдений методом С.Н. Роя получены состоятельные и несмещенные оценки параметров модели.
Теорема 1.1 Пусть Х\,..., XN суть независимые одинаково распределенные NPj,(M,£, Ф,,), где Ф,, = (фц). фй = 1, г = I7¡?. Тогда
является несмещенной и состояпе.чьной оценкой Е при N —> оо.
Теорема 1.2 Пусть Хг,..., XN суть независимые одинаково распределенные Np,q{M, Е. ФД где Ф, = {фц), фй = 1, i = lTg. Тогда
________N
= Ж [£_1(*y - - %)']
J=i
является состоятельной оценкой фу, к ф I, кЛ = 1. q при N —> оо.
В Разделе 1.6 рассматривается общий случай без предположения об одинаковой распределенности многомерных наблюдений.
С использованием леммы 1.3 показано, что если некоторая случайная обратимая матрица Й является состоятельной оценкой параметра то случайная матрица
® = (1) j=i
является состоятельной оценкой параметра Ф. Аналогично, если некоторая случайная обратимая матрица Ф является состоятельной оценкой параметра Ф, то случайная матрица
V=^^t{Xk-X)V-\Xk-X)', (2)
является состоятельной оценкой матрицы £. В работе М.С. Сриваставы, Т. Нахтмап, Д. фон Розена22 показано, что система уравнений (1) и (2) с неизвестными матрицами Ф и 2 может быть решена алгоритмически при некоторых дополнительных ограничениях.
В Разделе 1.7 разработаны методы проверки линейных гипотез для зависимых наблюдений с рассматриваемой ковариационной структурой.
"M.S. Srivastava, Т. Nahtinau, D. von Rosen. "Estimation of iiiterclass correlations in familial data". - Math. Metli. o[ Statist., Vol.17, No. 4, pp. 357-370, 2008.
Приведенная ниже теорема показывает, что распределение Е, Ф),
где Е >- О, Ф X 0 можно сделать свободным от параметров Е и Ф е помощью линейных преобразований.
Теорема 1.3 Пусть X ~ ЛГР(Т1(Л/, Е, Ф), где Е X О, Ф X 0. Тогда
ХГ*ХФ"5 ~ Л'р,„(1Ги/Ф
Следующая основная теорема описывает разложение случайной матрицы наблюдений в сумму проекций на ортогональные подмодули.
Теорема 1.4 Пусть X = (х).... ,хп) — случайная (р х п)-матрица, имеющая, распределение Л^ДАУ, Е, Ф), где Е >- 0, Ф >- 0. Пусть С2, ■ ■ ■, £, — взаимно ортогональные подмодули прямая сумма которых образует Ш?:
К£ = А (!>...(!) £,„,
причем матричное скалярное произведение определяется матрицей Ф-1. Рассмотрим разлоокение X 6 в прямую сумму ортогональных проекций на подмодули С\,.. ., Ст:
Л' = ргоКЛ') + ...+рго](А').
£1 с,,.
Тогда имеют место следующие утверждения:
a) случайные (р х п)-матрицы рго^ДА"), ?' = 1, т независимы, распределены нормально и Ерго]с.(Х) — рго}С.(ЕХ).
b) (рго]£.(Х),рго]£.(Л'))4,-1 ~ И/Р(с1пп£;, Е, Д;), где случайная (р х р)-матрица Ир(1Цт£;,Е, Д{) распределена по Уишарту с параметром нецентральности
Д4 = Е~з(ргоК.ЕЛ'),ргоК£;<:))4,-1£-з. и е.,
В Разделе 1.8 па основе теоремы 1.4 строится линейная модель для наблюдений с рассматриваемой ковариационной структурой, задаппой в виде произведения Кропекера двух положительно определенных матриц.
Определение. Матрица X = (.г'],... ,х„) следует линейной гауссов-ской модели с ковариационной структурой, заданной в виде произведения Кронекера двух положительно определенных матриц, если
a) ЕХ 6 Ы для некоторого заданного подмодуля Ы С
b) X = (.п.....хп) ~ Л7,,,,, (Л/, Е, Ф), где Е >- 0, Ф X 0.
Матрица Ф при этом считается известной, а матрица Е неизвестна. Линейной гипотезой в лнпейпой модели назовем гипотезу
Я : ЕХ 6 1А\, (3)
против альтернативы
А\ЕХ & и\Ыи
где Ы\ заданный подмодуль и. Разложим и в ортогональную сумму подмодулей:
и=Ых ®«2,
где матричное скалярное произведение определяется матрицей Ф-1. Рассмотрим разложение па три попарно ортогональных подмодуля:
щ; =их @и2Фи1.
Случайные матрицы
51 := (ркц X, рпу Х)у-1, 32 := (рго] А')Ф-1
и1 и'- «2 м2
статистически независимы и распределены по Уишарту, где проекции и скалярный квадрат матриц определяются из теоремы 1.4. Пусть сПт£/ = т, с!пп% = т\ и с1нп£^2 = гл2, тогда
51 ~ Ир(п - т, Б).
Если гипотеза (3) верпа, то имеет место
52~1Ур(т2,Е).
В качестве аргументов критических статистик могут быть использованы собственные значения матрицы 1.
В Разделе 1.9 разработанная теория иллюстрируется иа примере задачи многомерного одпофакторного дисперсионного анализа для наблюдений с ковариационной структурой, которая задана в виде произведения Кронекера двух положительно определенных матриц.
Вторая глава диссертации посвящена свойству монотонности функции мощности инвариантных критериев, возникающих в различных моделях многомерного гауссовского анализа.
Разделы 2.1-2.2 посвящены инвариантным критериям, возникающим при проверке линейных гипотез и гипотез о независимости многомерных признаков.
В Разделах 2.3-2.5 доказывается моно тонность функции мощности инвариантных критериев, являющихся монотонными выпуклыми функциями, аргументами которых являются элементарные симметрические многочлены или усеченные суммы от корней характеристического уравнения:
с^ [И'„(п., Е, Д) - Ь • И-'р(т, 2)] = О,
где Е >- 0, р ^ т, и участвующие в уравнении матрицы Уишарта статистически независимы. Корни данного характеристического уравнения совпадают с корнями уравнения
сЫ, [^(т.Е^п, £, Д)№р"*(т, £) - Л • /р] = 0.
которое в силу свойств матрицы Уишарта эквивалентно следующему
det [\У;Цт., Ip)Wp{n, /„, Д)1v;HmJ„) - h • /„] = 0.
Таким образом, характеристические корни hi,...,hp зависят только от параметра иецеитралыюсти Д.
Инвариантные тесты, часто используемые в приложениях:
р
1. Статистика Уилкса: Awitk, = П т+/Г;
¿=1 '
р
2. След Лоули-Хотеллиига: „(гу-ясхсШп, = Т, ht\
¡=i
р
3. След Пнллаи-Бартлетта: Ъриш-Вапш = Е гйт!
4. Максимальный корень Роя: Кл™ = max(/?.¡).
В Разделе 2.3 приводится гипотеза о монотонности функции мощности инвариантных критериев, которая была сформулирована в работе И. Ол-кина, М.Д. Перлмана23 следующим образом.
Гипотеза 2.1 (И. Олкин, М.Д. Перлман) Пусть функция ф(11,..., lp) монотонно не убывает по каждому аргументу, где /( = /¡(Д) — i-e по величине собственное значение матрицы Уишарта VVp(ri, I¡„ Д). Тогда мощность теста с критической областью (<t>{h, ■ ■ • ,lp) is const) монотонно не убывает при росте, собственных значений S¡,... ,5Р параметра нецентральности Д.
И. Олкии и М.Д. Перлман показали, что из указанной гипотезы следует монотонность функции мощности для инвариантных критериев общего вида, а именно:
Гипотеза 2.2 Пусть функция ф(Ь 1(..., hv) монотонно не убывает по каждому аргументу, где /t¡ = 1ц(А) — i-e по величине собственное значение .патрицы £>2(Д)07"Тогда мощность теста с критической областью {Ф{Ъ\,..., /гр) ^ const) монотонно не убывает приросте собственных значений Si,...,Sp параметра нецентралъности Д.
В настоящей работе следствие гипотезы 2.2 из гипотезы 2.1 доказано альтернативным способом с помощью свойств стохастических порядов случайных векторов. Имеет место следующее утверждение.
Теорема 2.1 Пусть Si ~ Wp(m, Ip), 52(Д) ~ Wp{n, /,„ Д), р С т, при-чем матрицы Si и 5г(Д) статистически независим,ы. Пусть вектор, составленный из выписанных по убыванию собственных значений матрицы
23I. Olkiii, M.D. Perlman, "Unbiasedness of invariant tests for MANOVA and other multivariate problems". - Ann. Math. Statist.., Vol. 8, pp. 1326-1341, 1980.
Si(A), возрастает в смысле стохастического порядка случайных векторов (обозначение: ^st). Тогда векторы, составленные из выписанных по убыванию собственных значений случайных матриц
Л(Д) = 52(Д)(52(Д) + SO"1, В{Д) = s^s2{à)sf\
также стохастически возрастают.
В Разделе 2.4 исследуются критерии, которые являются монотонными по каждому аргументу функциями, зависящими от элементарных симметрических многочленов от собственных значений матриц \¥р(н, 1р, Д) и Wv(n,Ip,A)Wp{m, /„)-■.
Следующая теорема утверждает, что инвариантные критерии, которые являются монотонными функциями от элементарных симметрических многочленов от собственных значений матрицы Уишарта, имеют монотонную функцию мощности.
Теорема 2.2 Пусть функция. <b(ai,... ,ар) монотонно не убывает по кюкдому аргументу, где Oi = CTi(i1(A),----lp{Д)) — элементарный симметрический м.ногоч.п.ен степени г от собственных значений г,(Д)____,1Р(А)
матрицы Уишарта Wp(n, ¡Р,А). Тогда мощность теста с критической областью (ф(иь..., ар) ^ const) монотонно ne убывает при росте упорядоченных по убыванию собственных значений ,..., 6Р параметра нецентральности Д.
Обобщением теоремы 2.2 является следующее утверждение.
Теорема 2.3 Пусть вектор о-(5ь..., 6Р) составлен из всех главных миноров матрицы, Wp(n, 1Р, Д), где Si,..., 5Р — выписанные по убыванию собственные значения матрицы Д. Тогда случайный вектор a(6i,... ,SP) апохастически возрастает по каждому из своих аргументов.
Далее перейдем к критериям, зависящим от элементарных симметрических многочленов от собственных значений матрицы Wp(n, ]р. A)Wp(m, 1р)~г.
Введем понятие монотонно возрастающего выпуклого порядка.
Определение. Случайный вектор х не превосходит случайного век-тощ у в смысле монотонно возрастают,его выпуклого порядка (обозначение: х у). если для любой выпуклой монотонно возрастаюи^ей функции ф : R" —> R, для которой определены математические ожидания Еф{х) и ЕФ(у):
Еф(х) «: Еф(у).
Следующая лемма, которая может быть доказана с использованием теоремы Т.В. Андерсона24, утверждает, что вектор, координаты которого имеют нецентральное хи-квадрат распределение, возрастает в смысле порядка при согласованном росте параметров пецентральпости координат этого случайного вектора.
"T.W. Anderson. "The integral of a symmetric unimodal function over a symmetric convex set and some probability inequalities". — Pruc. Amer. Math. Soc., Vol 6. pp 170-17G, 1955.
Лемма 2.11 Пусть 04(7) = ..., xip<)', i = 1,11 нормальный случайный pi-вектор с математическим ожиданием 0^(7) = 7 ■ (я^,... .а,Р1)', 7 € R и матрицей ковариаций Sj. Пусть совместное распределение случайных секторов £1(7),... ,ж«(7) является гауссовским. Введем случайный вектор 1.1(7) = (||:i'i(7)l|2 . • • • 1 ЦД--„(-у)Ц2), где ||-|| обозначает стандартную евклидову норму. Тогда
1. для любой выпуклой монотонно неубывающей функции </>: RJ —> R
<?>("Ы) Ф(и(7г)). если Ы ^ |72|;
2. u(7i) 11(72), если |7i| < |-у2|-
Для двух фиксированных /¿-векторов а = (а:,...,ар) и Ь = (6Ь ... ,ЬР) будем писать а если а; ^ bj, i = I.jj, и о -< b, если а Ь, и существует j, 1 ^ j < Р. что aj < bj.
Теперь рассмотрим случайный вектор сг(Д) = ((7i(А),... , <гР(Д)), который составлен из элементарных симметрических многочленов от собственных значений матрицы где
&(Д) ~ %(«, 1Р, Д), ~ Wp{rn, I,,). р < тп,
и матрицы 6'2(Д) и Si статистически независимы. Следующую теорема описывает стохастические свойства вектора с(Д).
Теорема 2.4 Пусть Д] и Д2 две неотрицательно определенные {ухр)-матрицы с упорядоченными по убыванию собслпвенными значениями Si = (<5ц,..., (5|р), ¿2 = (S21, •. •, $2Р) соответственно. Тогда если 5\ =<! 5 ц то
1. д.ая любой выпуклой монотонно неубывающей функции ф : К" —> R
0(сг(ДО) c,t Ф(сг(Д2));
2. сг(Д2).
Важным следствием данной теоремы является следующее утверждение о монотонности функции мощности широкого класса инвариантных критериев.
Теорема 2.5 Пусть выпуклая функция ф(а\_,... ,av) монотонно не убывает по каждому аргументу, где <т,- — элементарный симметрический многочлен степени г от собственных значений матрицы Si[A)Sii. Тогда мощность теста с критической областью {ф[а\,..., сг,,) > const) монотонно не убывает при росте упорядоченных по убыванию собственных значений <5i,... ,SP параметра нецентральности Д.
Следствие 2.4 Следующие тесты имеют монотонные функции мощности.
1>
1. Мощность статистики Уилкса Awuks — П T+iv с кРити,1еско^
t=i *
ластью (АууйЬи К const) монотонно не убывает при росте собственных значений параметра нецентралъностг1 Д.
2. Мощность статистики Лоули-ХотеллингаТк1аш1еу-но1е.Шпд = £ ¡4
¡=1
с критической областью (Тги^еу-имеИтц ^ стЫ) монотонно не убывает при росте собственных значений пара.иетра неи,ентраль-ности Д.
В Разделе 2.5 доказывается свойство монотонности функции мощности инвариантных критериев вида
/¡1 + ■ •. + /(¡ь, к = 17р.
_ 1 _ 1
Отметим, что собственные значения матриц и 5! '^(Д)^ 5 сов-
падают, поскольку данные матрицы являются подобными. Усеченная сумма /? 1 + ... + /ц., к = 1 ,р является решением следующей экстремальной задачи (см. Ф. Р. Гантмахер25):
/г1 + ... + Л*= аир ^'^^(Д^Л),
где А = (аь ..., а*) € к < р. Рассмотрим вектор Л(Д), состоящий га усеченных сумм:
Л(Д) = (Л1(А),/г1(А) + А2(Д),..., ЛХ{Д) + ... + Лр(Д)).
Следующую теорема описывает стохастические свойства вектора 1>(А).
Теорема 2.6 Пусть Д[ и Д2 две неотрицательно определенные (рхр)-матрицы с упорядоченными по убыванию собственными значениями ¿1 = (¿и,.... (52 = (¿21,..., 52Р) соответственно. Тогда если 61 ^ ¿2> то
1. для любой выпуклой монотонно неубывающей функции ф : Ш" —> В
0(Л(Д1)) 0(/((Д2));
2. /((А 1) /((Да).
Теорема 2.6 показывает, что функция мощности тестов, которые являются усеченными суммами собственных значений указанных матриц, монотонна. В частности имеет место важное следствие.
Следствие 2.5 Функция мощности тестовой статистики С.Н. Роя К/?«,/ = тах(!ц) монотонно не убывает при росте собственных значений параметра, нецентральности Д.
Итоговым результатом Главы 2 является следующая теорема. Теорема 2.7 Пусть 52(Д) и — нг.завиашыс случайные матрицы,
где
52(Д) - \Ур{п, /,„ Д), 51! ~ Ир(т, 1Р). р < т.
25Ф.Р. Гантмахер. Теория матриц. ~ М.: Фгатпшт, ЯКИ.
Пусть hi(d).....hp(d) — собственные значения матрицы S2(A)Sr', выписанные по убыванию, где d = (d\,... ,dp) — упорядоченные по убыванию собственные значения параметра нецентра,яьпости Д. Пуапь также для In = /¡¿(d), i = 1 ,р
i
(Ti(d) = п.....hp), .S;(r/) = £ ''л * = iTp,
j=i
соответственно элементарные симметрические многочлены и усеченные суммы от собственных значений hi,..., hp. Тогда мощность теста с критической областью {ф{о\,..., ар, .. ■, sp) > const) монотонно не убывает при росте упорядоченных по убыванию собственных значений dt____,dp параметра нецентральности Д.
Третья глава диссертации посвящена проверке конических гипотез, определение которых для случая многомерных паблгодепий будет дано ниже.
В Разделах 3.1-3.3 вводятся понятия матричного и обобщенного матричного конусов, а также исследуются их основные свойства,.
В Разделах 3.4 3.5 с использованием введенных понятий строится теория проверки конических гипотез в многомерном гауссовском анализе.
Рассмотрим набор наблюдений, состоящий из п независимых гауссов-ских случайных р-мерпых векторов .tj, ..., х„, где Xi ~ ЛГр(»),, Е), 7 = 1, п. Составим случайную (рхп)-матрицу X = {х\, х?,..., хп). Для прикладных задач интерес, представляют гипотезы вида
т 1 Ч...-< тп (4)
против общей альтернативы, состоящей в том, что хотя бы одно из неравенств в цепочке (4) пе выполнено. При этом частичный порядок "Ч" определяется некоторым выпуклым конусом U С Мр:
(v2 - I'l) е U Di -< 1'2-
Наряд}' с линейными гипотезами интерес представляют методы проверки, так называемых, многомерных конических гипотез вида
Но ■■ ЕХ = М 6 К.
против альтернативы
Hi : М i К,
где К, — матричный конус в RJ. Как будет показано, гипотезы вида (4) относятся к коническим при некоторых дополнительных ограничениях.
Определение. Пусть К — выпук.тй конус в линейном, пространстве RJ;. Определим соответствующий выпуклый конус К в RJ следующим-образом:
1С = {Х\Х = fp)', h € К. <=Щ.
Множество 1С будем называть матричным конусом, порожденный выпуклым конусом К С К,1,.
Лемма 3.1 Множество К в является матричным конусом тогда и только тогда, когда К. удовлетворяет свойствам
1. (Л-! + Х2) € К, для любых Хх.Х2 е /С.
2. АХ 6 К для любой (р х р)-матрицы А с неотрицательными эле-ментпами и любого X £ К..
Таким образом, матричный конус К С может быть определен как левый алгебраический полумодуль над полукольцом М^ квадратных (р х р)-матриц с неотрицательными элементами.
Следующая лемма описывает еще один способ представления матричного конуса!
Лемма 3.5 Пусть множество К. С состоит из (р х п)-матриц
X = (ж,.....х,п), х, 6 К", что хг б Г/0, - я*) € Г/, г = 1,п - 1, где
С/о, и — выпуклые конус.ы в ¡К'\ инвариантные относительно перестановки координат и умножения координат на неотрицательные числа. Тогда К. — матричный конус в
Из леммы 3.5 следует, что матричный конус К., состоящий из (р х п)-матриц X = (л,-!,... ,х„), может быть задай с помощью системы неравенств:
XI -< ... X .г„, (5)
где XI € и0, (.14+1 — .г;) 6 и, I = 1,п - 1, и выпуклые конусы С/о, Г/ инвариантны относительно перестановки координат и умножения координат па неотрицательные числа.
Множество конусов в которые инвариантны относительно перестановки координат и умножения координат па неотрицательные числа описывается следующим образом.
Лемма 3.6 Пусть выпуклый конус С/ в Мр инвариантен относительно перестановки координат и умножения координат на неотрицательные числа. Тогда этот, конус является одним из следующих:
1. пространство Ш;
2. положите.аышй ортант;
3. отрицательный ортант;
4- точка {0}.
В связи с тем, что множество матричных конусов, которые могут быть заданы неравенством (5), ограничено леммой 3.6, возникает необходимость расширить определение матричного конуса. Это возможно в случае перехода от полукольца к полукольцам, содержащимся в нем.
Введем следующие обозначения:
1. Ор — полукольцо диагональных (р х р)-матриц с неотрицательными элементами.
2. Ер полукольцо скалярных (р х р)-матриц вида А/,„ А > 0. где 1Р тождественный оператор.
Отметим, что имеет место вложение полуколец: ЕРС ВРС
В Разделе 3.2 соответствующие обобщенные матричные конусы определяются следующим образом.
Определение. Обобщенным матричным конусом Кд С Е?, называется левый алгебраический полумодулъ над полукольцом О,,.
Определение. Обобщенным матричньш конусом Кц С называется левый алгебраический полумодуль над полукольцом Ер.
В силу вышесказанного для определенного обобщенного матричного конуса Ко выполнено следующее свойство.
Лемма 3.7 Кв обобщенный матричный конус над пшцреальцам О,, тогда и только тогда, когда существует набор выпуклых конусов С1,..., Ср С К), таких, что
Ко = X = (¡я.....др)',д( 6 а,г = Щ .
Будем говорить, что конусы (7Ь ..., Ср порождают обобщенный матричный конус Ко-
Для обобщенных матричных конусов также выполнена лемма 3.5, однако ее условия можно ослабить следующим образом.
Лемма 3.10 Пусть множество Ко С Щ; состоит из (р х п)-матриц X = (х1....,х„), Х{ 6 что хт. 6 и0, (ач+1 - х{) £ С/, г = 1,п- 1, где ¡70, и — выпуклые конусы в М.р, инвариантные относительно умножения координат на неотрицательные числа. Тогда Ко является обобщенным матричным конусом над полукольцом О,, в
Лемма 3.11 Пусть множество КЕ С состоит из (р х п)-матриц X = (*,,..., х„), что х^ б и0, € и, ?' = 1, п - 1, где1Г0,и
— выпуклые конусы в IV. Тогда КЕ является обобщенным матричным конусом над полукольцом Ер в
Из лемм 3.10 и 3.11 следует, что обобщенный матричный конус, состоящий из (у х «)-матриц X = (;г-ь ... ,хп), может быть задан с помощью системы неравенств:
.гч -< ... -< хп,
где X! € (/о, - € и, г = 1 ,п - 1.
В случае обобщенного матричного конуса Ко над полукольцом Вр выпуклые конусы С/о, и инвариантны относительно умножения координат на неотрицательные числа.
В случае обобщенного матричного конуса Кц над полукольцом Ер выпуклые конусы и0, и произвольны.
Дадим определение двойственного матричного конуса.
Определение. Пусть К — матричный конус в порожденный замкнутым выпуклым конусом К в R,1,. Тогда двойственным■ конусом к конусу К называется:
/с= {х\ х = (.,1.....9р)\т 6 K\i = Щ.
Аналогичным образом можно определить конус в R£, который является двойственным к обобщенному матричному конусу над полукольцом Dp.
Определение. Пусть KD — обобщенный замкнутый матричный конус над полукольцом Dp, заданный в виде:
KD = {Х\Х = (5ь ... .,gpy,gt 6 Citi = Щ ,
где Ci....,Cp — набор выпуклых замкнутых конусов в R'. Тогда двойственным конусом к конусу Ко называется:
fCh = X = (ff,.....gpy,gt € CtЛ = Щ .
Далее будем работать с обобщенными замкнутыми матричными конусами Ко, заданными в виде
KD = {А| X = (ш, ■.. ,</„)',й е Ci,i = Щ , (6)
где С\,...,СР — набор замкнутых выпуклых конусов в R^.
В Разделе 3.3 вводится понятие проекции па обобщенный замкнутый матричный конус в
Определение. Пусть KD — обобщенный замкнутый матричный конус в над полукольцом Dv, заданный в (6). Тогда для X = (/].....fp)' е
Л £ Ri. i ~ 1,р проекцией на KD называется
proj(A') = (proj(/i).....proj (/„))'.
K-D Ol c,r
В Разделе 3.4 на базе введенных понятий исследуются методы проверки конических гипотез для набора зависимых наблюдений, совместное распределение которых имеет ковариационную структуру, заданную в виде произведения Кроиекера двух положительно определенных матриц.
Рассмотрим набор наблюдений, состоящий из п гауссовскнх случайных ■р- мерных векторов хи...,хп, где х{ = + тщ) ~ к,,(т>, qH • £)", Е >- О, i — 1,п. Составим случайную (рхга)-матрицу X = 3+М = (xiyx2, ■ ■., хп), где М — ЕХ = (ш|,ms,• ■ •,ni„). Будем предполагать, что
А ~ ЛГр,п(Л/,Е,Q).
В случае, если положительно определенная матрица Q совпадает с А/„, А > 0, гауссовские векторы xit i = TTп являются независимыми.
Нашей целью является построение статистики для проверки гипотезы
П0 : М € KD (7)
против альтернативы
Я, : А/ £ Кв,
где Кв — обобщенный замкнутый матричный конус над полукольцом Рр.
Определение. Будем называть обобщенный матричный конус Ки над полукольцом Вр многогранным, сели порождающие его выпуклые конусы С(, г — 1, р, из (6) являются многогранными.
Распределение критической статистики опишем в случае, когда рассматриваемый обобщенный замкнутый матричный конус является многогранным.
Пусть матрицы, определяющие ковариационную структуру Л", заданы с точностью до неизвестных множителей q2 и а2, т.е. равны а1 С} и ст2Е соответственно. Пусть для q'2 дала не зависящая от X оценка д2, н для <т2 дана пе зависящая от X и (]2 оценка а1, причем
Ы2
' <7 X
Из результатов Главы 1 следует, что распределение случайной матрицы X можно преобразовать следующим образом:
Е-и-СГ* ~Я-<т- N,,,„(£-1МСГК1,,.!„)■
Класс обобщенных замкнутых матричных конусов над полукольцом Пр инвариантен относительно умножения па (р х />)-матрицу слева. Учитывая это замечание, в качестве критической статистики рассмотрим
п(Х) = <5
— Л"2 .
рго] (Е-5Х) (гНс,,)1
рпц (2-^)
(Ц-^в)1
где проецирование относится к скалярному произведению, определяемому матрицей С}'1. Используя результаты, изложенные в работе Ю. Н. Тюрина26, в Разделе 3.5 получена следующая основная теорема о распределении критической статистики.
Теорема 3.1 Пусть X = Е + М = (,гь..., &■„) — (р х п)-лштрица наблюдений, составленная из случайных р-векторов такая, что
Х-~7-<7-ЛГР,П(М,Е.<Э),
где пололсительно определенные матрицы Е считаются известными, а параметры q, и, М — неизвестны, причем для параметров q, а даны оценки
ка2 ~ о\2(к). \ц2 ~ Л<2(/),
где а2 не зависит от и от X, а д2 не зависит от <т2 и о?п X. Тогда статистика 1г(Н(Л')) удовлетворяет следующим свойствам:
2<3Ю.Н. Тюрин. "Проверка конических гипотез". — Математика. Механика. Информатики : тр. кпиф., иосаящ. 10-лглпит РФФИ. • М. : Фшлт.т,.шт., с. 289-307, 2005.
1. При гипотезе (7) для г > О
РМЩХ))>г]КР[Ь{ЩЕ))>Т].
2. Если обобщенный замкнутый матричный конус Ко над полукольцом Вр является многогранным, то для т ^ О
где х2(») = О при г = О. Благодарности
Автор выражает искреннюю признательность доктору физико-математических паук, профессору Юрию Николаевичу Тюрину, под руководством которого проходила работа над диссертацией, за постановку задач, многолетнюю поддержку и постоянное внимание к работе.
Список публикаций автора по теме диссертации
[1] Кашицып П. А. Многомерная модель с коррелированными наблюдениями. Теория, вероятностей и ее применения, т. 56, в. 3, с. 602-606,
[2] Кашицып П. А. О функции мощности статистических критериев, зависящих от элементарных симметрических многочленов. Вестник Московского Университета. Серия 1, Математика. Механика, в. 3, с. 55-58, 2012.
[3] Кашицып П. А. Матричные конусы и проверка конических гипотез в многомерном гауссовском анализе. Деп. в ВИНИТИ, 21.03.2013, №83-В2013, 14 с.
[4] Kashitsyn P. A. Multivariate model with a Kronecker product covariance structure: S.N.Roy method of estimation. Mathematical Methods of Statistics, Vol. 20, No. 1, pp. 75-78, 2011.
[5] Кашицып П. А. Стохастические свойства ортогональных инвариантов матрицы Уишарта. Тезисы Международной конференции <г Теория вероятностей и ее приложения», посвященной 100-летию со дня рождения Б.В.Гнеденко, с. 372, 2012.
[6] Kashitsyn P. A. Multivariate model with a Kronecker product covariance structure: general linear model. Abstracts of the 9th Tartu conference on Multivariate statistics, pp. 35, 2011.
2011.
Отпечатано в отделе оперативной печати Геологического ф-та МГУ Тираж !0£) экз. Заказ № 4 /
Московский Государственный Университет
имени М.В. Ломоносова Механико-математический факультет
04201361963 и
■ ^ На правах рукописи
УДК 519.237.3
Кашицын Павел Александрович
НЕКОТОРЫЕ СТАТИСТИЧЕСКИЕ КРИТЕРИИ И ИХ СВОЙСТВА В МОДЕЛЯХ МНОГОМЕРНОГО ГАУССОВСКОГО АНАЛИЗА
Специальность: 01.01.05 - Теория вероятностей и математическая статистика
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель, доктор физико-математических наук, профессор Ю. Н. Тюрин
Москва - 2013
Содержание
Введение 3
Благодарности.............................21
1 Многомерная гауссовская модель с зависимыми наблюдениями 22
1.1 Вспомогательные средства матричной алгебры........22
1.2 Матричные алгебраические модули...............24
1.3 Распределение Уишарха......................29
1.4 Модель зависимых наблюдений с ковариационной структурой. заданной в виде произведения Кронекера двух положительно определенных матриц...................,30
1.5 Оценивание параметров М, Е и Я>р: частный случай.....32
1.6 Оценивание параметров М, Е и Ф : общий случай.......34
1.7 Линейная гауссовская модель с зависимыми наблюдениями . 35
1.8 Проверка линейных гипотез в модели с зависимыми наблюдениями ...............................41
1.9 Однофакторный дисперсионный анализ ............43
2 Функции мощности инвариантных критериев в многомерном гауссовском анализе 46
2.1 Инвариантные критерии при проверке линейных гипотез . . 46
2.2 Инвариантные критерии при проверке гипотез о зависимости многомерных признаков...................48
2.3 Гипотеза Олкина-Перлмана и стохастический порядок случайных векторов..........................49
2.4 Монотонность функции мощности инвариантных критериев, являющихся функциями от элементарных симметрических многочленов ............................59
2.5 Монотонность функции мощности инвариантных критериев, являющихся усеченными суммами собственных значений . . 71
3 Конические гипотезы в многомерном гауссовском анализе 75
3.1 Матричный конус и его свойства ................75
3.2 Обобщенный матричный конус и его свойства.........79
3.3 Проекции на матричные конусы.................82
3.4 Конические гипотезы.......................85
3.5 Критическая статистика в случае матриц <3, Е, заданных с точностью до неизвестных множителей.............86
Основные обозначения 92
Список литературы 93
Введение
Общая характеристика работы
Актуальность темы 1
Многомерный статистический анализ — это раздел математической статистики, который изз'чает многомерные наблюдения. В гауссовком анализе также делается предположение о том, что распределение многомерных наблюдений, или векторов, является нормальным.
Проблемы, связанные с проверкой гипотез в многомерном гауссовском анализе, исследуются учеными с момента оформления этой науки в самостоятельную область в первой половине 20-го века. Основополагающие результаты в этой области были получены P.A. Фишерем. С.С. Уилксом, С.Н. Роем, М.С. Бартлеттом. Г. Хотеллингом.
Результаты исследований того времени были подведены к 60-м годам 20-го века в монографиях С.Н. Роя. 1957 и Т.В. Андерсона, 1963. В монографии Т.В. Андерсона линейные модели были изложены в форме регрессионного анализа без общего понятия линейных моделей и линейных гипотез. Общее понятие линейной модели и линейной гипотезы было недавно предложено Ю.Н Тюриным, 2010.
Проблемы, связанные с проверкой гипотез в многомерном гауссовском анализе, включают в себя следующие задачи:
• Проверка многомерных гипотез о наличии линейных связей между математическими ожиданиями наблюдений (линейные гипотезы);
• Проверка многомерных гипотез о наличии связей типа неравенств между математическими ожиданиями наблюдений (конические гипотезы);
• Проверка гипотез о независимости мноюмерных признаков (гипотезы о структуре ковариационной матрицы).
В ходе многолетних исследований были выработаны основные требования. предъявляемые к критериям, которые могут быть использованы при проверке гипотез в многомерном гауссовском анализе:
• Инвариантность критерия по отношению к аффинным преобразованиям наблюдений, у которых сдвиги не меняют гипотетическое множество:
• Свобода критерия от неизвестных параметров модели при гипотезе.
Следствием условия инвариантности оказывается то, что статистические критерии должны быть функциями от собственных значений произведений матриц, распределенных по Уишарту. Свобода распределения от
параметров модели при гипотезе для таких критериев достигается автоматически. Изучению свойств распределения Уитпарта посвящены работы Дж. Уишарта, G.G. Уилкса, А.Т. Джеймса и других.
В последние годы привлекают к себе внимание многомерные задачи, наблюдения в которых не являются независимыми, но имеют заданную ковариационную структуру. М.С. Сриваетава, Д. фон Розен и Т. Нахтман, '2008 решили задачу оценивания параметров модели, в которой совместная ковариационная структура наблюдений задастся в виде произведения Кронекера двух положительно определенных матриц. В 1-й главе настоящей диссертации для описанной структуры зависимых наблюдений была разработана теория линейных моделей. Эта теория, естественно, включает оценивание неизвестных параметров.
Во 2-й главе исследуется свойство монотонности функции мощности инвариантных критериев, возникающих при проверке гипотез в моделях многомерного гауссовского анализа как для независимых наблюдений, так и для зависимых наблюдений с заданной ковариацинной структурой. В 1980 г. И. Олкин и М.Д. Псрлман сформулировали гипотезу о монотонности функции мощности инвариантных критериев, верность которой в общем виде до сих пор не доказана и не опровергнута. В настоящей диссертации доказана монотонность функции мощности для широкого класса инвариантных критериев. Этот класс включает в себя все основные известные критерии, которые используются в прикладных задачах. Полученные результаты обобщают соответствующие результаты С.Н. Роя, 1961. Т.В. Андерсона. 1964, И. Олкипа и М.Д. Перлмапа. 1980. П. Гроенб}ма и Д.Р. Труа, 2000.
В последние десятилетия интенсивно развивается теория проверки гипотез о положении с ограничениями типа неравенств. Вначале данные гипотезы рассматривались как альтернативные к пулевым гипотезам в линейных моделях. Однако в приложениях часто возникают самостоятельные задачи, когда требуется проверить гипотезу о принадлежности параметра некоторому заданному выпуклому конусу. Теория конических гипотез в одномерном случае разрабатывалась такими учеными как Т. Ро-бертсон, Ф.Т. Райт и Р.Л. Дэйкстра. Однако единого подхода к проверке многомерных конических гипотез в гауссовском случае до сих пор разработано не было. В 3-й главе настоящей диссертации вводится понятие многомерного матричного конуса, и с его помощью решается задача о проверке многомерных конических гипотез в той общности, которая достаточна для решения прикладных задач.
Таким образом, тема диссертации представляется актуальной с теоретической точки зрения, и имеет практическую значимость.
Цель работы
Целью данной диссертации является исследование новых свойств статистических критериев, возникающих при проверке линейных и конических
гипотез для моделей многомерного гауссовского анализа с зависимыми наблюдениями, которые имеют заданную ковариационную структуру.
Научная новизна
Основные результаты диссертации являются новыми и состоят в следующем:
1. В модели многомерных зависимых наблюдений с ковариационной структурой, заданной в виде произведения Кронекера двух положительно определенных матриц, предложен альтернативный метод получения состоятельных и несмещенных оценок с помощью техники, разработанной С.Н. Роем. Для указанной модели зависимых наблюдений разработаны методы проверки линейных гипотез. Доказана теорема об ортогональном разложении случайной матрицы с зависимыми столбцами. Предложенный подход проиллюстрирован на примере задачи многомерного дисперсионного анализа.
2. Доказана монотонность функции мощности для широкого класса инвариантных критериев многомерного гауссовского статистического анализа. При исследовании функции мощности инвариантных критериев получен ряд новых результатов, касающихся стохастических свойств нецентрального распределения Уишарта.
3. Введено понятие матричного конуса и исследованы его основные свойства. На базе введенного понятия ставится задача о проверке многомерных конических гипотез, обобщающая соответствующие одномерные аналоги. Распределение критической статистики исследовано при гипотезе.
Методы исследования
В работе применяются общие методы теории вероятностей и математической статистики, функционального анализа, а также элементы матричной и линейной алгебры. Широко используется теория стохастических порядков случайных векторов.
Теоретическая и практическая значимость
Работа носит теоретический характер. Одновременно она направлена на приложения математической статистики. Предложенные в диссертации критерии могут быть полезны для решения практических задач, в которых распределение многомерных наблюдений с хорошей точностью можно считать нормальным.
Апробация работы и публикации
Основные результаты работы докладывались па следующих семинарах и конференциях:
• Большой семинар кафедры теории вероятностей МГУ под руководством академика РАН, проф. А.Н. Ширяева в 2013 г.
• Семинар «Непараметрическая статистика и временные ряды» под руководством проф. В.Н. Тутубалина, проф. Ю.Н. Тюрина и доц. М.В. Болдина в МГУ — неоднократно делал доклады в 2008-2013 гг.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2013 г.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2012 г.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2011 г.
• Международная научная конференция студентов, аспирантов и молодых ученых «Ломоносов» в МГУ в 2010 г.
• Международная конференция «Теория вероятностей и ее приложения» в МГУ, посвященная столетию со дня рождения Б.В. Гнеденко в 2012 г.
• Международная конференция по многомерной статистике в Тарту. Эстония в 2011 г. (the 9th Tai tu conference on Multivariate statistics).
Результаты диссертации опубликованы в 6 работах автора, из которых 2 входят в перечень ВАК. Работ, написанных в соавторстве, нет:
1. Кашицын П. А. (2011). Многомерная модель с коррелированными наблюдениями. Теория вероятностей и ее применения, т. 56. в. 3. с 602-606.
2. Кашицын П. А. (2012). О функции мощности статистических критериев, зависящих от элементарных симметрических многочленов. Вестник Московского Университета. Серия 1, Математика. Механика. в. 3; с. 55-58.
3. Кашицын П. А. (2013). Матричные конусы и проверка конических гипотез в многомерном гауссовском анализе. Деп. в ВИНИТИ, 21.03.2013. №83-В2013. 14 с.
4. Kashitsyn P.A. (2011). Multivariate model with a Kronecker product covariance structure: S.N.Roy method of estimation. Mathematical Methods of Statistics. Vol. 20, No. 1, p. 75-78.
5. Кашицын П. А. (2012). Стохастические свойства ортогональных инвариантов матрицы Уитиарта. Тезисы. Международной конференции «Теория вероятностей и ее приложения>>. посвященной 100-летию со дня рождения Б.В.Гнеденко, с. 372.
6. Kashitsyn P.A. (2011). Multivariate model with a Kronerker product covariance structure: general linear model. Abstracts of the 9th Tartu conference on Multivariate statistics, p. 35.
Структура диссертации
Диссертация состоит из введения, трех глав, списка обозначений и списка литературы, насчитывающего 75 наименований и организованного в алфавитном порядка. Вначале приведен список используемой литературы на русском языке, затем — зарубежные источники. Результаты, полученные автором диссертации, оформлены в виде Теорем и Лемм; необходимые известные факты сформулированы в виде Утверждений с указанием источника цитирования. Нумерация утверждений, лемм, теорем и формул начинается в каждой главе заново и состоит из двух чисел: первое число относится к номеру главы, второе — к номеру соответствующего утверждения (леммы, теоремы или формулы). Ссылки на работы других авторов сделаны по принципу «автор-дата». Общий объем работы составляет 97 страниц.
Краткое содержание диссертации
Диссертация посвящена статистическим критериям и их свойствам, которые возникают в многомерном гауссовском анализе, в частности в следующих трех случаях:
• Проверка линейных гипотез:
• Проверка гипотез о независимости многомерных признаков;
• Проверка конических гипотез.
Первая глава диссертации состоит из девяти разделов. В ней вводится вспомогательный аппарат матричных алгебраических модулей, а также исследуются методы проверки многомерных линейных гипотез для зависимых наблюдений.
В Разделах 1.1-1.3 изложены необходимые сведения из многомерного статистического анализа, которые используются в дальнейших разделах работы.
В Разделах 1.4-1.9 построена теория линейных моделей для набора зависимых наблюдений, совместное распределение которых имеет ковариационную структуру, заданную в виде произведения Кропекера двух положительно определенных матриц.
Рассмотрим левый алгебраический модуль элементами которого являются (р х п)-матритсы над кольцом (р х р)-матриц из К^ с естественными операциями матричного сложения и умножения на (р х р)-матрицу слева.
Определение. Подмодулем С называет,ся подмножество замкнутое относительно операций суммы и умножения на (рхр)-матрицу слева:
1. (X + У) € С для любых X, У е С.
2. КХ е С для любых X е С, к еЩ,.
Определение. Матричным скалярным произведением двух (р х п)-матриц X. У € будем называть {р х р) -матрицу
{Х,У)Я = ХЯУ\
где — положительно определенная (ихп)-матрица (обозначение: (5 >- О или <2 е ¥„). Будем говорить, что матрица <3 определяет введенное матричное скалярное произведение.
Определение. Ортогональным дополнением к подмодулю С С назовем подмодуль
= {у| у е КР. (У, Х)я = 0 для любого X Е С].
Определение. Проекцией X € на подмодуль С С назовем (р х п)-матрицу Z = рго]£(Х), если
1. г £ С;
2. х - гес-.
Ю.Н Тюриным было показано, что для любого подмодуля С С существует линейное подпространство Ь с М" такое, что (с/1, — др)' е С. дг € Мп,г = тогда и только тогда, когда дг 6 Ь,г = 1 .р. Линейное подпространство Ь будем называть порождающим для матричного подмодуля С.
Размеруюстью матричного подмодуля С С К^ (обозначение: сНт С) будем далее называть размерность порождающего его линейного подпространства Ь С
В Разделе 1.3 приводится ряд свойств нецентрального распределения Уишарта, которые используются в дальнейшем в настоящей работе.
Определение. Случайная (р х р)-матрица VI'р(п, Е. А) имеет нецентральное распределение Уишарта с п степенями свободы, ковариационной матрицей Е и параметром нецентральности А, если данная матрица может быть представлена в виде:
п
\¥р(п, Е. А) = ]Г0ег + гиг)(£г + Шг)\
г—1
где случайные вект,оры ¿а,---,^ суть независимые одинаково распределенные (н.о.р.) Лгр(0, Е), и параметр нецентральности
А = ТГЪММ'ТГЪ,
где М = (ть..., тп). В случае, если Д = 0, распределение Уишарта называется центральным и обозначает,ся ТУр(п, Е).
В Разделе 1.4 рассматривается набор зависимых наблюдений Х\...., хд, ковариационная структура совместного распределения которых определяется произведением Кронексра двух положительно определенных матриц:
Соч(х,,х3) = Ф = (фг]) >- О, Е >- 0.
Точнее, рассмотрим (рх д)-матрицу X = (ж1;..., хя). состоящую из наблюдений Ж],----хч, где рс/-вектор иес(Х) = {х\,..., по предположению
является нормально распределенным со средним ь-ес(М) = (т[,... ,т' )' и положительно определенной ковариационной матрицей Л. Предположим, что (рд х рг/)-матрица Л может быть задана в виде произведения Кро-иекера двух положительно определенных матриц, т.е. Л = Ф 0 Е, где {([ х (у)-матрица Ф = {'фг1) и (р х р)-матрица Е = {игз). и матрицы Ф,Е по предположению являются положительно определенными. Таким образом. случайная матрица X имеет многомерное нормальное распределение
X ~ Щ(М,А), Л = Ф'ЭЕ.
В монографии М.С. Сриваставы и С.Г. Хатри, 1979 используется эквивалентное обозначение
X ~ (М, Е, Ф).
которым мы будем пользоваться в дальнейшем.
Лемма 1.3 Пусть У ~ НРЧ(М, А,В), где А. В — неотрицательно определенные матрицы (обозначение: А ^ 0, В 0 или А 6 р§р. В € Тогда У ~ НЧФ{М\ В, А). Далее в Разделе 1.5 с использованием указанной леммы 1.3 при предположении об одинаковой распределенности наблюдений методом С.Н. Роя получены состоятельные и несмещенные оценки параметров модели.
Теорема 1.1 Пусть Х\.... сут.ь независимые одинаково распределенные А!р11(М, Е. Фр), где Фр = ('(¿V,). 'Фп = 1, г = 1,9- Тогда,
является несмещенной и состоятельной оценкой, Е при N оо.
Теорема 1.2 Пусть Х\,..., Хм суть независимые одинаково распределенные А'р_д(М, Е, Фр), где Фр = (г^), 'фы = 1- г = 1, д. Тогда
N
-х{к))(х1] - х{1))'
J=l
является состоят,ельной оценкой и>ы, к ф 1, к. I — 1, <7 при N —>• оо.
В Разделе 1.6 рассматривается общий случай без предположения об одинаковой распределенности многомерных наблюдений.
С использованием леммы 1.3 показано, что если некоторая случайная обратимая матрица Е является состоятельной оценкой параметр