Асимптотический анализ вырожденных U-статистик второго порядка: оценки точности аппроксимации и функций концентрации тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Зубайраев, Тимур Асламбекович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2012 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Диссертация по математике на тему «Асимптотический анализ вырожденных U-статистик второго порядка: оценки точности аппроксимации и функций концентрации»
 
Автореферат диссертации на тему "Асимптотический анализ вырожденных U-статистик второго порядка: оценки точности аппроксимации и функций концентрации"

Московский государственный университет имени М. В. Ломоносова

На правах рукописи

АСИМПТОТИЧЕСКИЙ АНАЛИЗ ВЫРОЖДЕННЫХ и-СТАТИСТИК ВТОРОГО ПОРЯДКА: ОЦЕНКИ .ТОЧНОСТИ АППРОКСИМАЦИИ И ФУНКЦИЙ КОНЦЕНТРАЦИИ

Специальность 01.01.05 — теория вероятностей и математическая статистика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

1 о:

Москва - 2012

005043173

Работа выполнена на кафедре математической статистики факультета вычислительной математики и кибернетики Московского государственного университета имени М.В. Ломоносова.

Научный руководитель: доктор физико-математических

наук, профессор В.В. Ульянов

Официальные оппоненты: доктор физико-математических

наук, профессор А.Н. Тихомиров

кандидат физико-математических наук, доцент А.Е. Кондратенко

Ведущая организация: Институт математики

им. С.Л. Соболева Сибирского отделения РАН

Защита диссертации состоится 2^ 2012 г. в ^ часов

на заседании диссертационного совета Д 501.001.44 в Московском государственном университете имени М.В. Ломоносова по адресу: 119991, ГСП-1, Москва, Ленински е_горы, МГУ, 2-й учебный корпус, факультет ВМиК, аудитория ¿сГ.

С диссертацией можно ознакомиться в библиотеке факультета ВМиК МГУ. С текстом автореферата можно ознакомиться на официальном сайте ВМиК МГУ http://cs.msu.ru в разделе "Наука"-"Работа диссертационных советов" - "Д 501.001.44"

Автореферат разослан " "АуМХ 2012

Ученый секретарь диссертационного совета

профессор _ Н.П. Трифонов

Общая характеристика работы

Актуальность :

Одним из центральных объектов в теории вероятностей являются суммы независимых случайных величин. Интерес к задачам, связанным с суммированием независимых случайных величин, появился в математике еще в XVIII веке. Невозможность прямых вычислений распределений сумм независимых случайных величин приводит к необходимости получения и изучения асимптотических формул для них, то есть таких формул, которые позволяют находить с нужной точностью требующиеся нам вероятности, связанные с суммами случайных величин. Эти формулы даются предельными теоремами теории вероятностей. Таким образом, аппроксимация многократных сверток распределений потребовала развития содержательной математической теории, которая называется теорией предельных теорем для сумм независимых случайных величин.

Впервые исследования по U-статистикам были проведены в работах Халмоша 1, фон Мизеса 2 и Хефдинга 3 в конце 40-х годов XX века. U-статистики являются алгебраическим обобщением суммы независимых случайных величин и относится к классу симметрических функций. Интерес к таким случайным объектам возник сначала в математической статистике в задачах оценки функционалов от распределений. U-статистики, как объект вероятностной теории суммирования, с одной стороны "алгебраически" более сложны, чем суммы независимых случайных величии и векторов, с другой - содержат в себе существенные элементы зависимости, проявляющиеся в мартингальных свойствах (см. например монографию Королюк и Боровских 4). Кроме того, U-статистики занимают одно

1 Haimos P. R. The theory of unbiased estimation. Ann. Math. Statist.- 1946-№. 17,- Pp. 34-43.

2 Mises R. von. On asymptotic distribution of differentiable statistical functions.// Ann. Math. Statist.- 1947,- V. 18, № 2.- Pp. 309-348.

3Hoeffding W. A class of statistics with asymptotically normal distribution.// Ann. Math. Statist.- 1948.- №. 19,- Pp. 293-325.

4Королюк В. С., Боровских В. Ю. Теория U-статистик,- Киев: Наукова думка, 1989.

из центральных мест в статистических задачах.

С самого начала теория U-статистик развивалась под влиянием классической теории суммирования независимых случайных величин. Вместе с тем, асимптотическая теория U-статистик имеет специфические черты и качественно отличается от теории сумм независимых случайных величин. Многие асимптотические свойства U-статистик зависят от ранга г ядра, связанного со статистикой, и условий на моменты ядра. Для невырожденного ядра и ранга г = 1 асимптотическое поведение U-статистик сводится к асимптотическому поведению суммы случайных величин. Если г > 2 (ядро вырождено), то предельные распределения U-статистик представляют собой более широкий класс, включающий в себя бесконечно делимые распределения, распределения с функционалами, определенными ядром, конечно и бесконечномерными нормальными векторами. Такие особенности U-статистик создают новые идеи в контексте предельных теорем и требуют развития специальных методов исследования.

Историю развития оценок точности аппроксимации для U-статистик в случае бесконечномерного пространства можно разделить на два этапа. Первый этап связан с получением оценок, оптимальных по N - объему выборки, а второй по зависимости от характеристик оператора, ассоциированного со статистикой.

Настоящая работа посвящена асимптотическому анализу вырожденных U-статистик второго порядка.

Для вырожденных U-статистик второго порядка скорость сходимости к предельному распределению исследовалась в 1973 году Грэмсом и Серфлингом 5, которые получили оценку типа Берри-Эссеена 0(N~1/2+e),e > 0. Оценка улучшена в 1974 году Бикелем 8, а затем в 1977 году Чаном и Виерманом 7, Каллаертом, Янссе-

5 Grams W. F., Serfling R. J. Convergence rates for U-statistics and related statistics. // Ann. Statist.- 1973.- no. 1.- Pp. 153-160.

6Bickel P. Edgeworth expansions in nonparametric statistics. // Ann. Statist.-1974,- no. 2.- Pp. 1-20.

7 Chan Y.-K., Wierman J. On the Berry-Esseen theorem for U-statistics // The Annals of Probability.- 1977,- Vol. 5, no. 1,- Pp. 136-139.

ном в 1978 году 8 и Хелмерсом и ван Цветом 9 в 1982 году, которые получили порядок сходимости 0(N~В 1979 году оценка 0(N~1+e),£ > 0 доказана Гетце 10 с использованием неравенства симметризации Вейля при определенных условиях на моменты и предположении о том, что ненулевых собственных значений некоторого оператора, ассоциированного с U-статистикой, бесконечно много. Данный результат не является оптимальным ни по зависимости от N, ни по зависимости от характеристик оператора. Позже асимптотическими свойствами и получением разложения Эджвор-та для вырожденных U-статистик занимались Гетце 11, Королюк и Боровских. В монографии Королюк, Боровских 4 оценка улучшена до порядка o(iV~1/2). В работе Гетце и Зитикиса 12 получена аппроксимация со слагаемыми 0(N~1) при определенных предположениях о гладкости ядра и распределения элементов выборки. В 1999 году Гетце и Бенткус 13 доказали оценку точности аппроксимации для U-статистик, которая является оптимальной по N и получена при оптимальных моментных условиях. В той же работе построены оценки для функций концентрации U-статистик. Оба результата содержат константу, которая имеет экспоненциальный порядок зависимости от собственных значений некоторого оператора, ассоциированного с U-статистикой. Такая зависимость от собственных значений оператора, ассоциированного с U-статистикой может быть заметно улучшена, что и сделано в настоящей работе.

Исследования U-статистик ведутся и по другим направлениям: для хвостов распределений вырожденных U-статистик произволь-

8Callaert II., Janssen P. The Berry-Esseen theorem for U-statistics // The Annals of Statistics.- 1978.- Vol. 6, no. 2.- Pp. 417-421.

gHelmers R., van Zwet W. The Berry-Esseen bound for U-statistics //Statistical Decision Theory an Related Topics, III(S.S. Gupta and J.O. Berger, eds.).- 1982.-Vol. 1.- Pp. 497-512.

10 Götze F. Asymptotic expansions for bivariate von Mises functionals //Z. Wahrsch. Verw. Gebiete.- 1979,- no. 50,- Pp. 333-355.

11 Götze F. Expansions for von mises functions // Z. Wahrsch. Verw. Gebiete.O 1984,- no. 65.- Pp. 599-625.

12 Götze F., Zitikis R. Edgeworth expansions and bootstrap for degenerate von Mises statistics. // Probab. Math. Statist.- 1995,- no. 15.- Pp. 327-351.

liBentkus V., Götze F. Optimal bounds in non-Gaussian limit theorems for U-statistics // The Annals of Probability.- 1999,- no. 1.- Pp. 454-521.

ного порядка, построенных по выборкам из последовательности стационарно связанных наблюдений Борисовым И. С. и Володько Н.В. 14 получены экспоненциальные неравенства. Помимо этого, Борисов И.С. и Жечев В.А. доказали предельные теоремы для U-статистик от зависимых наблюдений 15, Борисов И.С. и Володько Н.В. доказали предельную теорему для U-процессов от стационарно связанных наблюдений 16. Для статистик Мизеса - частного случая U-статистик, Борисов И.С. и Саханенко JI.A. 17 доказали центральную предельную теорему. Тихомировым А.Н., Гетце и Юрченко 18 получены асимптотические разложения в центральной предельной теореме для квадратичных форм.

Цель работы:

Целью данной диссертации является уточнение оценок точности аппроксимации и уточнение оценок функций концентрации для вырожденных U-статистик второго порядка.

Методика исследования:

Для оценки характеристической функции обобщенной U-статистики использована лемма симметризации, а также техника перехода к дискретным случайным величинам, которая ранее была предложена Юринским 19. Характеристическая функция иссле-

14Борисов И.С., Володько Н.В. Экспоненциальные неравенства для распределений U- и V-статистик от зависимых наблюдений // Матем. тр.- 2008,- Т. 2, № П.- С. 3-19.

15Борисов И. С., Жечев В.А. Функциональная предельная теорема для канонических U-процессов от зависимых наблюдений // Сиб. матем. журн.- 2011.Т. 52, X» 4.- С. 754-764.

16Борисов И.С., Володько Н.В. Ортогональные ряды и предельные теоремы для канонических U- и V-статистик от стационарно связанных наблюдений // Матем. тр.- 2008.- Т. 11, № 1,- С. 25-48.

17Борисов И.С., Саханенко Л.А. Центральная предельная теорема для обобщенных статистик Мизеса с вырожденными ядрами // Матем. тр.- 2001 - Т 4 № 1,- С. 3-17.

18Götze F., Tikhomirov A., Yurehenko V. Asymptotic expansion in the central limit theorem for quadratic forms // Зап. научн. сем. ПОМИ.- 2007,- Vol. 341.-Рр. 81-114.

19 Yurinskii V. On the accuracy of normal approximation of the probability of hitting a ball // Theory Probability Applications.- 1982.- no. 27.- Pp. 280-289.

дуемой статистики оценивается сверху характерестической функцией дискретной случайной величины. Данная техника также использовалась в работе Бенткуса и Гетце 13. Для оценки точности аппроксимации используется усовершенствованный метод характеристических функций. Оценки для разностей характеристических функций и-статистики и предельного распределения получены с использованием неравенств типа Бергстрёма, которые применялись в работах Бенткуса и Гетце.

Научная новизна:

Все основные результаты диссертации являются новыми и состоят в следующем:

1. Для распределения вырожденной и-статистики второго порядка при оптимальных моментных условиях получена оценка точности аппроксимации коротким асимптотическим разложением, которая имеет степенной порядок зависимости от собственных значений оператора, ассоциированного с ядром и-статистики.

2. Для функций концентрации вырожденной и-статистики второго порядка получена оценка, которая имеет степенной порядок зависимости от собственных значений оператора, ассоциированного с ядром и-статистики.

Практическая значимость:

Результаты диссертации имеют теоретический характер и одновременно допускают применение к решению различных практических задач, связанных с использованием оценок точности аппроксимации распределений статистик.

Апробация работы:

Результаты работы неоднократно докладывались и обсуждались на научно-исследовательском семинаре кафедры математической статистики факультета ВМК МГУ (2009, 2010, 2011 гг.), X

Всероссийском симпозиуме по прикладной и промышленной математике (осенняя открытая сессия) (Сочи - Дагомыс, 1-8 октября 2009), XVIII Международной научной конференции студентов, аспирантов и молодых ученых "Ломоносов-2011"(П-15 апреля 2011), заседании кафедры математической статистики факультета ВМК МГУ имени М.В.Ломоносова, г. Москва, 14 сентября 2011 г.

Публикации:

Материалы диссертации опубликованы в 4 печатных работах, из них 2 статьи опубликованы в журналах, включенных в перечень ВАК.

Структура и объем диссертации:

Диссертация состоит из введения, трех глав, разбитых на разделы, и списка литературы из 44 наименований. Общий объем работы составляет 83 страницы.

Краткое содержание диссертации

Введение

Введение содержит обоснование актуальности темы диссертации и исторический обзор, связанный с темой работы. Кроме этого, в нем также формулируются и обсуждаются основные результаты работы. Доказательство этих результатов содержится в главах 1-3, поэтому здесь мы ограничимся основными определениями и обозначениями.

Пусть X, Х,Х1,..., Хн - независимые одинаково распределенные случайные величины, принимающие значения в произвольном измеримом пространстве (X, 25). Пусть из-

меримые функции. Предположим, что <р симметрична, т.е. <р(х, у) = <р(у, х), для любых х, у е X. Рассмотрим и-статистику:

£ + Е МХг), (1.1)

предполагая, что

Шрг{Х) = 0,Ер{х,Х) = 0, для всех х <Е X,

Е<р2(х,Х) < oo,E<pj(X) < оо.

Одной из задач математической статистики является аппроксимация функций распределения статистик, имеющих сложный вид, некоторой более простой функцией распределения. В диссертационной работе эта задача решается для функции распределения U-статистики Т, которую обозначим через F(x). Для F(x) мы будем использовать приближение, так называемым, коротким разложением. Это разложение включает в себя как предельную функцию Fq(x), так и первый член асимптотического разложения Fi(x) порядка 0(1/VN). В работе получена оценка сверху для величины

&N = sup IF(x) - Fq(x) - Fi (ж) |,

x

где Fi (x) - поправка Эджворта, определенная в главе 3. Заметим, что Fi = 0 если — 0 или для всех справедливы равенства:

Evj(X) = E<pj(X)<p(X,x) = Evi(X)<p2{X,x) = Е ср3(Х,х) = 0.

(1.2)

Рассмотрим измеримое пространство (X, 23,/u) с мерой ц — С(Х) - распределением X. Пусть L2 = L2(- Гильбертово пространство интегрируемых в квадрате вещественных функций. Оператор Гильберта-Шмидта Q: L2 —> L2 определяется следующим образом

Qf(x) = [ <p(x,y)f(yMdy) = Еф,Х)/(Х). (1.3)

Jx

Пусть {ej : j > 1} - полная ортонормированная система, составленная из собственных функций оператора Q, соотвествующих собственным значениям qi,q2 ■ ■ ■ таким, что |<7i | > l^l > • • • ■ Тогда

а2 = Ер2(Х, X) = Y1• V(x> У) = Ц Ъез(х)еЛУ)- С1-4)

з> 1 ¿>1

Так как Q оператор Гильберта-Шмидта и ядро <р вырождено ряд (1.4) сходится в L2(X, 23,/i х fj,). Рассмотрим подпространство L2{<p,<pi) С L2, образованное <pi и собственными функциями e.j,

соответствующим ненулевым собственным значениям qj. Добавляя собственную функцию ео, <0>ео = 0 ,мы можем предположить, что функции ео,ег,... образуют ортонормированный базис в Ь2 (ср, <р\). Таким образом, справедливо следующее разложение

^(х) = в ^== (1-5)

где = Шр1{Х)е^(Х). Легко видеть, что Ее^(Х) = 0, для любого j. Следовательно, система является ортонормированной

системой случайных элементов с нулевым средним.

Гильбертово пространство £2 С состоит из элементов х = (хь х2 ■ ■ •) € таких, что

| ж \2=в,е} (1,1), | х |< оо, (х,у) =

1>0

Рассмотрим случайный вектор

Х^е/ (е0(Х),е1(Х),е2(Х),...),

принимающий значения в К°°. Поскольку (е^(Х))у>0 система некоррелированных случайных величин с единичными дисперсиями, случайный вектор X имеет единичную матрицу ковариаций и нулевое среднее. В силу (1.4) и (1.5) справедливы равенства

<р(Х,Х) = (<0>Х,Х), ЫХ) = (о, X), (1.6)

где = (0, д1®ь 92®з, . • •), для х <= и а = (а,-),->о € Равенства в (1.6) позволяют взять нам в качестве измеримого пространства X простанство Случайная переменная X - случайный вектор, принимающий значения в Ж°° с нулевым средним и единичной матрицей ковариаций и такой, что

>р(Х,Х) = (<®Х,Х), <р!{Х) = (а,Х).

Не ограничивая общности рассуждений, будем считать, что <р(х,у) и <р\{х) - линейные функции по каждому из своих аргументов. Такое предположение значительно упрощает выкладки.

Введем ряд обозначений, которые мы будем использовать далее. Через е(х) мы обозначим ехр{гх}, т.е. е(х) — ехр{гх}. Будем писать А < В или A <s В, если А < сВ или А < csB соответственно. А ж В или A В означает, что А <Г В < А или A <s В <s А соответственно.

Для матрицы А = (аь), 1 < i,j < s (или соответствующего линейного оператора) через |А| = sup^^j |Ах| мы будем обозначать норму оператора. Кроме этого мы будем использовать следующие нормы:

lAll = 2 4- |А|оо = tma|Jay|. l<i,J<s

Матрица I - единичная матрица (или единичный оператор). Введем функцию M{t;N) = 1/^/jIpV + ^/Щ для \t\ > 0. Если случайный вектор X принимает значения в линейном простанстве, тогда X -его независимая копия, а X = Х-Х - симметризация X. Для условных математических ожиданий мы будем использовать следующие обозначения:

E{f(X, У)|У} = Еxf{X, Y) = ЕYf(X, Y).

Введем ряд обозначений для моментов:

ра=Е\МХ)\',Ъ=Щ<Р(Х,Х)\'>

(72 = 72,78,Г = Е(Е{ИХД)Г|Х}Г, также преположим, что

/32 < оо, 0 < с2 < оо. Тогда дисперсию Т можно записать в виде:

9 „ N - 1 2

ЕТ +

Статистика Т является вырожденной из-за условия а2 > 0, в силу которого квадратичная часть статистики не является асимптотически пренебрежимой и, следовательно, распределение статистики

Т не является асимптотически нормальным. Более точно, асимптотическое распределение Т задается распределением случайной величины

¿>1 з>°

где щ последовательность независимых одинаково распределенных стандартных нормальных случайных величин, а0,а1,... последовательность суммируемых в квадрате весов и |<?11 > |<?2| > ■ ■■ собственные значения оператора Гильберта-Шмидта (¡2, ассоциированного с ядром (р. Оператор определен в (1.3). Далее, будем считать <т3 = 1.

Рассмотрим статистику Г»: 1 <i<k<N

(1.7)

где 1 < М < N/2. Л = /1(ХЬ..., Хм) - произвольная статистика, зависящая только от Хх,..., Хм, /2 = /г^м+ъ • - • > Хм) также произвольная статистика не зависящая от Х\,...,Хм- Заметим, что класс статистик Г» является более общим, чем класс статистик Т.

Для статистики Т» определим функцию концентрации: С}(Т*;\) = БирР{х < Т* < х + Л}, Л > 0.

Глава 1

В главе 1 получены вспомогательные результаты, в число которых входит оценка характеристических функций статистики Т, и мультипликативное неравенство для и-статистик. Аналогичные результаты имеются в работе Бенткуса и Гетце 13, однако, правые части полученных неравенств не содержат зависимости от собственных значений оператора Гильберта-Шмидта, которая понадобится нам для улучшения оценок. Получить такую зависимость удалось

благодаря предложенным в настоящей работе условиям невырожденности и замене леммы 6.6 из работы Бенткуса и Гетце на модифицированную лемму 2.5 из работы Ульянова и Гетце 20.

Лемма 1.1. Пусть А невырожденная матрица размера sxs, X s Rs- случайный вектор с матрицей ковариаций С. Предположим, что существует константа cs такая, что

Р{|Х|<с,} = 1, |А| < cs, IC"1!^.

Пусть U и V независимые случайные векторы, являющиеся суммами п независимых копий X. Тогда

|Ee{i(Ai7, V)}| < c(s)|deiA|_1Ai2Ä(i; N) для \t\ > О,

Оценка в последней лемме зависит от детерминанта матрицы А. Сформулируем условия невырожденности, использованные в работе Бенткуса и Гетце 13. Условия невырожденности считаются выполненными для распределения случайного вектора Z, ядра ip, параметров 0<p<l,i>ÖHs6N, если выполнено неравенство

P{|A(Z)-II < =Р j max \tp(Zu Zj) - <У < ö 1 > p, где А - случайная матрица, составленная следующим образом: А = A (Z) = {aij)i<ij<s,

где a,ij = (ß(Zi,Zj),Zi,Zj - независимые копии Z.

Условия невырожденности, на которые опирается наша работа, наложены не на вероятность отклонения значений оператора от единичного оператора, а на детерминант самой матрицы А. Будем говорить, что вектор Z удовлетворяет условиям невырожденности Лf(ö,p), если:

W{W{Z) > 5} >р,

20 Ulyanov V., Götze F. Uniform approximations in the CLT for balls in euclidian spaces // University of Bielefeld.- 2000.- no. SFB 343.

р{\Ф(гигз)\ < с} > си 1 < 1,3 < з, где XV{2) = (с1е1А)2,А = ау = 2)),

2^ — независимые копии вектора 2.

При этом параметр р мал, а параметр близок к единице.

Благодаря условию IV (2) > 8 = ({{.. нам удалось в явном виде выписать зависимость от собственных значений в оценке характеристической функции Т.. Сформулируем основной результат главы 1, в котором получена оценка характеристической функции статистики Тг.

Теорема 1.1. Пусть т € N и У = (2т)-^2{Х1 + ... + Хт) удовлетворяет условиям невырожденности N{<11. ■ ■ ?|,р)-Тогда для любой статистики Т„, определенной в (1.7), справедливо неравенство:

\Ее{1Т.}\ «, |-^М2з{1т-рМ/т). (1.8)

Неравенство (1.8), полученное в данной теореме, содержит зависимость от собственных значений ] — 1,9 оператора <0>. Аналогичное неравенство получено в работе Бенткуса и Гетце 13, однако, в нем не указана явная зависимость от собственных значений оператора <0>. Помимо этого, теорема 1.1 используется в доказательстве основных результатов глав 2 и 3. Для доказательства теоремы 1.1 использовалась техника перехода к дискретным случайным векторам, предложенная в работе Юринского 19. Суть данного метода состоит в оценке сверху характеристической функции некоторой случайной величины характерестической функцией дискретной случайной величины.

Важную роль в построении оценки для функций концентрации и оценки точности аппроксимации играет мультипликативное неравенство, полученное в лемме 1.2. Определим функцию ■ф[г) — |Еехр (ИТ''>)\, где Тд - некоторая вспомогательная статистика, используемая в доказательстве ряда результатов.

Лемма 1.2. Пусть (1 > 0 и 5 € N. Предположим, что сумма У = {2т)~1'2(Х 1 + .. ■ + Хт) удовлетворяет условиям невы-рождегтости М(д\ .. .д^р). Тогда существуют константы С1 (з, «¿) 1102(5, (Г) такие, что событие

В = - 7Ж* + 7) < с^^^М'Ьт-рМ/т)}, удовлетворяет условию

Р{£>} > 1 - с2(з, й)(рМ/т)~<£.

Доказательство мультипликативного неравенства в диссертационной работе аналогично доказательству леммы 7.1 в работе Бент-куса и Гетце 13, но результат, опять же, отличается правой частью неравенства, которая зависит от собственных значений оператора

о.

Глава 2

Основным результатом главы 2 является теорема 1.2, в которой получена оценка функций концентрации и-статистики Т*.

Теорема 1.2. Пусть А > 0, тогда для функции концентрации статистики Г» при дд ф 0 справедливо неравенство

где т0 - |</1 • • ■ I~1 (|<71 ■ • • </эГ V"17з,з/2 + 7з),Р ~ с.

Построенная в теореме 1.2 оценка содержит зависимость от собственных значений оператора 0> вида 0(|дд|~с),с > 0. Ранее, оценка функций концентрации порядка С>(ехр{—с|д9|}) была доказана Бенткусом и Гетце 13. Таким образом, в диссертационной работе оценка существенно улучшена по зависимости от собственных значений оператора (¡2.

Данная теорема доказывается в три этапа. На первом этапе мы докажем, что, если для случайного вектора У = (2т)-1/2(Х1+.. .+ Хт) выполнены условия невырожденности N{(}'{ .. .дд,2р), тогда

(1.9)

Для доказательства (1.9) используется лемма 3 из книги Петро-

ва 21, согласно которой

М,

где Ф(0 = [ е{Ьх}(1Я{х), Ф(ж) = Р {Г, < х} .

Полученный интеграл оценивается с помощью леммы 1.3, приведенной ниже. Для доказательства леммы 1.3 мы используем теорему 1.1 об оценке характеристических функций и мультипликативное неравенство для и-статистик из леммы 1.2. Для А>Ь о, ¿2 >0 определим интегралы

/и г

и -'(о<|г|<л II

ЛЕММА 1.3. Пусть т € N. Предположим, что случайный вектор У = {2т)~1/2{Хх + ... 4- Хт) удовлетворяет условиям невырожденности Л/"(<71 • ■ • Ад >р) и в > 9. Введем ряд обозначений и условий

т т т

тп т

где ^(з), 0 < ] < 3 - некоторые положительные константы. Тогда

1о «, Ы~9(рМГ\1г «, |д9\-18т(рМ)-1. Сформулируем лемму, необходимую для оценки интеграла 1\ .

21 Петров В. В. Суммы независимых случайных величин. М.: Наука, 1972.

JIemma 1.4. Пусть <p(t),t > 0 - непрерывная функция такая, что (/?(О) = 1,0 < ip < 1. Предположим, что для s > 8 выполнено неравенство:

4>(t)v(t + t) <qms(t-,n),

для всех t >0 u г >0 и некоторого © > 1, не зависящего от t и т.

Тогда для любых А > 1,0 < В < 1 и N > 1 справедливо неравенство

[А v(t)Ë «s +Ш +

Jb/vn * n

На втором этапе доказательства теоремы нам необходимо показать, что, если гауссовское распределение G удовлетворяет условиям невырожденности ■ ■ . q$,p), тогда

П(Т 1-18 max{A; ттг0}

да,л)«ы рМ , (110)

где ш0 ~ф1...<79Г3р~1(|91 •••99Г3Р_172,з/2 + 7з)-

Мы используем (1.9) и лемму 1.5, в которой показано, что, начиная с некоторого номера m, выполнение наших условий невырожденности M{Aq\ ... qf,,p) для гауссовского вектора влечет за собой выполнение условий невырожденности N{q\ . ■ ■ 2р) и для суммы случайных векторов Sm = m~1^2(Xi + ... + Xm).

Лемма 1.5. Пусть гауссовский вектор G удовлетворяет условиям невырожденности Л/"(4ql... <?g, 1 — р).

Тогда, при

m > с„ |(7i - - • «2э| 3Р Wn-'-flal 3Р 1 Ъ,з/2+1з),

сумма Sm = m ' + ... + Хт) удовлетворяет условиям

невыроокдепности J\f(qf ... çf,1 — 2р).

Для доказательства результата теоремы 1.2 нам потребуется (1.10), а также оценка вероятности р, которая будет получена с помощью леммы 1.6 и неравенства

F{Z > 0,5} > 0,25Л~2,

где Z - неотрицательная случайная величина, такая, что EZ — 1,ЕZ2 < А. Ниже вьшишем лемму, в которой получено логарифмическое неравенство для моментов второго порядка, а также найден момент первого порядка детерминанта случайной матрицы А.

Лемма 1.6. Пусть Gj,...,GS,G[,... ,G'S независимые, одинаково распределенные случайные элементы в такие, что Gi = (Gu,Gi2,...), = {G'u, G'l2,...), где GZ],G'^ -независимые, стандартные нормальные случайные элементы. Пусть \qi\ > \fh\ > ••■ - собственные значения оператора Гильберта-Шмидта Q. W = (detA)2, где A(G) = av(G) = = (QGuGj). Тогда

Е W=(sl)2 ¿2 (Ъг-Ъ.)2>

l<i1<...<is<oo

(ЕW2f/2 < c(s)EW.

Глава 3

В главе 3 получена оценки точности аппроксимации функции распределения U-статистики и их приложения к статистикам фон Мизеса. Основной результат данной главы сформулирован в виде теоремы 1.3, в которой получена оценка точности аппроксимации функции распределения U-статистики в оптимальных моментных условиях.

Теорема 1.3. (i) Пусть

т0 х |gi - ■. q9\~3p'l(\qi ■ ■ ■ <79Г3Р_172,з/2 + 7з), Р ~ с. Тогда

А & т° , № + 72'2) + (^+7з)

^Ы18 iVkal13 + ЩЧ9\э ■

(И) Пусть выполнено условие (1.2).

Тогда

В работе Бенткуса и Гетце 13 аналогичная оценка содержит константу, которая имеет порядок 0(ехр (-с|^|)),= 9,13, по зависимости от собственных значений оператора <0>. В диссертационной работе оценка существенно улучшена по зависимости от и имеет степенной порядок ] = 9,13

Доказательство данной теоремы опирается на лемму 1.7

Лемма 1.7. Предположим, что У удовлетворяет условиям

невырожденности М{(Ц ... ,р).

(г) Пусть з > 13 и т0 х |<?1 •. .д9Г3Р_1(к1 • • ■ <7эГ3Р_172,з/2 +

7з). Тогда

Л ^ П1° ,(^3+72,2)

<<5 + мы*

(п) Пусть выполнено условие (1.2) и з > 9. Тогда 1

(#1 +7з +72,2)-

Константа р оценивается также, как и в теореме 1.2, а величина т0 получена в лемме 1.5. Доказательство леммы 1.7 опирается на леммы 1.8 и 1.9.

Определим статистику Т^

т(г) = ^ £ + £ /«-

где

Zj = Х5 для 1 < з < г,г € = Д,- для г <]

В следующей лемме получено разложение функции распределения для статистики Т^. В доказательстве данной леммы мы использовали результаты с оценкой характеристической функции в теореме 1.1 и мультипликативное неравенство из леммы 1.2.

Лемма 1.8. Пусть т е N. в > 9 и ¿0 = т-1(£>л7т)_1+2/5• Предположим, что случайный вектор У удовлетворяет условиям невырожденности Л/"(<?1 • • • Яэ: Р) ■ Тогда, для рМ > т и т"1 > > £о функция распределения статистики Тудовлетворяет равенству

1 гШ, ^ Р(г)(х) = £ + / + д>

2 2тг {

где |Я| «в т/(рЛГ|?9|18). В лемме 1.9 доказана оценка поправки Эджворта.

Лемма 1.9. Преобразование Фурье-Стилтъеса поправки Эджворта удовлетворяет неравенству:

¿>1

Далее, при в >7 справедливы неравенства:

[ « для А > о,

7|4|>а n

№2+72,2)1/2кГ3.

Благодаря лемме 1.8, мы можем оценить величину А^ сверху следующим образом

Д N<J + R,

Г™и ~ ~ (И

J-Nt* |Ч

Я - остаточный член, который оценивается с помощью сформулированных ранее лемм 1.9 и 1.8. Определим к —

K(¿) = K(Í, iV, у», £(Х)) = (í) + K3(Í), ¿ = {{N - 2)/20]

где

ki(í) =sup|Ee{íiV-1 ^p(Xj,Xk) + L(X1,...,Xl)}\,

L 1<j<k<l

¿ 1<3<k<l

супремум берется по всем линейным статистикам L, которые могут быть представлены как L{x\,..., х{) — fj(xj) с некоторыми функциями /ь.. •, //. Мы можем получить оценку для k(í), применив теорему 1.1 с заменой N на I.

Оценим J. Чтобы оценить подынтегральное выражение выпишем лемму 1.10, в которой доказана оценка для Адг = \F(t)— F0(t) +

AWI-

Лемма 1.10. Справедливо неравенство:

А N < ^-1(Í4^4+Í6/S32+í272+|Í|373+|Í|57273+Í272,2+Í67272,2)-

Если выполнено условие (1.2), тогда f\(£) = 0 w выполнено неравенство

AN <§: KÍV_1(í4/?4 + f272 + |í|373 + í47272,2)-

В разделе 3.3 главы 3 построена оценка для статистик фон Ми-зеса вида

Е + 7=^ Е

KiJCJV ViV lí^JV

Ядра <р и ¡рх вырождены. Результат доказан аналогично оценке точности аппроксимации Ц-статистик.

Рассмотрим функцию ф(х) — (<р(х, х) — г/) /2, где V — Е</з(Х, X). Перепишем предыдущее равенство для М

N

где Т определена в (1.1). Мы применим оценку для данных статистик, предполагая, что 'Еф(Х) = 0 и о = Еф2(Х) < оо. Пусть F* -функция ограниченной вариации (при условии г/3 ^ 0) с преобразованием Фурье-Стилтьеса

F,(t) = ~^=Еф(С)е{1Тй} = ~^Щ0{С)е{1Т0},

и таким, что F*(—oо) = 0. Запишем Hi = F^+F*, пусть Я - функция распределения М — и¡2. Определим

SN - sup|%(z)|, SN(x) = Н(х) - Fq{x) - Hi(x).

x

Основным результатом диссертационной работы для статистик фон Мизеса является сформулированная ниже теорема 1.4.

Теорема 1.4. (i) Предположим, что qiz Ф О,

ш0 ж ... g9|"3P_1(l9i • ■ • <ft TV"172,3/2 + 7з), Р ~ с. Тогда

мы имеем

А < т° (11+72,2) (ßi + 13 + g)

N ^ ЛГ|©|18 + Л%з|13 + ЛГ|дэ|9 •

(и) Предположим, что (1.2) выполнено и qg ф 0. Тогда мы имеем

§N ^ + ' + #5 + 73 + 72,2 + 0).

Зависимость от собственных значений qj оператора Q имеет степенной порядок. Результата теоремы 1.4 существенно улучшает

аналогичную оценку, которая построена в работе Бенткуса и Гетце

1 ч ..

и имеет степенной порядок.

Работа выполнена под руководством доктора физико-математических наук, профессора Владимира Васильевича Ульянова, которому автор выражает искреннюю благодарность за постановку задачи, терпение и постоянное внимание к работе.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Zubayraev Т. Asymptotic analysis for U-statistics and its application to von Mises statistics // Open Journal of Statistics.-2011.- Vol. 1, no. 3.- Pp. 139-144.

2. Зубайраев T.A. Об асимптотическом анализе U-статистик: оценка функций концентрации // Вестник Тверского государственного университета. Серия: Прикладная математика.-2011.- № 22.- С.73-84

3. Зубайраев Т.А. Об асимптотическом анализе U-статистик: оценка точности аппроксимации функции распределения // Сборник статей молодых ученых факультета ВМК МГУ.-2010.- Т. 1, № 7,- С. 99-108.

4. Зубайраев Т.А. Оценка функций концентрации U-статистик // Сборник тезисов XVIII Международной научной конференции студентов, аспирантов и молодых ученых "ЛОМОНОСОВ - 2011"; секция "Вычислительная математика и кибернетика"; Москва, МГУ им. М.В. Ломоносова,- 2011.- С. 15-16.

Напечатано с готового оригинал-макета

Подписано в печать 19.04.2012 г. Формат 60x90 1/16. Усл.печл. 1,0. Тираж 100 экз. Заказ 190.

Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от01.12.99 г.

119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 527 к. Тел. 939-3890,939-3891. Тел./факс 939-3891.

 
Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Зубайраев, Тимур Асламбекович, Москва

61 12-1/822

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Факультет Вычислительной Математики и Кибернетики

Зубайраев Тимур Асламбекович

АСИМПТОТИЧЕСКИЙ АНАЛИЗ ВЫРОЖДЕННЫХ и-СТАТИСТИК ВТОРОГО ПОРЯДКА: ОЦЕНКИ ТОЧНОСТИ АППРОКСИМАЦИИ И ФУНКЦИЙ

КОНЦЕНТРАЦИИ

Научный руководитель: доктор физико-математических наук

В.В. Ульянов

имени М.В. Ломоносова

На правах рукописи

Специальность 01.01.05 — Теория вероятностей и математическая статистика

ДИССЕРТАЦИЯ на соискание ученой степени кандидата физико-математических наук

Москва 2012

Предисловие

Одним из центральных объектов в теории вероятностей являются суммы независимых случайных величин. Интерес к задачам, связанным с суммированием независимых случайных величин, появился в математике еще в XVIII веке. Невозможность прямых вычислений распределений сумм независимых случайных величин приводит к необходимости получения и изучения асимптотических формул для них, то есть таких формул, которые позволяют находить с нужной точностью требующиеся нам вероятности, связанные с суммами случайных величин. Эти формулы даются предельными теоремами теории вероятностей. Таким образом, аппроксимация многократных сверток распределений потребовала развития содержательной математической теории, которая называется теорией предельных теорем для сумм независимых случайных величин.

Впервые исследования по 11-статистикам были проведены в работах Халмоша [1], фон Мизеса [2] и Хефдинга [3] в конце 40-х годов XX века. И-статистики являются алгебраическим обобщением суммы независимых случайных величин и относится к классу симметрических функций. Интерес к таким случайным объектам возник сначала в математической статистике в задачах оценки функционалов от распределений, и-статистики, как объект вероятностной теории суммирования, с одной стороны "алгебраически" более сложны, чем суммы независимых случайных величин и векторов, с другой - содержат в себе существенные элементы зависимости, проявляющиеся в мартингальных свойствах (см. например [4]). Кроме того, И-статистики занимают одно из центральных мест в статистических задачах.

С самого начала теория 1)-статистик развивалась под влиянием классической теории суммирования независимых случайных величин. Вместе с тем, асимптотическая теория Ц-статистик имеет специфические черты и качественно отличается от теории сумм независимых случайных величин. Многие асимптотические свойства 11-статистик зависят от ранга г ядра, связанного со статистикой, и условий на моменты ядра. Для невырожденного ядра и ранга г — 1 асимптотическое поведение 11-статистик сводится к асимптотическому поведению суммы случайных величин. Если г > 2 (ядро вырождено), то предельные распределения И-статистик представляют собой более широкий класс, включающий в себя бесконечно делимые распределения, распределения с функционалами, определенными ядром, конечно и бесконечномерными нормальными векторами. Такие особенности 11-статистик создают новые идеи в контексте предельных теорем и требуют развития специальных методов исследования.

Историю развития оценок точности аппроксимации для 11-статистик в случае бесконечномерного пространства можно разделить на два этапа. Первый этап связан с получением оценок, оптимальных по А^ - объему выборки, а второй по зависимости от характеристик оператора, ассоциированного со статистикой.

Настоящая работа посвящена асимптотическому анализу вырожденных 11-статистик второго порядка.

Для вырожденных И-статистик второго порядка скорость сходимости к предельному распределению исследовалась в 1973 году Грэмсом и Сер-флингом [5], которые получили оценку типа Берри-Эссеена 0(Я~1/2+£), £ > 0. Оценка улучшена в 1974 году Бикелем [6], а затем в 1977 году Чаном и Виерманом [7], Каллаертом, Янссеном в 1978 году [8] и Хел-мерсом и ван Цветом [9] в 1982 году, которые получили порядок сходимости 0(А^1/2). В 1979 году оценка 0{И~1+£):е > 0 доказана Гетце [10] с использованием неравенства симметризации Вейля при определенных

условиях на моменты и предположении о том, что ненулевых собственных значений некоторого оператора, ассоциированного с И-статистикой, бесконечно много. Данный результат не является оптимальным ни по зависимости от N, ни по зависимости от характеристик оператора. Позже асимптотическими свойствами и получением разложения Эджворта для вырожденных Ц-статистик занимались Гетце [11], Королюк и Боровских [4]. В монографии Королюк, Боровских [4] оценка улучшена до порядка о(А/"-1/2). В работе Гетце и Зитикиса [12] получена аппроксимация со слагаемыми 0(ЛГ~1) при определенных предположениях о гладкости ядра и распределения элементов выборки. В 1999 году Гетце и Бенткус в [13] доказали оценку точности аппроксимации для Ц-статистик, которая является оптимальной по N и получена в оптимальных моментных условиях. В той же работе построены оценки для функций концентрации Ц-статистик. Оба результата содержат константу, которая имеет экспоненциальный порядок зависимости от собственных значений некоторого оператора, ассоциированного с и-статистикой. Такая зависимость от собственных значений оператора, ассоциированного с Ц-статистикой может быть заметно улучшена, что и сделано в настоящей работе.

Исследования Ц-статистик ведутся и по другим направлениям: для хвостов распределений вырожденных Ц-статистик произвольного порядка, построенных по выборкам из последовательности стационарно связанных наблюдений Борисовым И.О. и Володько Н.В. в [14] получены экспоненциальные неравенства. Помимо этого, Борисов И.С. и Жечев В.А. доказали предельные теоремы для Ц-статистик от зависимых наблюдений в [15], Борисов И.С. и Володько Н.В. доказали предельную теорему для Ц-процессов от стационарно связанных наблюдений в работе [16]. Для статистик Мизеса - частного случая Ц-статистик, Борисов И.С. и Саханенко Л.А. в [17] доказали центральную предельную теорему. Тихомировым А.Н., Гетце и Юрченко в [18] получены асимптотические разложения в центральной предельной теореме для квадратичных форм.

Настоящая работа посвящена уточнению оценок точности аппроксимации и уточнению оценок функций концентрации для вырожденных И-статистик второго порядка.

Во введении содержится обоснование актуальности темы диссертации и исторический обзор, связанный с темой работы. Кроме этого, в нем формулируются и обсуждаются основные результаты, полученные в работе.

В главе 1 построена оценка характеристической функции и мультипликативное неравенство для 11-статистик - результаты, которые необходимы для получения оценок точности аппроксимации и оценок для функций концентрации.

В главе 2 доказана оценка функций концентрации 11-статистик. Глава 3 посвящена оценкам точности аппроксимации для 11-статистик и для статистик фон Мизеса.

Работа выполнена под руководством доктора физико-математических наук, профессора Владимира Васильевича Ульянова, которому автор выражает искреннюю благодарность за постановку задачи, терпение и постоянное внимание к работе.

Оглавление

Введение 9

1 Базовые результаты 25

1.1 Основные понятия и обозначения............... 25

1.2 Вспомогательные результаты..................................29

1.3 Оценка характеристической функции и-статистики .... 36

1.4 Мультипликативное неравенство для 11-статистик..........49

2 Функции концентрации Ц-статистик 55

2.1 Оценка функций концентрации................................55

3 Оценка точности аппроксимации Ц-статистик 60

3.1 Оценка точности аппроксимации..............................60

3.2 Разложения характеристических функций ..................65

3.3 Применение оценок для статистик фон Мизеса..............74

Заключение 78

Обозначения

Для х,у et 2 С М00

|гс| - норма X, \х\2 =def {х,х), (х,у) = J2j>oxjVj - скалярное произведение.

Для А = (ау) G Msxs

deiA- определитель матрицы А, |А| = sup^i^ |Аж| - норма матрицы А.

Мы будем использовать нормы

lAli = У, =max \oij\.

I - единичная матрица (оператор). С(Х) - распределение X. [Ь] - целая часть числа Ь. Через е(х) мы обозначим exp{ix}.

с, ci,... константы, в случае, если константа зависит, например, от s мы будем писать c(s) = cs.

А <С В или А <CS В означает, что А < сВ или А < csB, соответственно. А х Б или А xs В означает, что А <С В <С А или А <CS В <CS А, соответственно.

Для подмножеств множества целых чисел Z, будем писать

[1, N] = {1,.. .,7V}, (а, Ь] = {з е Z : а < j < b}.

|А| обозначает количесвто элементов множества А С Z. N - множество натуральных чисел и Z+ = N U {0}.

Если случайный вектор X принимает значения в линейном простанстве, тогда X - его независимая копия, а X = X — X - симметризация X. Для условных математических ожиданий мы будем использовать следующие обозначения:

Е{/(Х, У)|У} = ЕхПХ, У) = ЕУ/(Х, У).

Введение

U-статистики, как объект математической статистики, были впервые рассмотрении в работе Халмоша в 1946 году, под влиянием которой в 1948 году Хефдингом было положено начало исследований в теории U-статистик. В работе Хефдинга "A class of statistics with asymptotically normal distributions" [3] были рассмотрены U-статистики вида Un — £i<i(i)<...<i(fc)<n,fc<n h •'' Xm), где Xi,..., X„ - независимые, одинаково распределенные случайные элементы. С точки зрения теории вероятностей, U-статистики порядка к = 2,3... являются обобщением сумм независимых одинаково распределенных случайных величин, изучение которых занимает центральное место в теории вероятностей. В упомянутой работе Хефдинг установил асимптотическую нормальность невырожденных U-статистик при п —»• оо.

Введем определение U-статистики. Пусть независимые

одинаково распределенные случайные величины в некотором измеримом постранстве (X, Л) с распределением Р. Далее, определим функционал в со значениями в М, представимый в виде

в(Р) = f-'-f Ф(ХЬ • • . , Xm)P(dxi) . • • P(dxm),

где ф - ядро 0(Р), а целое число т - порядок 9. Для симметричного ядра ф мы можем определить U-статистику как

Un = {C™yl ]Г ф(Хч,...,Х1т),п>т.

l<il<...<im<n

Отметим, что Un является несмещенной оценкой 0(Р).

Рассмотрим две наиболее популярные в теории вероятностей статистики - выборочное среднее и выборочную дисперсию. Для выборочного

среднего имеем следующий набор параметров:

п

П — 1

Другие примеры можно найти в книге [19], в которой рассмотренно множество приложений И-статистик в регрессионном и кластерном анализе.

Настоящая работа посвящена получению оценок функции концентрации и точности аппроксимации для вырожденных и-статистик второго порядка следующего вида (более подробное определение будет дано в постановке задачи):

В работе получены оценки скорости сходимости Ц-статистики Т к предельному закону, также получена оценка функции концентрации 11-статистики Т. В период с 1973 по 1982 год над оценкой скорости сходимости для и-статистик работали Грэме и Серфлинг [5], доказав порядок 0(А/"_1/2+£), е > 0, затем Бикель [6], Чан и Виерман [7], Каллаерт и Янссен [8], Хелмерс и ван Цвет [9] улучшили оценку скорости сходимости до 0(А/"-1//2) во все более общих постановках задачи. Помимо этого, оценку 0(А^-1), при некоторых условиях регулярности ядра, построили в 1980 году Каллаерт и Янссен [20]. В 1984 году Королюк и Боровских [4] доказали оценку о(Аг"1/'2). Гетце в 1995 году получил порядок аппроксимации 0(А/"-1) совместно с Зитикисом [12] при некоторых условиях на

ядро и распределение. Позднее, в 1999 году, в работе Бенткуса и Гет-це [13] доказан порядок аппроксимации 0{Ы~1) при оптимальных мо-ментных условиях. Оценка содержит константу, которая имеет порядок 0(ехр (—с|<71з|)), где с - положительная константа, а > |<?2| > ••• -собственные значения оператора, ассоциированного с 11-статистикой Т. Оценка может быть улучшена до порядка 0(ехр (—с|дд|)), если фг = О, либо выполнены равенства

- Щ\(Х)ф(Х,х) = Еф1(Х)ф2(Х,х) = Еф3(Х,х) = 0.

В диссертационной работе оценка также получена в оптимальных мо-ментных условиях, но существенно улучшена по зависимости от и имеет порядок 0(|д^|~с),^ — 9,13, где ^ зависит от выполнения сформулированных выше условий. Также была улучшена оценка для функции концентрации 11-статистики Т и ее обощенного вида, полученная в работе Бенткуса и Гетце [13]. Результаты для оценки функций концентрации и точности аппроксимации могут быть полезны в теории чисел при изучении проблемы приближения числа точек, попадающих в заданное множество.

Вырожденные Ц-статистики включают в себя ряд других статистик (см. например [21]). В частности, они включают в себя квадратичные формы сумм независимых векторов в конечномерных и гильбертовых пространствах. Определенный выбор таких векторов приводит к эмпирическим процессам и, в частности, к равномерным эмпирическим процессам на отрезке [0,1]. Их норма в V2 совпадает с иАстатистикой Смирнова-Крамера-фон Мизеса. Для и;2—статистик соответствующее ядро ф имеет вид

1 1

Ф(х1 у) = 2О*2 + У2) ~ шах{ж>у} + з> где 0 < х,у < 1

с собственными значениями Хк = (ктг)~2. Предельное распределение таких статистик было исследовано Смирновым [22], Андерсоном и Дар-

лингом [23]. Точность аппроксимации для о;2-статистик получена в 1965 году Канделаки [24] - 0(1одМ)~1. В дальнейшем были доказаны оценки степенного вида 0(А^~а): в 1969 году Сазоновым [25] при а = 1/6 и в 1972 году Кифером [26] при а = 1/4. В предположении о бесконечно большом количестве ненулевых собственных значений некоторого оператора, ассоциированного с о;2-статистикой, Гетце [10,11] построена оценка 0(7У'1~£),е > 0. Условия на моменты и собственные значения улучшены Юринским [27,28], Бенткусом [29], Нагаевым и Чеботаревым [30], Залес-ским, Сазоновым и Ульяновым [31], Сенатовым [32]. Для а;2-статистик, оценки порядка 0(А/"-1) получили Бенткус, Гетце и Зитикис [33]. Порядок для диагональных квадратичных форм был доказан в 1996 году Бенткусом и Гетце [34].

Постановка задачи

Во введении будет использована независимая нумерация ссылок. В главах 1-3 первые две цифры ссылки обозначают номер главы и части, соответственно. Пусть X, X, Хл\г - независимые одинаково распре-

деленные случайные величины, принимающие значения в произвольном измеримом пространстве (X, 93). Пусть ф\. X —)• К и ф: X2 —>• К - измеримые функции. Предположим, что ф симметрична, т.е. ф{х, у) = ф(у, х), для любых х, у € 1. Рассмотрим и~статистику:

Одной из задач математической статистики является аппроксимация функций распределения статистик, имеющих сложный вид, некоторой более простой функцией распределения. В диссертационной работе эта задача решается для функции распределения 11-статистики Т, которую

а)

предполагая, что

Ефг(Х) = 0, Еф(х, X) - 0, для всех х е X, Еф2(х,Х) < оо,Еф\(Х) < оо.

обозначим через Р(х). Для Р(х) мы будем использовать приближение, так называемым, коротким разложением. Это разложение включает в себя как предельную функцию ^о(ж), так и первый член асимптотического разложения порядка 0(1/л/Л^). В работе получена оценка сверху для величины

Ддг=8ир - ад -

X

где ^(ж) - поправка Эджворта, определенная в (3.1.1). Заметим, что ^ = 0 если ф\ — О или для всех х € X справедливы равенства:

Еф\{Х) = Е ф{(Х)ф(Х,х) = Еф1(Х)ф2(Х,х) = Е ф3{Х,х) = 0. (2)

Введем ряд обозначений:

/За = Е\ф1(Х)\',Ъ=ЩФ(Х,Х)\8, (3)

о-2 = ъ,ъ,г = Е(Е{\ф(х,х)\*\х}у,

также преположим, что

(32 < оо, 0 < а2 < оо. Тогда дисперсию Т можно записать в виде:

ЕТ2 = + ^Г0"1

Статистика Т является вырожденной из-за условия а1 > 0, в силу которого квадратичная часть статистики не является асимптотически пре-небрежимой и, следовательно, распределение статистики Т не является асимптотически нормальным. Более точно, асимптотическое распределение Т задается распределением случайной величины

¿>1 3>0

где т^ последовательность независимых одинаково распределенных стандартных нормальных случайных величин, ао, ах,... последовательность

суммируемых в квадрате весов и \qi\ > \q2\ > ... собственные значения оператора Гильберта-Шмидта Q, ассоциированного с ядром ф. Подробное определение оператора Q дано в главе 1. Далее, будем считать а2 = 1. Сформулируем основной результат диссертации в виде теоремы 1:

Теорема 1 (г) Пусть

то - ki • • • Я9\~3Р~г(\дi • • • Я9\'3Р~гЪ,з/2 + 7з), V ~ с. Тогда

д ^ mo , №2+72;2) (At + 7з)

(и,) Пусть выполнено условие (2). Тогда

Доказательство данной теоремы см. в главе 3, теорему 3.1.1. Рассмотрим статистику Т*:

п= Y, <¡>(Xj,Xk)+fi(X1,...,XM)+f2(XM+li...,XN)1l<M<N/2,

1 <i<k<N

(5)

где fi = f\ (Xi,..., Хм) произвольная статистика, зависящая только от Xl, ..., Хм, Н — /гО^м+ь ■ ■ •, XN) также произвольная статистика не зависящая от Xi,..., Хм- Заметим, что класс статистик Т* является более общим, чем класс статистик Т. Для статистики Т* определим функцию концентрации:

Q(T*; Л) = sup< Г* < ж + Л}, Л > 0.

X

В нашей работе получена оценка, которая имеет степенной порядок зависимости от собственных значений оператора Q. Ниже сформулирована теорема, в которой приведена наша оценка для функций концентрации.

Теорема 2 Пусть

mQ х \qx... q9\~3p-l{\qi... ^ГУ^з/г + 7з ),p~cuqQ^ 0. Тогда

Структура диссертации

Диссертация состоит из введения, трех глав, разбитых на разделы, и списка литературы из 42 наименований. Общий объем работы составляет 91 страница.

Краткое содержание диссертации

В главе 1 введены основные понятия и обозначения, а также получены базовые результаты, в число которых входит оценка характеристических функций статистики Т* и мультипликативное неравенство для U-статистик. Оба ре