Оценки скорости сходимости в центральной предельной теореме для одновыборочных и многовыборочных U-статистик от разнораспределенных случайных величин тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Гадасина, Людмила Викторовна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
2006 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Диссертация по математике на тему «Оценки скорости сходимости в центральной предельной теореме для одновыборочных и многовыборочных U-статистик от разнораспределенных случайных величин»
 
Автореферат диссертации на тему "Оценки скорости сходимости в центральной предельной теореме для одновыборочных и многовыборочных U-статистик от разнораспределенных случайных величин"

На правах рукописи

□0305312В

и и ▼ и ь/ сии'

ГАДАСИНА ЛЮДМИЛА ВИКТОРОВНА

Оценки скорости сходимости в центральной предельной теореме для одновыборочных и многовыборочных 17-статистик

от разнораспределенных

случайных величин.

01.01.05 - теория вероятностей и математическая статистика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

САНКТ-ПЕТЕРБУРГ 2007

003053128

Работа выполнена на кафедре "Прикладная математика" Петербургского государственного университета путей сообщения

Научный руководитель: доктор физико-математических наук, профессор Ю.В. Боровских

Официальные оппоненты: доктор физико-математических наук, профессор Л.В. Розовский

кандидат физико-математических наук, доцент О.А. Подкорытова

Ведущая организация: Санкт-Петербургский государственный электротехнический университет (ЛЭТИ)

Защита состоится 2007 г. в ^"часов на заседании

диссертационного совета Д 002.202.01 в Санкт-Перербургском отделении Математического института им. В.А. Стеклова РАН по адресу: 191023, Санкт-Петербург, наб. р. Фонтанки, д. 27, к. 311.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского отделения Математического института им. В.А. Стеклова РАН.

Автореферат разослан -¿¿^/у 2007 г.

Ученый секретарь

диссертационного совета Д 002.202.01 доктор физико-математических наук

А.Ю. Зайцев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Теория [/-статистик начала свое развитие после выхода работ Халмоша в 1946 году и Гефдинга в 1948 году, и интерес к ней не уменьшается и по сей день. Активное изучение этого математического объекта ведется как и в нашей стране так и зарубежом. Имеется большое количество работ, в которых были доказаны такие классические теоремы как закон больших чисел, центральная предельная теорема, принцип инвариантности, закон повторного логарифма. А также активно изучается вопрос оценки скорости сходимости невырожденных [/-статистик к нормальному закону. В 1974 году Шске1 получил оценку порядка 0(п-1/2) в предположении, что ядро ¿/-статистики ограничено. После этого шло активное ослабление условий на ядро. В 1997 году вышла работа Ю.В. Боровских, в которой была получена оценка порядка 0(п~х/2) при минимальных предположениях на канонические функции разложения Гефдинга ¿/-статистик. Однако, вопросы построения оценок скорости сходимости для [/-статистик, зависящих от независимых, но не обязательно одинаково распределенных случайных величин, полностью не решены до сих пор.

Вопросу изучения многовыборочных [/-статистик от выборок из разнораспределенных случайных величин до сих пор не уделялось особого внимания. Хотя изучение этого класса £/-статистик имеет немаловажное значение, поскольку связано с их применением в различных областях теории вероятностей и маг тематической статистики, например, теории проверки гипотез и случайных графов. В ходе работы над диссертацией выяснилось, что для таких [/-статистик не была доказана центральная предельная теорема при подходящих условиях на ядро.

Цель работы. Была поставлена цель оценить скорость сходимости невырожденных одновыборочных [/-статистик в случае разнораспределенных случайных величин к нормальному

закону; доказать центральную предельную теорему для многовыборочных [/-статистик в случае неодинаково распределенных случайных величин и оценить скорость сходимости в ней.

Методы исследования. Основными методами, применяемыми в данной работе являются следующие:

- метод срезок;

- метод характеристических функций;

- метод рандомизации.

Ключевым моментом является разложение Гефдинш.

Основные результаты работы. 1. Построена оценка скорости сходимости к нормальному закону невырожденных II-статистик второго порядка в случае независимых неодинаково распределенных случайных величин.

2. Построена оценка скорости сходимости к нормальному закону невырожденных [/-статистик произвольного порядка в случае независимых неодинаково распределенных случайных величин.

3. Доказана центральная предельная теорема для невырожденных многовыборочных [/-статистик в случае независимых неодинаково распределенных случайных величин.

4. Построена оценка скорости сходимости к нормальному закону невырожденных многовыборочных [/- статистик в случае независимых неодинаково распределенных случайных величин.

5. Исследуется несколько примеров [/-статистик, появляющихся при рассмотрении случайных графов. Получены асимптотики таких ¿/-статистик.

Научная новизна. Все основные результаты диссертации являются новыми.

Практическая и теоретическая ценность. Полученные результаты обобщают оценки скорости сходимости невырожденных [/-статистик и центральную предельную теорему для

многовыборочных [/-статистик на случай неодинаково распределенных случайных величин. Получен широкий спектр оценок при различных условиях на канонические функции разложения Гефдинга [/-статистик.

Аппробация работы. Результаты диссертационной работы были представлены автором на Всероссийской конференции по проблемам науки и высшей школы в Санкт-Петербурге (2001 г.), на городском (Санкт-Петербургском) семинаре по теории вероятностей и математической статистике под руководством акад. И.А. Ибрагимова (2001, 2006 г.), на Пятом Всеросийском симпозиуме по прикладной и промышленной математике (2004, 2005 г.).

Публикации. Основные результаты диссертации изложены в работах [1]-[6].

Структура и объем диссертации. Диссертация состоит из введения, шести глав и списка литературы, содержащего 57 наименований. Общий объем работы - 117 страниц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении приводится краткий обзор рассматриваемых вопросов, а также структура работы.

В первой главе обсуждается постановка задачи, приводятся основные определения и формулы, сделан краткий исторический обзор, описываются методы исследования.

Во второй главе получены оценки скорости сходимости в центральной предельной теореме для С/-статистик второй степени

ип= £

1<«<7<п 5

где Фу : X2 —► И - симметрические функции такие, что

Е\Фц(ХиХД\<оо

для всех l<i<j<nt а Х\,...,Хп - независимые не обязательно одинаково распределенные случайные величины со значениями в измеримом пространстве (X, В). Если определить канонические функции

9з = ШШ = Т,{Е[Фц(ХиХ1)\ХА - ЕФ„}+ »=1

i=j+г где ;' = 1,...,пи

9ц = 9ц{ХиХ1) = Ф„(Х„ X,) -

-Е[Ф„(ХиХА\ХД + ЕФф

где 1 < г < ] < п, то разложение Гефдинга будет иметь следующий вид

ип-тп = ^+ £ 9гг

Обозначим = Ед]. Обозначим,

Дп = вир \Р(а~\ип - Еип) <х)~ Щх)|,

х€Н.

где М(х) - функция распределения стандартной нормальной случайной величины.

Рассмотрим усеченные случайные величины 9? = 9А\9З I < <*п) 3 = 1, • • •, п,

9?} = 9цЩ9а\ < ^п) 1 <г<з<п,

где 1(А) - индикаторная функция множества А £ В. Введем слабые моменты порядка р > О

Я(0,р)=8ир(** £ Р(Ы > *„*))•

1 <1<]<п

Теорема 2.1. Если > 0, тогда при всех |<р<2«п>2 Ап<2.1.о?±ЕдР(Ш>ап)+

3=1

+152.5- <<т„)+

3=1

+1417.5 • £ ЕШ1(\9а\><гп)+

1<»<^7<п

+78.5 • <т~3 £ Е\9?9?9Ы+ 1 <«<?'<»»

+(5174.9 + ———+ )' <тпР £ ЕЫЧ(М<ап).

Следствие 2.1. Пусть р > 4/3 и, кроме того, выполнены следующие условия:

Лг,„(е) = а"2 £ > еап) - О,

3=1

Л2,п(е) = ет-'/з > «тп) -> 0 (1)

1<*<3<п

для любого фиксированного е>Оип—*оои существует константа а > 0 такая, что Л2,п(0) < а, тогда

Дп-О.

При р — 4/3 утверждение следствия остается верным, если в условие (1) на д^ положить е = О.

В следующих теоремах получены оценки в центральной предельной теореме.

Теорема 2.2. Пусть выполнены условия теоремы 2.1 и, кроме того, при некотором 4/3 < 6 <р слабый момент 5(0, < ос. Тогда

Д„ < 2.ha^Egp(\9j\ > < *«)+

3=1 3=1

^+(5174-9+^+• «н-

3=1 l<t<j<n

Следствие 2.2. Пусть в теореме 2.2 S = 5/3. Тогда

An < 2.1 <2Е£#/(Ы > *„)+152.5<3£ад3/(Ы < ап)+

з=1 3=1

+400685-5(0,5/3)+ +78.5(<т„-3Х:^|3.(т„-1 £

j=l l<«i<n

Теорема 2.3. Пусть а* > 0 и, кроме того, при некоторых 0 < ¿1 < 1 и 0 < 62 < 1/3 < оо, з = 1,... ,п и <

оо, 1 < г < j < п. Тогда при п> 2

Ап<154.5-(7-2-г1Х:^Г51 + 15408.<тгГ1"'2 £ ^ 1|+'2+

¿=1 1<«<7<™

(\ 3

Теорема 2.4. Пусть ^ > 0 « < оо, 1 < г < < п.

Тогда

Дп < 2.1<2£я<£/(Ы > < <тп)+

7=1 ¿=1

+1417.5 - «т» ^ £ %^(|^|>(7П)+

1<»<7<п

4-14037.6 • ¿Г1 2 ВЫ*/(Ы<а»).

1<1<7<п

Следствие 2.3. Пусть <т2 > 0. Тогда

Дп<186.а-3Х:ад3 + 15456.сг^ £ ^Ы1-

¿=1 1<1<^'<п

В третьей главе получены оценки скорости сходимости в центральной предельной теореме для {/-статистик произвольной степени.

Пусть Х\,..., Хп - независимые случайные величины со значениями в измеримом пространстве (X, В). Предположим, что п>т> 2 и рассмотрим [/-статистику

1 <*J<...<»TO<n

где Фи..дго : Xm —► R - симметрические функции такие, что • • ■. < оо для всех 1 < »1 < ... < <т < п. Обозначим Х[с = Xix,..., Xic. Определим канонические функции

Р/с = 9ic(xh) =

= [•■■ fUnmSxJdmJ-PUdyi.)) П P*(dy.) =

JX JX i=l ee/m\/c

= E E (-irmi^l-^n),

<i=l Jd,Jd£lc

где /с = {»i,...,«c}, -to = {ju--,jd}, Jd = {1 < ji < ••• < id < j с = 1,..., т. Тогда в соответствии с представлением Гефдинга

т __т

un = Z Е =

С=1 l<tl<...<ic<n С=1

Полагаем а\ = £"=1 > 0. Обозначим,

Д„ = sup |P{a~\Un - EUn) <х)~ М(х)\.

zeR

Рассмотрим усеченные случайные величины

ff?c = 9iJ(\9ic\ < 1 < «1 < ... < «с < n,

где 1(A) - индикаторная функция множества А € В. Рассмотрим слабые моменты порядка р > О

Вс(0,р) = sup(t' Е p(\9ic\ > *»*))•

1<»1<—<»с<П 10

Положим

Заметим, что

¿0=2^,0=1,...,™.

1 + 2т- 1 = 6т К 6т~г < ' •' < 5з < 62 = Теорема 3.1. Если а\ > 0, тогда при всех 1 <р <2 ип>т

А» < Лп(«тй2ЕЕ9р(Ш > °п) + е;3£щ\*1(\д1\ < <т„)+

3=1 3=1

т

+"п1Е Е Е\91М91с\>оп)+

с=2 1<»1<...<1С<П

т

+Е<С:~1 Е ЭД

с=2 1<»1<...<1с<п

1 т

Е Е\д1с\Ч{\д1с\ < ап)),

V) с=21<<1<...<»с<п где Ат зависит только от т. Теорема 3.2. В условиях теоремы 3.1

Ап < Ап( *„-2 Е > +°п5 Е £Ы3'(Ы < *»)+

3=1 3=1 т _

Е Е\д1с\1(\91е\>°п)+

с=2 1<П<...«С<П

тп

с=2 1<«1<...«с<п 1 т

Е £ЫР'(Ы < *») )•

Г/ С=21<»1<...«с<п

11

Теорема 3.3. Пусть слабые моменты Вс(0,5С) < оо, с = 2,..., т Тогда

¿=1 т

+Еад лн

е=2

гп п

+£(*«3£яы3)1 ■ К3/2 Е ЕшЩ,

с=2 7=1 1<»1<...<»с<п

где Д„ зависит только от га.

Теорема 3.4. Пусть слабые моменты Вс(0,6С) < оо, с = 2,...,т Тогда

Д» < <

¿=1 т

+ЕШ&с)+

с=2

т п

с=2 5=1 1<П<...<«с<п

где Лт зависит только от т.

Теорема 3.5. Положим *ус = ¿¡¿^, и пусть рс, с = 2,..., га, -произвольные, такие что 0 < рс < ¿т, и 0 < р\ < 1. Тогда

п т _

Дп < £ яЫ7с+Рс+

¿=1 с=2 1<»1<...<»с<п

т

* и°Гс-сре/(3с-2) £

с=2 1<м<...<»с<п

где Лт зависит только от т.

Следствие 3.1. Пусть 6С = с = 1,..., т. Тогда

т

Д„<Ап£<7п-'° £ Е\д1с\*%

С=1 1<*1 <...<»,;<»»

где Ат зависит только от т.

Четвертая глава посвящена многовыборочным {/-статистикам, для которых доказывается центральная предельная теорема.

Пусть Хд,..., , j = 1,..., с - независимые выборки случайных величин, принимающих значения в измеримых пространствах {Х^,= 1,...,с, причем случайные величины внутри каждой выборки не обязательно имеют одинаковые распределения. Предположим, что nj>mj > 1, з = 1,..., с. Пусть

: Кх х Д7а х ... х К

с т = (гпг,..., 1пс) и 1т = (1Ш1,..., 1тс), = ..., з = 1,..., с - симметричные ядра, такие что

; = 1,...,с)| <оо

, где Хц = ,...,Хц.т} при 1<{п< ... < < Пу, з = 1,..., с. И рассмотрим многовыборочную ^/-статистику

Ий = = X! . Л», = Ь1,Ъзтр j=l,...,c),

где п = (п1,..., пс) € и суммирование ведется по всем 1 < «Л < ... < г^ < щ, з = с.

Пусть d= (di,.. .,dc). В соответствии с каноническим представлением Гефдинга

m с nj

Un - EU* = ЕЕ^ = E Е а, + Е ил(91г),

d=I I3 j=li,=l D+>2

где Ig = {1 < iji < ... < ijdj <nj, j = 1,... ,c}, D+ = di +... + dc, a канонические функции определены следующим образом

9ia — 9id(Xjidj, Idj = iji, • • •, ijdj, j = 1,..., c) =

= E E(-1)dl+-+dc_ri"-"rc (m\XjLrj, 3 = 1, • • •, c] - EU*) ,

f=0 Cf

где £f = {1 < /д < ... < ljrj < Щ,3 = l,...,c}, Lrj = Ijl,. . ., 6 Ify » J = lj • • • j c.

с

Пусть cr2 = и предположим, что a\ — £ cr2 > 0.

S ij=l i j-1

Теорема 4.1. Пусть = 2d^Li>

Лп(е) = £ £ Eg%I{\9ij\ > «*») 0, i=lii=l

для всякого e > 0 и n = min{ni,..., nc} —> 00 w

S«K*.7i>+) = supE^^b/J > tan) - 0,

t>x

при x —► оо.

Тогда при n = min {ni,..., nc} —*■ 00

- EUn) r,

где r - стандартная нормальная случайная величина.

В пятой главе изучается скорость сходимости к нормальному закону для многовыборочных [/-статистик. Обозначим

Дй = вир \Р(а?ф* ~ <х)~ М(х)\. хел

Обозначим М+ = Ш1+.. .+тс, = . .+<1С. Определим усеченные канонические функции

Ша = 91аЧЫ < сгп). Определим слабые моменты

Д,-(0,р) = 8ир(«*£Р(|<^| > <тй*)), *>о х,

где х > 0, р > 0.

Теорема 5.1. Если а? > 0, то для всякого 1<р<2ищ>

Дп < £ £ Е^1{\дч\ > <тй)+ 7=1^=1

+<тп3£ £ Е\я,\31(Ы < °п)+

ё:й+>2 XI

+ £ П 9и,91А+

¿.о+> 2 1а з=1 «¿=1

^ Р) лг>+>2 х<г где Дй зависит только от т.

Теорема 5.2. Пусть (30+ = при И+ = 1,..., М+, и пусть слабые моменты 0,/?£>+) < сю. Тогда

а« < Е Е < *«)+

5=10=1 ¿0+>2

с ^ зо. зо+-з

г<?е зависит только от т.

Теорема 5.3. Положим 7д+ = г, и пусть ро+ - произвольные величины, такие что 0 < рв+ < 2В+-1 для всех !)+ = 1,...,М+. Тогда

Ап < А^г2-" £ £

5=1 0=1

¿£>+>2 а*

где зависит только от т.

Следствие 5.1. Пусть = 55^1 пРи — 1,..., М+. Тогда

Глава 6 посвящена приложениям [/-статистик. Рассматривается несколько примеров [/-статистик на графах.

Рассмотрим случайный граф С? =< V, Е >, вершинами которого является последовательность независимых случайных величин = {Хх,..., Хп}. Пусть X] принимают значения 1 и -1 с вероятностями pj и qj = 1 — р^, з = 1,...,п, соответственно. Дуги соединяют вершины противоположных знаков. Тогда размер графа, т.е. количество дуг определяется [/-статистикой

саЫ{Е{в)) = [/„ = £ < 0).

1<*<3'<п

В случае, когда р^ = 1/2, з = 1,...,п, рассматриваемая [/-статистика является вырожденной, и результат будет иметь следующий вид

где т - стандартная нормальная случайная величина. В остальных случаях

1<«7<п

при п —* оо, где

п _

= (! - АР&) + 2 Е + Я(Як -РхЧк ~Ркчд)-

3=1 Цфз «к, х,кфз

при П —* ОО.

Теперь рассмотрим двудольный граф в ко-

тором вершины состоят из независимых последовательностей, каждая из которых состоит из независимых случайных величин:

У2 = {Уъ...,Гт}.

Пусть случайные величины Х{ имеют геометрические распределения с параметрами р^ г = 1,..., п, т.е. Р(Хг = к) = р£(1 — р^), к = 0,1,2,..., а Yj имеют распределения Пуассона с параметрами ] = 1,...,т, т.е. — к) = ^-ехр(—/хД к = 0,1,2,... Дуги соединяют вершины с одинаковыми значениями, таким образом размер графа будет определяться как

п т

сатй{Е{С)) = ип,т -ЕЕ ОД = УД

¿=1 з=\

Тогда, если

п то

<т = £ ЕС1 - ») ехр(-2/^) 7о(2Ц/^)+ ¿=11=\ п т

1=17=1 п т

-2 £ £(1 - Рг)2 ехр(-2//,-(1 - й))+ <=17=1 п _

+2 £ Е ~ Л) -

«=11<7 <1<т

"2£ £ (1-Рг)2екр(-(Н+р1)(1-р{))+ »=1 1<7 <Кт т

+2Е Е (1-л)(1-Р.)вхр(-^(1-йР.))-

7=11<»<я<п т _

-2Е Е (1-й)(1-А)«Р(-А*(2-Л-Л)),

7=11<«<в<п

где «70(<гО = 1)*2Ц("|)а ~ Функция Бесселя, а 1 - мнимая

единица, то

<Чт(^п,т ~ Ё ЕС1 ~ Л) ехрС-МЛ1 - Рг))) Г

<=17=1

при тт{п, т} —► оо, где г - стандартная нормальная случайная величина.

ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ

[1] Гадасина Л. В. О нормальной аппроксимации [/-статистик второй степени, 2001, тезисы к докладу. - "Фундаментальные исследования в технических университетах", изд. СПбГТУ.

[2] Гадасина Л.В. Граница Берри-Эссеена для [/-статистик, 2003, Зап. научн. сем. ПОМИ., 298, с. 54-79.

[3] Гадасина Л. В. Неравенства Берри-Эссеена для [/-статистик, 2003, Теор. вер. и ее прим., 48, №1, с. 151-155.

[4] Гадасина Л.В. О нормальной аппроксимации [/-статистик, 2004, Обозрен. прикл. и пром. мат., И, №2, с. 316-317.

[5] Гадасина Л. В. Центральная предельная теорема для многовыборочных [/-статистик, 2005, Обозрен. прикл. и пром. мат., 12, №2, с. 330-331.

[6] Гадасина Л. В. Оценки типа Берри-Эссеена для многовыборочных [/-статистик, 2005, Зап. научн. сем. ПОМИ., 328, с. 69-90.

Лицензия ЛР №020593 от 07.08.97

Подписано в печать 09 01.2007. Формат 60x84/16 Печать цифровая. Уел печ л 1,0. Тираж 100 Заказ 1132Ь.

Отпечатано с готового оригинал-макета, предоставленного автором, в Цифровом типографском центре Издательства Политехнического университета 195251, Санкт-Петербург, Политехническая ул., 29. Тел.: 550-40-14 Тел /факс: 297-57-76

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Гадасина, Людмила Викторовна

Введение.

1 Основные понятия.

1.1 Одновыборочные {/-статистики.

1.1.1 Мартингальная структура [/-статистик.

1.1.2 Центральная предельная теорема.

1.1.3 Оценки скорости сходимости в центральной предельной теореме.

1.2 Многовыборочные [/-статистики.

1.2.1 Мартингальная структура многовыборочных [/-статистик.

1.2.2 Центральная предельная теорема.

1.2.3 Оценки скорости сходимости в центральной предельной теореме.

1.3 Примеры [/-статистик.

1.4 Вспомогательные сведения.

1.4.1 Лемма о срезках.

1.4.2 Метод характеристических функций (неравенство Эссеена)

1.4.3 Метод рандомизации.

1.4 4 Вспомогательные неравенства и соотношения.

2 Неравенства типа Берри-Эссеена для [/-статистик второй степени.

2.1 Введение.

2.2 Результаты.

2.3 Доказательства.

3 Неравенства типа Берри-Эссеена для [/-статистик произвольной степени.

3.1 Введение.

3.2 Результаты.

3 3 Доказательства.

4 Центральная предельная теорема для многовыборочных и - статистик.

4.1 Введение.

4 2 Результат.

4.3 Доказательство.

5 Неравенства типа Берри-Эссеена для многовыборочных [/-статистик.

5.1 Результаты.

5.2 Доказательства

6 Специальные приложения: [/-статистики на графах.

 
Введение диссертация по математике, на тему "Оценки скорости сходимости в центральной предельной теореме для одновыборочных и многовыборочных U-статистик от разнораспределенных случайных величин"

Теория (/-статистик начала развиваться после выхода работ Халмоша [32] в 1946 году, где была определена (/-статистика как оценка регулярного функционала, и Гефдинга [34] в 1948 году, где были описаны некоторые свойства (/статистик, доказана центральная предельная теорема, приведены многочисленные примеры.

Являясь обобщением сумм случайных величин, [/-статистики в случае невырожденности асимптотически им эквивалентны Кроме того, (/-статистики проявляют мартингальные свойства, что позволяет применять к ним мартин-гальные предельные теоремы.

Интерес к этому математическому объекту постоянно возрастает и находит широкое применение в различных разделах теории вероятностей и математической статистики, например, в теории оценивания: [27, 41], в теории проверки гипотез: [30, 43, 44, 49, 46] или в теории случайных графов: [24, 50]

Одним из классических вопросов теории вероятностей является нахождение скорости сходимости статистик в центральной предельной теореме. Для (/статистик, построенных по выборке из независимых случайных величин, этот вопрос в настоящее время глубоко исследован.

Целью данной работы является исследование невырожденных одновыбо-рочных и многовыборочных (/-статистик в случае неодинаково распределенных случайных величин. Для одновыборочных (/-статистик - получение оценок скорости сходимости в центральной предельной теореме при минимальноых моментных предположениях на ядро. Для многовыборочных - доказательство центральной предельной теоремы с оцениванием скорости сходимости в ней

Диссертация состоит из шести глав Первая глава носит обзорный характер. В ней даны основные определения, представлены некоторые свойства и примеры (/-статистик, сделан обзор имеющихся результатов, а также описаны основные методы исследования, применявшиеся автором.

Во второй главе получены оценки скорости сходимости в центральной предельной теореме для (/-статистик второй степени. В третьей главе получены оценки скорости сходимости в центральной предельной теореме для (/статистик произвольной степени.

Четвертая и пятая главы посвящены многовыборочным (/-статистикам. В четвертой главе доказывается центральная предельная теорема, а в пятой изучается скорость сходимости к нормальному закону

В шестой главе расматриваются приложения к конкретным задачам. Рассматриваются примеры (/-статистик, появляющихся при изучении характеристик случайных графов.

По теме диссертации опубликовано 6 работ, они перечислены в конце списка литературы под номерами [52]-[57]. Результаты диссертации докладывались на шестом Всероссийском симпозиуме по прикладной и промышленной математике в Санкт-Петербурге в 2005 г.; на пятой Всероссийской конференции по проблемам науки и высшей школы "Фундаментальные исследования в технических университетах" в Санкт-Петербурге в 2001; на городском семинаре по теории вероятностей и математической статистике под руководством акад. И.А. Ибрагимова в 2001 г.

1 Основные понятия

1.1 Одновыборочные [/-статистики

Пусть Х\,., Хп - независимые случайные величины со значениями в измеримом пространстве (Х,В), не обязательно имеющие одинаковое распределение. Предположим, что тг > т > 1 и для всех 1 < г\ < . < гт < п рассмотрим функции Фг, 1т : Хт —У И - симметрические относительно своих аргументов, такие что

Е\Фи 1т(Хп,. -,Х1т)\ < оо. Определим [/-статистику ип = ил(Фи гт) = £ Ф„ .„(-у,,.х1т) (1.1)

1<11< <«т<"

Рассмотрим случай, когда Х\,., Хп - независимые одинаково распределенные случайные величины, принимающие значения в измеримом пространстве (X, В) и имеющие на нем распределение Р. Пусть V - некоторое подмножество множества всех вероятностных распределений на (X, В). Определим для Р е V функционал 9(Р), заданный на? и принимающий значения в И. Пусть в(Р) является параметрическим или регулярным, т е для него существует несмещенная оценка и пусть ш, (т <п) - наименьший объем выборки, для которою существует несмещенная оценка Ф(:Г1,. ,хт), тогда можно записать следующее представление для в(Р) в(Р) =[•■•[ Цхи. ,^т)Р(^1). Р{(1хт) для любого Р е Р, Функция Ф(жх,. ,хт) назывется ядром, а число т> 1 -степенью функционала 6(Р). Не уменьшая общности можно предполагать, что Ф является симметрической функцией относительно своих аргументов, т.к. в противном случае можно рассмотреть симметрическое ядро Фо, определяемое следующим образом где суммирование осуществляется по всем перестановкам (г1}.,гт) чисел (1 ,.,ш).

Тогда, если для симметрического ядра Ф(х\,.,хт) определить II-статистику как ип = ип(Ф)=(") £ Ф(Хг1,.,Х1т), (1.2) / 1<Ц< <1т<П то и„ будет симметрической несмещенной оценкой в(Р), т.к. Е11п = в(Р) для любого Р и п> т.

Замечание. Часто и для случая неодинаково распределенных случайных величин ¿/-статистики определяют с соответствующей нормировкой, будем обозначать такие [/-статистики через ип К гт(Хп,.,Х1т). (13) / 1 <11 < <1т<П

В. Гефдинг [35] показал, что справедливо следующее представление V- статистик т т ип-Еип = ^Ы9г1 .с) = Е Е 9ч =

С= 1 С=1 1<Ц < <1с<п п £&+ Е Л1«2 + ■ ■ ■ + Е 5.1.2 «т» (Ы)

1=1 1<11<12<П 1<«1< <1т<П где дч 1С = дн гс{Хг1,., Х1с) с 1 < гх < . < гс < п, с = 1,., т, - канонические функции, которые определяются как дп ,с= I .[ иаЦ(*х,РиУуи)) П РМУ») = х «=1 *ат\1с Е Е (-1ГЩип\хп,.,хи]-Еип), (1.5)

11<л< где 1т = ги.,гт, 1С = ги.,гс, при этом 1С £ 1т, = и 5Х - ¿-мера

Дирака:

-<л>=и хлаа для любых х € X и А € В.

Канонические функции являются симметическими функциями своих аргументов и обладают свойством полной вырожденности е{9п 1С(ХЧ1- --,Х},. .,х1с)} = О при ] 6 1С.

Рангом {/-статистики называется первое целое число г, для которого выполняются соотношения

9и = 9Ь = • ■ ■ = 91 Г1 = О для любых комбинаций индексов /¡¡/г,.',/гь и существует такой набор индексов {гь г2,., гг} в {1,2,., п}, что

9г 1 1г Ф О

Из определения следует, что г принимает значения 1,2,., т. Если г > 2, то [/-статистика называется вырожденной, если г = 1, то [/-статистика называется невырожденной. В данной работе будем рассматривать только невырожденные [/-статистики. Положим з=\ тогда из условия невырожденности [/-статистики следует О

В случае одинаково распределенных случайных величин разложение Геф-динга имеет следующий вид т /шч

Ъ-0(Р) = Е ' ип(дс) =

С=1 \ с т / \ / \ — 1 т \ п 4 Е с Е дЛ,

С=1 \ / \ / 1<«1< <1 т<п где . с т

9с{х 1,.,хс)= . Ф{уи.,ут)][{йт№у*)-р{<1у*)) П р{4у*) =

11<л< <ц<с

Дисперсия [/-статистики. Положим в1т=ЕФ1т(Хп,.,Х1т),

Тогда по определению дисперсия [/-статистики о\ип) = Е(ип - Еип)2 = т С—1 где означает суммирование по всем индексам Ьс = . ,1с, 1тп-с = Ч,---,1т-с, Лп-с -^ш-с таким, ЧТО

1 < . <1с<п, 1<1х < .< 1т-с <71, 1<31< .< Зт-с < п, к Ф г», к ф Зз, Ч ф За при всех к, я.

Если Хх,., Хп - независимые одинаково распределенные случайные величины, то каждое слагаемое под совпадает с где т1с = Е(Фс-ЕФс)2,

ФС = ФС{ХЬ. .,Хе) = ЕФ(хь. Число таких слага . Тогда

 
Заключение диссертации по теме "Теория вероятностей и математическая статистика"

Заключение.

Результатами настоящей работы являются оценки скорости сходимости [/статистик в случае неодинаково распределенных случайных величин к нормальному закону при различных предположениях о существовании моментов канонических функций. При этом полученные теоремы обобщают имеющиеся результаты, касающиеся случая одинаково распределенных случайных величин, в частности дают оценку порядка 0(1/\/п) при минимальных моментных условиях на ядро.

Для многовыборочных [/-статистик доказана центральная предельная теорема при близких к оптимальным условиях на канонические функции для выборок состоящих из независимых не обязательно одинаково распределенных случайных величин. Кроме того, получены оценки скорости сходимости в центральной предельной теореме. Примеры 3 и 4 главы б рассматривают некоторые задачи, в которых появляется необходимость изучения таких [/-статистик

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Гадасина, Людмила Викторовна, Санкт-Петербург

1. Боровских Ю.В. Аппроксимация рапсределений ¿/-статистик, 1979, Докл. АН УССР, Сер А, 9, с 695-698.

2. Воровских Ю В Теория {/-статистик в гильбертовом пространстве. Киев, 1986, 56 с. (Прерп./АН УССР. Ин-т математики; 86 78).

3. Боровских Ю.В. Аппроксимация многовыборочных /В-статистик. Киев,1988, 56 с. (Прерп./АН УССР. Ин-т математики, 88 72).

4. Боровских Ю.В. Центральная предельная тоерема для /-статистик, 1989, Укр. мат. журн., 41, №2, с. 269-271.

5. Воровских Ю.В. О нормальной аппроксимации /-статистик, 2000, Теор вер. и ее прим., 45, JV°3, с. 469-488.

6. Боровских Ю.В., Королюк В С. Асимптотический анализ распределений статистик. Киев. Наук, думка, 1984. 304 с.

7. Боровских Ю В., Королюк B.C. Мартингальная аппроксимация. Киев: Наук, думка, 1988. 248 с

8. Боровских Ю В, Королюк B.C. Теория /-статистик. Киев: Наук, думка,1989. 384 с.

9. Малевич Т.Д., Абдалимов Б.А. Уточнение предельной теоремы для /статистик, 1970, Изв. АН УзССР, сер. физ -мат. наук, №2, с 6-12.

10. Малевич Т.Д., Абдурахманов Г.Р. Центральная предельная теорема для обобщенных (неоднородных) /-статистик от различно распределенных случайных величин, 1986, Изв. АН УзССР, сер. физ.-мат. наук, №2, с. 28-33

11. Петров В.В. Предельные теоремы для сумм независимых случайных величин. М.: Наука, 1987. 317 с.

12. Феллер В. Введение в теорию вероятностей и ее приложения. Т. 2, пер с англ -М.: Мир, 1984. 738 с.

13. Хашимов Ш.А., Абдурахманов Г.Р. Об оценке скорости сходимости в центральной предельной теореме для обобщенных /-статистик, 1998, Теор вер. и ее прим., 43, N°1 с. 69-81.

14. Albermk I.B. A Berry-Esseen bound for /-statistics in non-i.i d. case, 2000, Теор. вер. и ее прим., 13, №2, р 519-533.

15. Albermk I.В., Bentkus V. Berry-Esseen bounds for von Mises and /-statistics, 2001, Liet. matem. rink., 41, №1, p 1-20.

16. Alberink I.В., Bentkus V. Lyapunov type bounds for /-statistics, 2001, Teop. вер и ее прим , 46, JV°4, p. 724-743.

17. Arcones M.A. Limits of Canonical /-Processes and B-valued [/-statistics, 1994, J. Theor. Probab., 7, №2, p. 339-349.

18. Bentkus V., Götze F. On minimal moment assumptions in Berry-Esseen theorems for /-statistics, 1995, Theory Probab. Appl, 40, №3, p. 596-614.

19. Bentkus V., Götze F., Zitikis R. Lower estimates of the convergence rate for U-statistics, 1994, Ann. Probab., 22, №4, p. 1707-1714.

20. Bichel P.J. Edgeworth expansion in nonparametric statistics, 1974, Ann Statist., 2, №1, p. 1-20.

21. Borovsbkh Yu V. /-statistics in Banach Spaces. VSP. Utrecht, The Netherlands, 1996, xii+420 p.

22. Borovshkh Yu V., Korolyuk V.S. Martingale Approximation. VSP. Utrecht, The Netherlands, 1997, xi+342 p.

23. Callaert H., Janssen P. The Berry-Esseen theorem for /-statistics, 1978, Ann. Statist., 6, №2, p 417-421.

24. Ceyhan E., Priebe C.E, Wierman J.C. Relative density of the random r-factor proximity catch digraph for testing spatial patterns of segregation and associations, 2006, Computation Stat к data Analysis, 50, p 1925-1964.

25. Chan Y К, Wierman J. On the Berry-Esseen theorem for /-statistics, 1977, Ann. Probab , 5, №1, p. 136-139.

26. Dwass M. The large-sample power of rank test in the two-samples problem, 1956, Ibid., 27, №2, p. 352-374.

27. Fräser D Nonparametric methods in statistics. New York: Wiley, 1957, 299 p.

28. Friedrich К. О. A Berry-Esseen bound for functions of independent random variables, 1989, Ann. Statist., 17, M, p. 170-183.

29. Ghosh M., Dasgupta R. Berry-Esseen theorem for /-statistics in the non 1.1 d. case, 1982, Colloguia mathematica socieatatis Jänos Bolyai, 32. Nonparametric statistical inference.- Amsterdam: North Holland publishing company, 1, p. 293-313.

30. Gombay E. /-statistics for change ander alternatives, 2001, J. Multivariate Anal., 78, p. 139-158.

31. Grams W.E., Serflmg R J. Convergence rate for /-statistics and related statistics, 1973, Ann. Statist., 1, №1, p. 153-160.

32. Halmos P.R The theory of unibiased estimation, 1946, Ann Math Statist., 17, p 34-43

33. Helmers B, van Zwet W B. The Berry-Esseen bound for /-statistics, 1990, Statistical Decision Theory and Related Topics. III. Gupta, S S. and Berger, I.O. (Eds). Academic Press. New York-London, 1, p. 497-512.

34. Hoeffding W. A class of statistics with asymptotically normal distribution, 1948, Ann. Math. Statist., 19, p 293-325.

35. Hoeffding W. The strong law of large numbers for /-statistics, 1961, Inst. Statist. Mimeo Ser. N>302, p 1-10.

36. Maesono N. On the normal approximation of /-statistics of degree two, 1991, J. Statist. Plann. Inference, 17, N»1, p. 37-50.

37. Mahmoud M.A.W, El-Arishy S M., Diab L S Testing renewal new better than used life distributions based on U-test, 2005, Appl. Math. Mod., 29, p. 784-796

38. Molmary N. A /-statistic test in competing risk models, 2005, C R. Acad Sci. Paris, Ser. I 341, p. 317-322.

39. Puri M.L , Sen P Nonparametric methods in multivariate analysis New York-Wiley, 1971, 432 p.

40. Sen P. On some multisample permutation test based on a class of /-statistics, 1967, J. Amer. Statist. Assoc., 62, N320, p. 1201-1213.

41. Sen P. /-statistics and combination of independent estimators of regular functional, 1967, Calcutta Statist Assoc. Bull, 16, JV°61, p 1-14

42. Sen P. Sequential Nonparametrics- invariance principles and statistical inference. New York: John Wiley and Sons, 1981, 421 p

43. Sugiura N. Multisample and multivariate nonparametric test based on U-statisticsand their asymptotic efficiences, 1965, Osaka J. Math , 2, N°2, p. 385426

44. Svante J, Krzysztov N The asymptotic distributions of generalized /-statistics with applications to random graphs, 1991, Probab Theory Relat Fields, 90, p 341-375.

45. Zhao L., Chen X. Berry-Essen bounds for finite-population /-statistics, 1987, Scientia Sinica, Ser. A, 2, p. 113-127.

46. Гадасина JI.В. О нормальной аппроксимации /-статистик второй степени, 2001, тезисы к докладу. "Фундаментальные исследования в технических университетах", изд СПбГТУ.

47. Гадасина JIВ Граница Берри-Эссеена для /-статистик, 2003, Зап научн сем ПОМИ , 298, с 54-79.

48. Гадасина JIВ Неравенства Берри-Эссеена для /-статистик, 2003, Теор. вер. и ее прим , 48, JV°1, с. 151-155.

49. Гадасина ЛВ О нормальной аппроксимации /-статистик, 2004, Обозрен. прикл. и пром мат., 11, N°2, с. 316-317.

50. Гадасина Л.В. Центральная предельная теорема для многовыборочных /статистик, 2005, Обозрен. прикл. и пром. мат, 12, №2, с. 330-331

51. Гадасина Л.В. Оценки типа Берри-Эссеена для многовыборочных U-статистик, 2005, Зап. научн. сем. ПОМИ., 328, с. 69-90.