Оценки скорости сходимости в центральной предельной теореме для одновыборочных и многовыборочных U-статистик от разнораспределенных случайных величин тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Гадасина, Людмила Викторовна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
2006
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
На правах рукописи
□0305312В
и и ▼ и ь/ сии'
ГАДАСИНА ЛЮДМИЛА ВИКТОРОВНА
Оценки скорости сходимости в центральной предельной теореме для одновыборочных и многовыборочных 17-статистик
от разнораспределенных
случайных величин.
01.01.05 - теория вероятностей и математическая статистика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
САНКТ-ПЕТЕРБУРГ 2007
003053128
Работа выполнена на кафедре "Прикладная математика" Петербургского государственного университета путей сообщения
Научный руководитель: доктор физико-математических наук, профессор Ю.В. Боровских
Официальные оппоненты: доктор физико-математических наук, профессор Л.В. Розовский
кандидат физико-математических наук, доцент О.А. Подкорытова
Ведущая организация: Санкт-Петербургский государственный электротехнический университет (ЛЭТИ)
Защита состоится 2007 г. в ^"часов на заседании
диссертационного совета Д 002.202.01 в Санкт-Перербургском отделении Математического института им. В.А. Стеклова РАН по адресу: 191023, Санкт-Петербург, наб. р. Фонтанки, д. 27, к. 311.
С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского отделения Математического института им. В.А. Стеклова РАН.
Автореферат разослан -¿¿^/у 2007 г.
Ученый секретарь
диссертационного совета Д 002.202.01 доктор физико-математических наук
А.Ю. Зайцев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Теория [/-статистик начала свое развитие после выхода работ Халмоша в 1946 году и Гефдинга в 1948 году, и интерес к ней не уменьшается и по сей день. Активное изучение этого математического объекта ведется как и в нашей стране так и зарубежом. Имеется большое количество работ, в которых были доказаны такие классические теоремы как закон больших чисел, центральная предельная теорема, принцип инвариантности, закон повторного логарифма. А также активно изучается вопрос оценки скорости сходимости невырожденных [/-статистик к нормальному закону. В 1974 году Шске1 получил оценку порядка 0(п-1/2) в предположении, что ядро ¿/-статистики ограничено. После этого шло активное ослабление условий на ядро. В 1997 году вышла работа Ю.В. Боровских, в которой была получена оценка порядка 0(п~х/2) при минимальных предположениях на канонические функции разложения Гефдинга ¿/-статистик. Однако, вопросы построения оценок скорости сходимости для [/-статистик, зависящих от независимых, но не обязательно одинаково распределенных случайных величин, полностью не решены до сих пор.
Вопросу изучения многовыборочных [/-статистик от выборок из разнораспределенных случайных величин до сих пор не уделялось особого внимания. Хотя изучение этого класса £/-статистик имеет немаловажное значение, поскольку связано с их применением в различных областях теории вероятностей и маг тематической статистики, например, теории проверки гипотез и случайных графов. В ходе работы над диссертацией выяснилось, что для таких [/-статистик не была доказана центральная предельная теорема при подходящих условиях на ядро.
Цель работы. Была поставлена цель оценить скорость сходимости невырожденных одновыборочных [/-статистик в случае разнораспределенных случайных величин к нормальному
закону; доказать центральную предельную теорему для многовыборочных [/-статистик в случае неодинаково распределенных случайных величин и оценить скорость сходимости в ней.
Методы исследования. Основными методами, применяемыми в данной работе являются следующие:
- метод срезок;
- метод характеристических функций;
- метод рандомизации.
Ключевым моментом является разложение Гефдинш.
Основные результаты работы. 1. Построена оценка скорости сходимости к нормальному закону невырожденных II-статистик второго порядка в случае независимых неодинаково распределенных случайных величин.
2. Построена оценка скорости сходимости к нормальному закону невырожденных [/-статистик произвольного порядка в случае независимых неодинаково распределенных случайных величин.
3. Доказана центральная предельная теорема для невырожденных многовыборочных [/-статистик в случае независимых неодинаково распределенных случайных величин.
4. Построена оценка скорости сходимости к нормальному закону невырожденных многовыборочных [/- статистик в случае независимых неодинаково распределенных случайных величин.
5. Исследуется несколько примеров [/-статистик, появляющихся при рассмотрении случайных графов. Получены асимптотики таких ¿/-статистик.
Научная новизна. Все основные результаты диссертации являются новыми.
Практическая и теоретическая ценность. Полученные результаты обобщают оценки скорости сходимости невырожденных [/-статистик и центральную предельную теорему для
многовыборочных [/-статистик на случай неодинаково распределенных случайных величин. Получен широкий спектр оценок при различных условиях на канонические функции разложения Гефдинга [/-статистик.
Аппробация работы. Результаты диссертационной работы были представлены автором на Всероссийской конференции по проблемам науки и высшей школы в Санкт-Петербурге (2001 г.), на городском (Санкт-Петербургском) семинаре по теории вероятностей и математической статистике под руководством акад. И.А. Ибрагимова (2001, 2006 г.), на Пятом Всеросийском симпозиуме по прикладной и промышленной математике (2004, 2005 г.).
Публикации. Основные результаты диссертации изложены в работах [1]-[6].
Структура и объем диссертации. Диссертация состоит из введения, шести глав и списка литературы, содержащего 57 наименований. Общий объем работы - 117 страниц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении приводится краткий обзор рассматриваемых вопросов, а также структура работы.
В первой главе обсуждается постановка задачи, приводятся основные определения и формулы, сделан краткий исторический обзор, описываются методы исследования.
Во второй главе получены оценки скорости сходимости в центральной предельной теореме для С/-статистик второй степени
ип= £
1<«<7<п 5
где Фу : X2 —► И - симметрические функции такие, что
Е\Фц(ХиХД\<оо
для всех l<i<j<nt а Х\,...,Хп - независимые не обязательно одинаково распределенные случайные величины со значениями в измеримом пространстве (X, В). Если определить канонические функции
9з = ШШ = Т,{Е[Фц(ХиХ1)\ХА - ЕФ„}+ »=1
i=j+г где ;' = 1,...,пи
9ц = 9ц{ХиХ1) = Ф„(Х„ X,) -
-Е[Ф„(ХиХА\ХД + ЕФф
где 1 < г < ] < п, то разложение Гефдинга будет иметь следующий вид
ип-тп = ^+ £ 9гг
Обозначим = Ед]. Обозначим,
Дп = вир \Р(а~\ип - Еип) <х)~ Щх)|,
х€Н.
где М(х) - функция распределения стандартной нормальной случайной величины.
Рассмотрим усеченные случайные величины 9? = 9А\9З I < <*п) 3 = 1, • • •, п,
9?} = 9цЩ9а\ < ^п) 1 <г<з<п,
где 1(А) - индикаторная функция множества А £ В. Введем слабые моменты порядка р > О
Я(0,р)=8ир(** £ Р(Ы > *„*))•
1 <1<]<п
Теорема 2.1. Если > 0, тогда при всех |<р<2«п>2 Ап<2.1.о?±ЕдР(Ш>ап)+
3=1
+152.5- <<т„)+
3=1
+1417.5 • £ ЕШ1(\9а\><гп)+
1<»<^7<п
+78.5 • <т~3 £ Е\9?9?9Ы+ 1 <«<?'<»»
+(5174.9 + ———+ )' <тпР £ ЕЫЧ(М<ап).
Следствие 2.1. Пусть р > 4/3 и, кроме того, выполнены следующие условия:
Лг,„(е) = а"2 £ > еап) - О,
3=1
Л2,п(е) = ет-'/з > «тп) -> 0 (1)
1<*<3<п
для любого фиксированного е>Оип—*оои существует константа а > 0 такая, что Л2,п(0) < а, тогда
Дп-О.
При р — 4/3 утверждение следствия остается верным, если в условие (1) на д^ положить е = О.
В следующих теоремах получены оценки в центральной предельной теореме.
Теорема 2.2. Пусть выполнены условия теоремы 2.1 и, кроме того, при некотором 4/3 < 6 <р слабый момент 5(0, < ос. Тогда
Д„ < 2.ha^Egp(\9j\ > < *«)+
3=1 3=1
^+(5174-9+^+• «н-
3=1 l<t<j<n
Следствие 2.2. Пусть в теореме 2.2 S = 5/3. Тогда
An < 2.1 <2Е£#/(Ы > *„)+152.5<3£ад3/(Ы < ап)+
з=1 3=1
+400685-5(0,5/3)+ +78.5(<т„-3Х:^|3.(т„-1 £
j=l l<«i<n
Теорема 2.3. Пусть а* > 0 и, кроме того, при некоторых 0 < ¿1 < 1 и 0 < 62 < 1/3 < оо, з = 1,... ,п и <
оо, 1 < г < j < п. Тогда при п> 2
Ап<154.5-(7-2-г1Х:^Г51 + 15408.<тгГ1"'2 £ ^ 1|+'2+
¿=1 1<«<7<™
(\ 3
Теорема 2.4. Пусть ^ > 0 « < оо, 1 < г < < п.
Тогда
Дп < 2.1<2£я<£/(Ы > < <тп)+
7=1 ¿=1
+1417.5 - «т» ^ £ %^(|^|>(7П)+
1<»<7<п
4-14037.6 • ¿Г1 2 ВЫ*/(Ы<а»).
1<1<7<п
Следствие 2.3. Пусть <т2 > 0. Тогда
Дп<186.а-3Х:ад3 + 15456.сг^ £ ^Ы1-
¿=1 1<1<^'<п
В третьей главе получены оценки скорости сходимости в центральной предельной теореме для {/-статистик произвольной степени.
Пусть Х\,..., Хп - независимые случайные величины со значениями в измеримом пространстве (X, В). Предположим, что п>т> 2 и рассмотрим [/-статистику
1 <*J<...<»TO<n
где Фи..дго : Xm —► R - симметрические функции такие, что • • ■. < оо для всех 1 < »1 < ... < <т < п. Обозначим Х[с = Xix,..., Xic. Определим канонические функции
Р/с = 9ic(xh) =
= [•■■ fUnmSxJdmJ-PUdyi.)) П P*(dy.) =
JX JX i=l ee/m\/c
= E E (-irmi^l-^n),
<i=l Jd,Jd£lc
где /с = {»i,...,«c}, -to = {ju--,jd}, Jd = {1 < ji < ••• < id < j с = 1,..., т. Тогда в соответствии с представлением Гефдинга
т __т
un = Z Е =
С=1 l<tl<...<ic<n С=1
Полагаем а\ = £"=1 > 0. Обозначим,
Д„ = sup |P{a~\Un - EUn) <х)~ М(х)\.
zeR
Рассмотрим усеченные случайные величины
ff?c = 9iJ(\9ic\ < 1 < «1 < ... < «с < n,
где 1(A) - индикаторная функция множества А € В. Рассмотрим слабые моменты порядка р > О
Вс(0,р) = sup(t' Е p(\9ic\ > *»*))•
1<»1<—<»с<П 10
Положим
Заметим, что
¿0=2^,0=1,...,™.
1 + 2т- 1 = 6т К 6т~г < ' •' < 5з < 62 = Теорема 3.1. Если а\ > 0, тогда при всех 1 <р <2 ип>т
А» < Лп(«тй2ЕЕ9р(Ш > °п) + е;3£щ\*1(\д1\ < <т„)+
3=1 3=1
т
+"п1Е Е Е\91М91с\>оп)+
с=2 1<»1<...<1С<П
т
+Е<С:~1 Е ЭД
с=2 1<»1<...<1с<п
1 т
Е Е\д1с\Ч{\д1с\ < ап)),
V) с=21<<1<...<»с<п где Ат зависит только от т. Теорема 3.2. В условиях теоремы 3.1
Ап < Ап( *„-2 Е > +°п5 Е £Ы3'(Ы < *»)+
3=1 3=1 т _
Е Е\д1с\1(\91е\>°п)+
с=2 1<П<...«С<П
тп
с=2 1<«1<...«с<п 1 т
Е £ЫР'(Ы < *») )•
Г/ С=21<»1<...«с<п
11
Теорема 3.3. Пусть слабые моменты Вс(0,5С) < оо, с = 2,..., т Тогда
¿=1 т
+Еад лн
е=2
гп п
+£(*«3£яы3)1 ■ К3/2 Е ЕшЩ,
с=2 7=1 1<»1<...<»с<п
где Д„ зависит только от га.
Теорема 3.4. Пусть слабые моменты Вс(0,6С) < оо, с = 2,...,т Тогда
Д» < <
¿=1 т
+ЕШ&с)+
с=2
т п
с=2 5=1 1<П<...<«с<п
где Лт зависит только от т.
Теорема 3.5. Положим *ус = ¿¡¿^, и пусть рс, с = 2,..., га, -произвольные, такие что 0 < рс < ¿т, и 0 < р\ < 1. Тогда
п т _
Дп < £ яЫ7с+Рс+
¿=1 с=2 1<»1<...<»с<п
т
* и°Гс-сре/(3с-2) £
с=2 1<м<...<»с<п
где Лт зависит только от т.
Следствие 3.1. Пусть 6С = с = 1,..., т. Тогда
т
Д„<Ап£<7п-'° £ Е\д1с\*%
С=1 1<*1 <...<»,;<»»
где Ат зависит только от т.
Четвертая глава посвящена многовыборочным {/-статистикам, для которых доказывается центральная предельная теорема.
Пусть Хд,..., , j = 1,..., с - независимые выборки случайных величин, принимающих значения в измеримых пространствах {Х^,= 1,...,с, причем случайные величины внутри каждой выборки не обязательно имеют одинаковые распределения. Предположим, что nj>mj > 1, з = 1,..., с. Пусть
: Кх х Д7а х ... х К
с т = (гпг,..., 1пс) и 1т = (1Ш1,..., 1тс), = ..., з = 1,..., с - симметричные ядра, такие что
; = 1,...,с)| <оо
, где Хц = ,...,Хц.т} при 1<{п< ... < < Пу, з = 1,..., с. И рассмотрим многовыборочную ^/-статистику
Ий = = X! . Л», = Ь1,Ъзтр j=l,...,c),
где п = (п1,..., пс) € и суммирование ведется по всем 1 < «Л < ... < г^ < щ, з = с.
Пусть d= (di,.. .,dc). В соответствии с каноническим представлением Гефдинга
m с nj
Un - EU* = ЕЕ^ = E Е а, + Е ил(91г),
d=I I3 j=li,=l D+>2
где Ig = {1 < iji < ... < ijdj <nj, j = 1,... ,c}, D+ = di +... + dc, a канонические функции определены следующим образом
9ia — 9id(Xjidj, Idj = iji, • • •, ijdj, j = 1,..., c) =
= E E(-1)dl+-+dc_ri"-"rc (m\XjLrj, 3 = 1, • • •, c] - EU*) ,
f=0 Cf
где £f = {1 < /д < ... < ljrj < Щ,3 = l,...,c}, Lrj = Ijl,. . ., 6 Ify » J = lj • • • j c.
с
Пусть cr2 = и предположим, что a\ — £ cr2 > 0.
S ij=l i j-1
Теорема 4.1. Пусть = 2d^Li>
Лп(е) = £ £ Eg%I{\9ij\ > «*») 0, i=lii=l
для всякого e > 0 и n = min{ni,..., nc} —> 00 w
S«K*.7i>+) = supE^^b/J > tan) - 0,
t>x
при x —► оо.
Тогда при n = min {ni,..., nc} —*■ 00
- EUn) r,
где r - стандартная нормальная случайная величина.
В пятой главе изучается скорость сходимости к нормальному закону для многовыборочных [/-статистик. Обозначим
Дй = вир \Р(а?ф* ~ <х)~ М(х)\. хел
Обозначим М+ = Ш1+.. .+тс, = . .+<1С. Определим усеченные канонические функции
Ша = 91аЧЫ < сгп). Определим слабые моменты
Д,-(0,р) = 8ир(«*£Р(|<^| > <тй*)), *>о х,
где х > 0, р > 0.
Теорема 5.1. Если а? > 0, то для всякого 1<р<2ищ>
Дп < £ £ Е^1{\дч\ > <тй)+ 7=1^=1
+<тп3£ £ Е\я,\31(Ы < °п)+
ё:й+>2 XI
+ £ П 9и,91А+
¿.о+> 2 1а з=1 «¿=1
^ Р) лг>+>2 х<г где Дй зависит только от т.
Теорема 5.2. Пусть (30+ = при И+ = 1,..., М+, и пусть слабые моменты 0,/?£>+) < сю. Тогда
а« < Е Е < *«)+
5=10=1 ¿0+>2
с ^ зо. зо+-з
г<?е зависит только от т.
Теорема 5.3. Положим 7д+ = г, и пусть ро+ - произвольные величины, такие что 0 < рв+ < 2В+-1 для всех !)+ = 1,...,М+. Тогда
Ап < А^г2-" £ £
5=1 0=1
¿£>+>2 а*
где зависит только от т.
Следствие 5.1. Пусть = 55^1 пРи — 1,..., М+. Тогда
Глава 6 посвящена приложениям [/-статистик. Рассматривается несколько примеров [/-статистик на графах.
Рассмотрим случайный граф С? =< V, Е >, вершинами которого является последовательность независимых случайных величин = {Хх,..., Хп}. Пусть X] принимают значения 1 и -1 с вероятностями pj и qj = 1 — р^, з = 1,...,п, соответственно. Дуги соединяют вершины противоположных знаков. Тогда размер графа, т.е. количество дуг определяется [/-статистикой
саЫ{Е{в)) = [/„ = £ < 0).
1<*<3'<п
В случае, когда р^ = 1/2, з = 1,...,п, рассматриваемая [/-статистика является вырожденной, и результат будет иметь следующий вид
где т - стандартная нормальная случайная величина. В остальных случаях
1<«7<п
при п —* оо, где
п _
= (! - АР&) + 2 Е + Я(Як -РхЧк ~Ркчд)-
3=1 Цфз «к, х,кфз
при П —* ОО.
Теперь рассмотрим двудольный граф в ко-
тором вершины состоят из независимых последовательностей, каждая из которых состоит из независимых случайных величин:
У2 = {Уъ...,Гт}.
Пусть случайные величины Х{ имеют геометрические распределения с параметрами р^ г = 1,..., п, т.е. Р(Хг = к) = р£(1 — р^), к = 0,1,2,..., а Yj имеют распределения Пуассона с параметрами ] = 1,...,т, т.е. — к) = ^-ехр(—/хД к = 0,1,2,... Дуги соединяют вершины с одинаковыми значениями, таким образом размер графа будет определяться как
п т
сатй{Е{С)) = ип,т -ЕЕ ОД = УД
¿=1 з=\
Тогда, если
п то
<т = £ ЕС1 - ») ехр(-2/^) 7о(2Ц/^)+ ¿=11=\ п т
1=17=1 п т
-2 £ £(1 - Рг)2 ехр(-2//,-(1 - й))+ <=17=1 п _
+2 £ Е ~ Л) -
«=11<7 <1<т
"2£ £ (1-Рг)2екр(-(Н+р1)(1-р{))+ »=1 1<7 <Кт т
+2Е Е (1-л)(1-Р.)вхр(-^(1-йР.))-
7=11<»<я<п т _
-2Е Е (1-й)(1-А)«Р(-А*(2-Л-Л)),
7=11<«<в<п
где «70(<гО = 1)*2Ц("|)а ~ Функция Бесселя, а 1 - мнимая
единица, то
<Чт(^п,т ~ Ё ЕС1 ~ Л) ехрС-МЛ1 - Рг))) Г
<=17=1
при тт{п, т} —► оо, где г - стандартная нормальная случайная величина.
ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
[1] Гадасина Л. В. О нормальной аппроксимации [/-статистик второй степени, 2001, тезисы к докладу. - "Фундаментальные исследования в технических университетах", изд. СПбГТУ.
[2] Гадасина Л.В. Граница Берри-Эссеена для [/-статистик, 2003, Зап. научн. сем. ПОМИ., 298, с. 54-79.
[3] Гадасина Л. В. Неравенства Берри-Эссеена для [/-статистик, 2003, Теор. вер. и ее прим., 48, №1, с. 151-155.
[4] Гадасина Л.В. О нормальной аппроксимации [/-статистик, 2004, Обозрен. прикл. и пром. мат., И, №2, с. 316-317.
[5] Гадасина Л. В. Центральная предельная теорема для многовыборочных [/-статистик, 2005, Обозрен. прикл. и пром. мат., 12, №2, с. 330-331.
[6] Гадасина Л. В. Оценки типа Берри-Эссеена для многовыборочных [/-статистик, 2005, Зап. научн. сем. ПОМИ., 328, с. 69-90.
Лицензия ЛР №020593 от 07.08.97
Подписано в печать 09 01.2007. Формат 60x84/16 Печать цифровая. Уел печ л 1,0. Тираж 100 Заказ 1132Ь.
Отпечатано с готового оригинал-макета, предоставленного автором, в Цифровом типографском центре Издательства Политехнического университета 195251, Санкт-Петербург, Политехническая ул., 29. Тел.: 550-40-14 Тел /факс: 297-57-76
Введение.
1 Основные понятия.
1.1 Одновыборочные {/-статистики.
1.1.1 Мартингальная структура [/-статистик.
1.1.2 Центральная предельная теорема.
1.1.3 Оценки скорости сходимости в центральной предельной теореме.
1.2 Многовыборочные [/-статистики.
1.2.1 Мартингальная структура многовыборочных [/-статистик.
1.2.2 Центральная предельная теорема.
1.2.3 Оценки скорости сходимости в центральной предельной теореме.
1.3 Примеры [/-статистик.
1.4 Вспомогательные сведения.
1.4.1 Лемма о срезках.
1.4.2 Метод характеристических функций (неравенство Эссеена)
1.4.3 Метод рандомизации.
1.4 4 Вспомогательные неравенства и соотношения.
2 Неравенства типа Берри-Эссеена для [/-статистик второй степени.
2.1 Введение.
2.2 Результаты.
2.3 Доказательства.
3 Неравенства типа Берри-Эссеена для [/-статистик произвольной степени.
3.1 Введение.
3.2 Результаты.
3 3 Доказательства.
4 Центральная предельная теорема для многовыборочных и - статистик.
4.1 Введение.
4 2 Результат.
4.3 Доказательство.
5 Неравенства типа Берри-Эссеена для многовыборочных [/-статистик.
5.1 Результаты.
5.2 Доказательства
6 Специальные приложения: [/-статистики на графах.
Теория (/-статистик начала развиваться после выхода работ Халмоша [32] в 1946 году, где была определена (/-статистика как оценка регулярного функционала, и Гефдинга [34] в 1948 году, где были описаны некоторые свойства (/статистик, доказана центральная предельная теорема, приведены многочисленные примеры.
Являясь обобщением сумм случайных величин, [/-статистики в случае невырожденности асимптотически им эквивалентны Кроме того, (/-статистики проявляют мартингальные свойства, что позволяет применять к ним мартин-гальные предельные теоремы.
Интерес к этому математическому объекту постоянно возрастает и находит широкое применение в различных разделах теории вероятностей и математической статистики, например, в теории оценивания: [27, 41], в теории проверки гипотез: [30, 43, 44, 49, 46] или в теории случайных графов: [24, 50]
Одним из классических вопросов теории вероятностей является нахождение скорости сходимости статистик в центральной предельной теореме. Для (/статистик, построенных по выборке из независимых случайных величин, этот вопрос в настоящее время глубоко исследован.
Целью данной работы является исследование невырожденных одновыбо-рочных и многовыборочных (/-статистик в случае неодинаково распределенных случайных величин. Для одновыборочных (/-статистик - получение оценок скорости сходимости в центральной предельной теореме при минимальноых моментных предположениях на ядро. Для многовыборочных - доказательство центральной предельной теоремы с оцениванием скорости сходимости в ней
Диссертация состоит из шести глав Первая глава носит обзорный характер. В ней даны основные определения, представлены некоторые свойства и примеры (/-статистик, сделан обзор имеющихся результатов, а также описаны основные методы исследования, применявшиеся автором.
Во второй главе получены оценки скорости сходимости в центральной предельной теореме для (/-статистик второй степени. В третьей главе получены оценки скорости сходимости в центральной предельной теореме для (/статистик произвольной степени.
Четвертая и пятая главы посвящены многовыборочным (/-статистикам. В четвертой главе доказывается центральная предельная теорема, а в пятой изучается скорость сходимости к нормальному закону
В шестой главе расматриваются приложения к конкретным задачам. Рассматриваются примеры (/-статистик, появляющихся при изучении характеристик случайных графов.
По теме диссертации опубликовано 6 работ, они перечислены в конце списка литературы под номерами [52]-[57]. Результаты диссертации докладывались на шестом Всероссийском симпозиуме по прикладной и промышленной математике в Санкт-Петербурге в 2005 г.; на пятой Всероссийской конференции по проблемам науки и высшей школы "Фундаментальные исследования в технических университетах" в Санкт-Петербурге в 2001; на городском семинаре по теории вероятностей и математической статистике под руководством акад. И.А. Ибрагимова в 2001 г.
1 Основные понятия
1.1 Одновыборочные [/-статистики
Пусть Х\,., Хп - независимые случайные величины со значениями в измеримом пространстве (Х,В), не обязательно имеющие одинаковое распределение. Предположим, что тг > т > 1 и для всех 1 < г\ < . < гт < п рассмотрим функции Фг, 1т : Хт —У И - симметрические относительно своих аргументов, такие что
Е\Фи 1т(Хп,. -,Х1т)\ < оо. Определим [/-статистику ип = ил(Фи гт) = £ Ф„ .„(-у,,.х1т) (1.1)
1<11< <«т<"
Рассмотрим случай, когда Х\,., Хп - независимые одинаково распределенные случайные величины, принимающие значения в измеримом пространстве (X, В) и имеющие на нем распределение Р. Пусть V - некоторое подмножество множества всех вероятностных распределений на (X, В). Определим для Р е V функционал 9(Р), заданный на? и принимающий значения в И. Пусть в(Р) является параметрическим или регулярным, т е для него существует несмещенная оценка и пусть ш, (т <п) - наименьший объем выборки, для которою существует несмещенная оценка Ф(:Г1,. ,хт), тогда можно записать следующее представление для в(Р) в(Р) =[•■•[ Цхи. ,^т)Р(^1). Р{(1хт) для любого Р е Р, Функция Ф(жх,. ,хт) назывется ядром, а число т> 1 -степенью функционала 6(Р). Не уменьшая общности можно предполагать, что Ф является симметрической функцией относительно своих аргументов, т.к. в противном случае можно рассмотреть симметрическое ядро Фо, определяемое следующим образом где суммирование осуществляется по всем перестановкам (г1}.,гт) чисел (1 ,.,ш).
Тогда, если для симметрического ядра Ф(х\,.,хт) определить II-статистику как ип = ип(Ф)=(") £ Ф(Хг1,.,Х1т), (1.2) / 1<Ц< <1т<П то и„ будет симметрической несмещенной оценкой в(Р), т.к. Е11п = в(Р) для любого Р и п> т.
Замечание. Часто и для случая неодинаково распределенных случайных величин ¿/-статистики определяют с соответствующей нормировкой, будем обозначать такие [/-статистики через ип К гт(Хп,.,Х1т). (13) / 1 <11 < <1т<П
В. Гефдинг [35] показал, что справедливо следующее представление V- статистик т т ип-Еип = ^Ы9г1 .с) = Е Е 9ч =
С= 1 С=1 1<Ц < <1с<п п £&+ Е Л1«2 + ■ ■ ■ + Е 5.1.2 «т» (Ы)
1=1 1<11<12<П 1<«1< <1т<П где дч 1С = дн гс{Хг1,., Х1с) с 1 < гх < . < гс < п, с = 1,., т, - канонические функции, которые определяются как дп ,с= I .[ иаЦ(*х,РиУуи)) П РМУ») = х «=1 *ат\1с Е Е (-1ГЩип\хп,.,хи]-Еип), (1.5)
11<л< где 1т = ги.,гт, 1С = ги.,гс, при этом 1С £ 1т, = и 5Х - ¿-мера
Дирака:
-<л>=и хлаа для любых х € X и А € В.
Канонические функции являются симметическими функциями своих аргументов и обладают свойством полной вырожденности е{9п 1С(ХЧ1- --,Х},. .,х1с)} = О при ] 6 1С.
Рангом {/-статистики называется первое целое число г, для которого выполняются соотношения
9и = 9Ь = • ■ ■ = 91 Г1 = О для любых комбинаций индексов /¡¡/г,.',/гь и существует такой набор индексов {гь г2,., гг} в {1,2,., п}, что
9г 1 1г Ф О
Из определения следует, что г принимает значения 1,2,., т. Если г > 2, то [/-статистика называется вырожденной, если г = 1, то [/-статистика называется невырожденной. В данной работе будем рассматривать только невырожденные [/-статистики. Положим з=\ тогда из условия невырожденности [/-статистики следует О
В случае одинаково распределенных случайных величин разложение Геф-динга имеет следующий вид т /шч
Ъ-0(Р) = Е ' ип(дс) =
С=1 \ с т / \ / \ — 1 т \ п 4 Е с Е дЛ,
С=1 \ / \ / 1<«1< <1 т<п где . с т
9с{х 1,.,хс)= . Ф{уи.,ут)][{йт№у*)-р{<1у*)) П р{4у*) =
11<л< <ц<с
Дисперсия [/-статистики. Положим в1т=ЕФ1т(Хп,.,Х1т),
Тогда по определению дисперсия [/-статистики о\ип) = Е(ип - Еип)2 = т С—1 где означает суммирование по всем индексам Ьс = . ,1с, 1тп-с = Ч,---,1т-с, Лп-с -^ш-с таким, ЧТО
1 < . <1с<п, 1<1х < .< 1т-с <71, 1<31< .< Зт-с < п, к Ф г», к ф Зз, Ч ф За при всех к, я.
Если Хх,., Хп - независимые одинаково распределенные случайные величины, то каждое слагаемое под совпадает с где т1с = Е(Фс-ЕФс)2,
ФС = ФС{ХЬ. .,Хе) = ЕФ(хь. Число таких слага . Тогда
Заключение.
Результатами настоящей работы являются оценки скорости сходимости [/статистик в случае неодинаково распределенных случайных величин к нормальному закону при различных предположениях о существовании моментов канонических функций. При этом полученные теоремы обобщают имеющиеся результаты, касающиеся случая одинаково распределенных случайных величин, в частности дают оценку порядка 0(1/\/п) при минимальных моментных условиях на ядро.
Для многовыборочных [/-статистик доказана центральная предельная теорема при близких к оптимальным условиях на канонические функции для выборок состоящих из независимых не обязательно одинаково распределенных случайных величин. Кроме того, получены оценки скорости сходимости в центральной предельной теореме. Примеры 3 и 4 главы б рассматривают некоторые задачи, в которых появляется необходимость изучения таких [/-статистик
1. Боровских Ю.В. Аппроксимация рапсределений ¿/-статистик, 1979, Докл. АН УССР, Сер А, 9, с 695-698.
2. Воровских Ю В Теория {/-статистик в гильбертовом пространстве. Киев, 1986, 56 с. (Прерп./АН УССР. Ин-т математики; 86 78).
3. Боровских Ю.В. Аппроксимация многовыборочных /В-статистик. Киев,1988, 56 с. (Прерп./АН УССР. Ин-т математики, 88 72).
4. Боровских Ю.В. Центральная предельная тоерема для /-статистик, 1989, Укр. мат. журн., 41, №2, с. 269-271.
5. Воровских Ю.В. О нормальной аппроксимации /-статистик, 2000, Теор вер. и ее прим., 45, JV°3, с. 469-488.
6. Боровских Ю.В., Королюк В С. Асимптотический анализ распределений статистик. Киев. Наук, думка, 1984. 304 с.
7. Боровских Ю В., Королюк B.C. Мартингальная аппроксимация. Киев: Наук, думка, 1988. 248 с
8. Боровских Ю В, Королюк B.C. Теория /-статистик. Киев: Наук, думка,1989. 384 с.
9. Малевич Т.Д., Абдалимов Б.А. Уточнение предельной теоремы для /статистик, 1970, Изв. АН УзССР, сер. физ -мат. наук, №2, с 6-12.
10. Малевич Т.Д., Абдурахманов Г.Р. Центральная предельная теорема для обобщенных (неоднородных) /-статистик от различно распределенных случайных величин, 1986, Изв. АН УзССР, сер. физ.-мат. наук, №2, с. 28-33
11. Петров В.В. Предельные теоремы для сумм независимых случайных величин. М.: Наука, 1987. 317 с.
12. Феллер В. Введение в теорию вероятностей и ее приложения. Т. 2, пер с англ -М.: Мир, 1984. 738 с.
13. Хашимов Ш.А., Абдурахманов Г.Р. Об оценке скорости сходимости в центральной предельной теореме для обобщенных /-статистик, 1998, Теор вер. и ее прим., 43, N°1 с. 69-81.
14. Albermk I.B. A Berry-Esseen bound for /-statistics in non-i.i d. case, 2000, Теор. вер. и ее прим., 13, №2, р 519-533.
15. Albermk I.В., Bentkus V. Berry-Esseen bounds for von Mises and /-statistics, 2001, Liet. matem. rink., 41, №1, p 1-20.
16. Alberink I.В., Bentkus V. Lyapunov type bounds for /-statistics, 2001, Teop. вер и ее прим , 46, JV°4, p. 724-743.
17. Arcones M.A. Limits of Canonical /-Processes and B-valued [/-statistics, 1994, J. Theor. Probab., 7, №2, p. 339-349.
18. Bentkus V., Götze F. On minimal moment assumptions in Berry-Esseen theorems for /-statistics, 1995, Theory Probab. Appl, 40, №3, p. 596-614.
19. Bentkus V., Götze F., Zitikis R. Lower estimates of the convergence rate for U-statistics, 1994, Ann. Probab., 22, №4, p. 1707-1714.
20. Bichel P.J. Edgeworth expansion in nonparametric statistics, 1974, Ann Statist., 2, №1, p. 1-20.
21. Borovsbkh Yu V. /-statistics in Banach Spaces. VSP. Utrecht, The Netherlands, 1996, xii+420 p.
22. Borovshkh Yu V., Korolyuk V.S. Martingale Approximation. VSP. Utrecht, The Netherlands, 1997, xi+342 p.
23. Callaert H., Janssen P. The Berry-Esseen theorem for /-statistics, 1978, Ann. Statist., 6, №2, p 417-421.
24. Ceyhan E., Priebe C.E, Wierman J.C. Relative density of the random r-factor proximity catch digraph for testing spatial patterns of segregation and associations, 2006, Computation Stat к data Analysis, 50, p 1925-1964.
25. Chan Y К, Wierman J. On the Berry-Esseen theorem for /-statistics, 1977, Ann. Probab , 5, №1, p. 136-139.
26. Dwass M. The large-sample power of rank test in the two-samples problem, 1956, Ibid., 27, №2, p. 352-374.
27. Fräser D Nonparametric methods in statistics. New York: Wiley, 1957, 299 p.
28. Friedrich К. О. A Berry-Esseen bound for functions of independent random variables, 1989, Ann. Statist., 17, M, p. 170-183.
29. Ghosh M., Dasgupta R. Berry-Esseen theorem for /-statistics in the non 1.1 d. case, 1982, Colloguia mathematica socieatatis Jänos Bolyai, 32. Nonparametric statistical inference.- Amsterdam: North Holland publishing company, 1, p. 293-313.
30. Gombay E. /-statistics for change ander alternatives, 2001, J. Multivariate Anal., 78, p. 139-158.
31. Grams W.E., Serflmg R J. Convergence rate for /-statistics and related statistics, 1973, Ann. Statist., 1, №1, p. 153-160.
32. Halmos P.R The theory of unibiased estimation, 1946, Ann Math Statist., 17, p 34-43
33. Helmers B, van Zwet W B. The Berry-Esseen bound for /-statistics, 1990, Statistical Decision Theory and Related Topics. III. Gupta, S S. and Berger, I.O. (Eds). Academic Press. New York-London, 1, p. 497-512.
34. Hoeffding W. A class of statistics with asymptotically normal distribution, 1948, Ann. Math. Statist., 19, p 293-325.
35. Hoeffding W. The strong law of large numbers for /-statistics, 1961, Inst. Statist. Mimeo Ser. N>302, p 1-10.
36. Maesono N. On the normal approximation of /-statistics of degree two, 1991, J. Statist. Plann. Inference, 17, N»1, p. 37-50.
37. Mahmoud M.A.W, El-Arishy S M., Diab L S Testing renewal new better than used life distributions based on U-test, 2005, Appl. Math. Mod., 29, p. 784-796
38. Molmary N. A /-statistic test in competing risk models, 2005, C R. Acad Sci. Paris, Ser. I 341, p. 317-322.
39. Puri M.L , Sen P Nonparametric methods in multivariate analysis New York-Wiley, 1971, 432 p.
40. Sen P. On some multisample permutation test based on a class of /-statistics, 1967, J. Amer. Statist. Assoc., 62, N320, p. 1201-1213.
41. Sen P. /-statistics and combination of independent estimators of regular functional, 1967, Calcutta Statist Assoc. Bull, 16, JV°61, p 1-14
42. Sen P. Sequential Nonparametrics- invariance principles and statistical inference. New York: John Wiley and Sons, 1981, 421 p
43. Sugiura N. Multisample and multivariate nonparametric test based on U-statisticsand their asymptotic efficiences, 1965, Osaka J. Math , 2, N°2, p. 385426
44. Svante J, Krzysztov N The asymptotic distributions of generalized /-statistics with applications to random graphs, 1991, Probab Theory Relat Fields, 90, p 341-375.
45. Zhao L., Chen X. Berry-Essen bounds for finite-population /-statistics, 1987, Scientia Sinica, Ser. A, 2, p. 113-127.
46. Гадасина JI.В. О нормальной аппроксимации /-статистик второй степени, 2001, тезисы к докладу. "Фундаментальные исследования в технических университетах", изд СПбГТУ.
47. Гадасина JIВ Граница Берри-Эссеена для /-статистик, 2003, Зап научн сем ПОМИ , 298, с 54-79.
48. Гадасина JIВ Неравенства Берри-Эссеена для /-статистик, 2003, Теор. вер. и ее прим , 48, JV°1, с. 151-155.
49. Гадасина ЛВ О нормальной аппроксимации /-статистик, 2004, Обозрен. прикл. и пром мат., 11, N°2, с. 316-317.
50. Гадасина Л.В. Центральная предельная теорема для многовыборочных /статистик, 2005, Обозрен. прикл. и пром. мат, 12, №2, с. 330-331
51. Гадасина Л.В. Оценки типа Берри-Эссеена для многовыборочных U-статистик, 2005, Зап. научн. сем. ПОМИ., 328, с. 69-90.