Асимптотический анализ распределений двухвыборочных обобщенных U-статистик и их применения к непараметрическому оцениванию тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Асракулов, Мирносир Мирсултонович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Ташкент
МЕСТО ЗАЩИТЫ
|
||||
1996
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
АКАДЕМИЯ НАУК РЕСПУБЛИКИ УЗБЕКИСТАН
ИНСТИТУТ МАТЕМАТИКИ ИМЕНИ В. И. РОМАНОВСКОГО
АСРАКУЛОВ Мириосир Мирсултонов!
АСИМПТОТИЧЕСКИМ АНАЛИЗ РАСПРЕДЕЛЕНИИ ДВУХВЫБОРОЧНЫХ ОБОБЩЕННЫХ и —
СТАТИСТИК И ИХ ПРИМЕНЕНИЯ К IIЕ П А Р АМ ЕТ Р И Ч Е С К ОМ У ОЦЕНИВАНИЮ.
01.01.05.— Теория вероятностей и математическая статистика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математ ических наук
Г Г Б ОД
^ 5 ДЕК Шэ
На правах рукописи
УДК 519.24
ТАШКЕНТ—1996
Работа выполнена в Институте математики имени В. И. Ром нозского АН РУз.
Научный руководитель:
доктор физико-математических наук, профессор Ш. А. ХЛШИМО
Официальные оппоненты:
доктор физико-математических наук, А. Б. МУХИН, кандидат физико-математических наук, Л. В. КИМ
Ведущая организация — Белорусский Государственный Уш верситет.
Защита диссертации состоится « и
в часов на заседании Объединенного Специализированног
Совета Д 015.17.01 в Институте математики имени В. И. Романов ского АН Республики Узбекистан по адресу: 700143, г. Таш кент-143, ул. Ф. Ходжаева, 29.
С диссертацией можно ознакомиться в библиотеке Институт, математики имени В. И. Романовского АН Республики Узбеки стан.
Автореферат разослан « 3 . . . 1996 г
Ученый секретарь Специализированного совета, доктор физ.-мат, наук, проф.
Ш. А. ХАШ1ШОЕ
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность теми. Теория и - статистик и функционалов Мизесэ занимает важное место в современной математической-статистике и ее многочисленных приложениях. Асимптотическая теория этих.функционалов .начатая еще в 40 - х годах работами П.Халмоша.Р.Мизеса.В.Хефдтагз.к настоящему времени по степени завершенности близка к современной теории суммирования случайных величин (с.в.).
В последние годы интенсивно развивается асимптотическая-теория так называемых обобщенных (когда ядра функционалов могут зэексоть и от индексов суммирования и от объема выборки) функционалов Мизеса и и - статистик.Это развитие в значитель -ной мере обусловлено тем,что многие интегральные статистики, играющие важную роль в теории непараметрического оценивания, могут бить представлены в виде функционалов Мизеса и и. - ста -тистик с переменным ядром.Естественно .специфическая природа этик статистик порождает новые идеи в технике доказательства предельных теорем для них.Первые такие предельные теоремы были установлены в работах Б.Розена,В.Михайлова,В.Гирко.В.Королюка и Ю.Боровских,П.Иолла,Ш.Хашимова и др.В работах Г.Малевич и Г.Абдурэхмановэ найдены условия сходимости распределения обобщенной и - статистики к пуассоновскому закону,а также к любому безгранично делимому закону(б.д.з.).Важное место в асимптотической теории обобщенных функционалов Мгоес'а и и -статистик занимают исследования по асимптотическим свойствам распределений обобщенны;: дзухвнборочных функционалов Мизеса и V - статистик.Так»лервие продельные теоремы для обычных двух -
выборочных и - статистик (когда ядро и - статистики не зависит
- 3 -
от индексов суммирования и от объема выборки) были установлены в работах Н.Худсона и'Г.Такера,А.Сигео,Н.Сигура и др.Асмшто -тическая нормальность двухЕыборочного обобщенного функционала Мизеса была установлена Ш.Хашимовым.Л.Сейделем были изучена предельные законы многовыборочного функционала Мизеса с полиномиальным ядром.Логика развитая предельных теорем для двухвыборочных обобщенных и-статистик требует решения следующих важных задач: а)доказательство центральной предельной теорема (ц.п.т.) при минимальных моментных условиях; б)уста -новление сходимости распределений к иуассоновскоиу закону; в)описание класса предельных распределений и установление необходимых и достаточных условий сходимости к б.д.з. В диссертации получено достаточно полное решение этих задач.
Следует отметить,что стимулирующим обстоятельством пред -принятого нами исследования упомянутых вше и - статистик явились интегральные статистики.возникающие в теории непараметрического оценивания.которые слуаат основой для построения критериев проверки различных статистических гипотез (критериев согласия,независимости,однородности'и т.д.).&та теория зародилась в 30-е годы и продолжает оурно развиваться и в наше время.
В 1975 году М.Рсзэнолатт для проверки гипотезы о независимости двух случайных величин (с.в.) предложил критерий,основанный па глобальном отклонении двух непараметрических оценок двух плотностей распределений. Э.Надарая б 1975 году для проварки однородности двух выборок рассмотрел критерий, также основанный на квадратическоы отклонении двух оценок плотностей распределений,построенных по каждой выборке в .отдельности. В упомянутых вше л в некоторых других работах В.Королюка и
- 4 -
Боровских, Ш.Хашимова исследованные квадратические или •лобальнне отклонение непараметрических оценок представляют :обой двухвыборочную обобщенную и - статистику.Однако в ©учении глобалышх отклонений непарэмэтрических оценок и в >ценивакии нелинейных функционалов оставались нерешенными :лэдуицке задачи: а ^становление необходимых и достаточных 'словий сходимости к предельному закону глобального отклонения двух непараметрических оценок плотностей распределений;
^получение Уп - состоятельной и установление предельного •акона непараметрической опенки для расстояния Кульбака -ййблера; в)построение на основе непараметрической оценки, асстояния Кульбака - Лейблера критерия независимости двух .в. к вычисление его асимптотической эффективности, аачительная часть диссертации также посвядеяа решению вше е^ечисленннх задач.
Цель работы. Основной целью работа является установление ходимости к любоиу б.д.з. распределения и - статистик,а таете писание при помощи этих результатов возможных предельных определений интегралных статистик,связанных с непараметри -эскими оценками неизвестных плотностей-вероятностей; асимто -етеский анализ распределений оценок некоторых нелинейных рнкционалов.
Методы исследования.В диссертации применяются современные этоды теории вероятностей и математической статистики,испо'ль-'щие .теорию мартингалов и праделыше теоремы для суш 1учайных векторов.
Научная новизна. Все основные результаты диссертации
- 5 -
являются новыми.К наиболее существенным ее положениям относятся следующие:
1.Установлена ц.п.т. для и - статистик от независимых векторов при условиях типа Линдеберга;
2.Для вше указанных статистик описан класс возможных предельных законов,содержащийся в классе безгранично-делимых распределений.Найдены необходимые и достаточные условия сходимости к б.д.з.;
3.Установлены необходимые и достаточные условия сходимости к предельному закону глобального отклонения двух непараметрических оценок плотностей распределений;
4.Построена Уп. - состоятельная оценка для расстояния Кульбака - Лейблера.Доказана её асимптотическая нормальность;
Б.Предложен критерий независимости двух с.в..основанный на непараметрической оценке расстояния Кульбака - Лейблера; вычислена ее асимптотическая эффективность.
Практическая ценность. В диссертации проведено систематическое исследование и - статистик.Доказанные в ней предельные теоремы показывают,что класс предельных законов для этих функционалов значительно шире,чем в случае классических и-статис -тик.Результаты работы позволяют решать ряд важных'задач теории непарамегрического оценивания.
Апробация работы. Результаты диссертации в разном объеме докладывались на республиканской научной школе-семенаре "Компьютерный анализ данных и моделирование"(г.Минск.дэкабрь, 199гг.), на семинарах по теории вероятностей и математической статистике Института математики им.В.И.Романовского АН РУз, на
- б -
городском семинаре по теории вероятностей и математической статистике в ТашГУ, на научной конференции "Молодых физиков и математиков".посвященной 75 - лети» ТашГУ (г.Ташкент, май, 1995г.),а также на ежегодных конференциях молодых ученых в Институте* математики 1Н РУз,посвященных памяти В.И.Романовского .(1993 - 1995 гг.).
Публикации. Основные результата диссертации опубликована в работах [1 - 6].
Структура и объем,работы. Диссертация' состоит го введения,двух глав,разбитых на параграфы, и списка литературы, содержащего 34 наименований.Общий объем работа - 113 страниц, объем без списка литературы - 109 страниц.
Содержание диссертации. Во введении сделан краткий обзор работ,связанных с темой диссертации, и сформулированы основные результаты работы.
V Первая глава диссертации,содержащая предельные теоремы для и - статистик от независимых векторов,состоит из трех параграфов.
Пусть на вероятностном пространстве (О, р) заданы две
Ш)
последовательности серий независимых случайных векторов Х1=Х1 ,
(П) (П) (11)
'•*,хп=хп и ^1=,г1 . — • ^ '••*» принимающих значения в некотором измеримом пространтсве (ж,А) и имеющие рзспредления
СП) СП) СП)
г1(л)=Р1 (х).....гп(г)=Рй («,... и ^(¡/1=0, <У),..-,оп(У)=
СП)
= °п (У)*"** соответственно.
Рассмотрим двухвыборочную обобщенную и - статистику, т.е.
ип= пё=пУ п(1)
где ь^Сг.т/Ьсишегрическая функция двух переменных,зависяща от п и .1,3.
Предположим, что
к шгщза1>*^<а>> ..........•
Распределения величины могут зависеть от 1 и п, а распреде ления могут зависеть от ,} и п, ядра (•£,</) могут не зг висеть от 1 и т.е. ~ однако он
объячательно зависят от п. .
В первом параграфе главы I установлены необходимые и дос таточше условия сходимости распределения величины (1) к б.д.
Введем обозначения
о^/и.у) = ф^сх^^и^р/^ = х, 5л=а]. где вектор У^ распределен как и не зависит от У1,...,Уп-
где символы М^ и означают усреднение по мере.поровденно величинами ^ и х^ соответственно,
Не ограничивая общности,положим,что
Мпп1;}(Х1,У;).) = о, 1,0=1,2,...
- 8 -
Предположим,что обобщенная и -статистика вырожденная,т.е.
= о, Vy, 1=1,2,., J^j^-j С л: ,у) 40 С у) = о, Ух, ¿=1,2,..
(3)
Рассмотрим класс последовательностей II -статистик (1), определяемый условиями: а) для любого е>0 при п-> «
(Л
L
1iji<Jin б) для любого S>0 при П
11)
СХ1,Х1)г[н^1(Х1,Х1) » en3a^j
о,
п~\гТ_Ki'v^Owvv > ^Я —>
с) n an 2_M[Gi3 (VVj -- 0 ^ n —"
Пусть теперь V(Z), z е R - какая-либо неубывающая ограниченная функция и РуСг) - функция распределения б.д.з., логарифм характеристической функции которой имеет вид
J {eltz-its ~l]z~ad7(z).
Основной результат этого параграфа следующее утверждение. Т а о р е и а 1.1.1. Пусть внполненн условия (2),(3) и а), б), с). Тогда для справедливости соотношения
р|ип//ШГ < --» Р7(х) при п --ж
с v(-oo)=o, v(-nw)=i необходимо и достаточно выполнение условия
V-(Z)= пг(п-1)га2 I I Z *
и ui ) 3=2 1=1
V(Z) при П - OO . ■ Во второй теореме этого параграфа установлено предельное распределение и -статистики (1) с невырожденным ядром.
Б 5 1,2 главк I получены теоремы о сходимости к нормаль -ному и пуассоновскому законам.которые выводятся из результатов первого параграфа.
Из этих теорем вытекают полученные ранее результаты работ В.С.Королюка и Ю.В.Боровских,В.Г.Михайлова,П.Холла.Ш.А.Хаши -мова.Сильвермана и Брауна,Т.Л.Малевич и Г-Р.Абдурахманова.
Заметим,что и -статистики (1).рассмотренные в диссертации,от обобщенных U-статисгик,изученых Т.Малевич и Г-Абду-рахмановда.отличаются по крайней мере двумя основными особенностями:
а) в каноническом представлении и -статистики (1) в отличие от обобщенных u-статистик присуствуот три слагаемые (а в представлении для и-статистик участвуют две слагаемые) и каждые слагаемые при определенных _условиях могут быть значимыми, вносящими основной вклад в предельных теоремах;
б) в отличие от и-статистик в (1) суммируется и по случайным величинам,принадлежащим различным сериям.
Вторая глава диссертации посвящена исследованию предельных распределений интегральных статистик и оценок нелинейного функционала,связанных с непараметрическими ядерными оценками плотностей вероятностей и состоит из четырех параграфов.
- 10 -
Интегральные статистики играют важную роль в теории непараметрического оценивания,так как,с одной стороны,они определяют качество непараметрической оценки,а с другой,на их основе строятся статистические критерии для проверки различных гипотез.
В первом параграфе главы 2 приведены некоторые вспомогательные результаты о ядерной оценке Парзена-Розенблатта, на которые опираются доказательства основных результатов главы 2.
Во втором параграфе главы 2 изучается квадратическоэ расхождение двух непараметрических оценок плотностей вероятностей.
Пусть имеются две независимые выборки {Х1> и {Т±}, 1=Т7п, из генеральных совокупностей с плотностями в(х) и ф(г), соответсвенно. На основании этих выборок построим две ядерные оценки Парзена РозенСлатта
—Г 4—]. © (2)=-!-у кГ^Ьп,
15Г ^ гЛ Л ->
где К(аг) - некоторая функция,удовлетворяющая определенным условиям регулярности,а Ь=к{п)~ последовательность положительных чисел,такая,что И -> о, пь -» ю при и ».
За меру расхоадения меяду оценками бп(£) и <рп(£) принимается функционал
оо
тш = ТГ |[в^(®)-<Рп(я)]га№)аг,
-<я
где а (л:) - некоторая весовая функция.
Предположим, что справедлива гипотеза но, согласно которой 8(3)=ф(2)=10(:е) (10(х) - заданная плотность) и вып -
- 11 -
олненн условия
sup к(г) < да, ж (г) е ь1 (R) (4)
СС
В этом параграфе,представляя величину Тп1 в ввде обобщенного функционала Мизеса.с помощью теоремы 1.1.1 устанавливаются условия сходимости распределения Т1Г, к б.д.з.
Обозначил через R (г) функцию распределения б.д.з., логарифм характеристической функции которой имеет вид
J {eifcr- it2 - ijx^dw(x).
Основной результат этого параграфа составляет
Теорема 2.2.1. Пусть имеет место предположение Hq и выполнены условия (4).Тогда,если го(х) имеет равномерно ограниченную производную, то для справедливости соотношения
pj _ni-< х
п1
при
с w(-<»)=o, W(+»)=1 необходимо к достаточно выполнение условия Wn(Ib ф- M?l^(Zl,Z2)l[iln(Z1-,Z2)<22",rn3/2] * W(Z) при п-оо, где
В частности,отсода следует сходимость распределения Тп1 к нормальному закону.Эти результаты позволяют построить асимптотический критерий уровня а проверки гипотезы H0:s(x) - fix). <
Сходимость распределения валичшш (Тп1-МТп1 )ДОп1 Г1/г к нормальному закону методом одного вероятностного пространства
- 1ё -
!была установлена Э.Надарая в 1975 году.Однако из теоремы 2.2.1 ;вытекает,что результат Э.Надарая .справедлив при менее ограничительных условиях на функцию
В третьем параграфе глава II изучаются асимптотические свойства интегральной • статистики, связанной с непараметрическнми оценками двух плотностей-вероятностей.
Пусть (£,т)) -двумерный случайный вектор принимающий . значения из пространства Е2 и с плотностью распределения £(х,у), (х,у)сЕг. Далее, пусть и <р(у) - плотность
распределения с.в. £ и т] соответственно.
Одной из основных задач математической статистики является построение критериев для проверки различных статистических гипотез,в частности,проверки гипотезы о независимое™ с.в. £ и т),' т.е.
Но: 1(г, у) = в(г)<р(у).
Целью данного параграфа является исследование асимптота -ческого поведения статистики
где .
К1(х), 1=1,2,- функции удовлетворяющие следующим условиям
• - 13 -
регулярности:
sup ¡i^GOj < 1=1,2, (в)
JjK^aOjür < », 1=1,2, (9)
[к^лоах = 1, 1=1,2, (10)
J re21(з:> Jar < <», 1=1,2, (11)
кхСа:) = ^(-г), 1=1,2, (12)
а последовательность положительных чисел ?i=ft(n) такая, что lim /1=0 И lim n?i2= ce.
а п -м»
Естественно,статистику Т^ мокно представить в виде обобщенного функционала МизесаЛогда с помощью теоремы 1.1.1 доказывается основной результат этого параграфа
Теорема 2.3.1. Пусть выполнены условия (8)-(12). Если функции g(x) и <р(у) имеют перше производные такие, что
ß'(x) е Lipa, ф'(S) с lipa, о < а $ 1, то при справедливости гипотезы Но величина
/Г' [гЛ^-АЫ)
распределена асимптотически нормально со средним О i дисперсией о тогда и только тогда, когда при п-- <»
h~zm^{z^zz)l{hn{z^,zz) > en-2«?2)->о,
где
А(п) = гЛ2!®^, о2 = (г,»/) а2 (л:, у) <1хау ^ (з:) (х) <И,
Ф1(у)=Д1(2)К1(у+л:)ау, 1=1,2.
Этот результат позволяет построить критерий независимости.
Величина впервые была введена ¿1 изучена
М.Розенблаттом.В последующем Э.Надарая установил предельное распределение этой величины,когда функции <р(х) и &{х) имеют ограниченные и непрерывные вторые производные и 1г=п~7, 0<7<1/Э.Как следует из теоремы 2.3.1,асимптотическую нормальность величины Тп2 можно установить при менее ограничительных условиях на функции Ф (а:),е {:г) и параметр и,чем в работе Э.Надарая.
В §4 главы II рассматриваются асимптотические свойства предложенной наш одной ядерной оценки расстояния Кульбака -Лейблера.
Пусть (£,1?) двумерный случайный вектор с плотностью вероятности х(х,у), (х,у) е й2. Обозначим через &(х) и ф(у) -плотности распределения с.в. £ и т} соответственно.
Целью данного параграфа является построение и исследова ~ ние асимптотических свойств непарамегрической ядерной оценки величины
Я8(х)<р (У)
Нх,у)1п-ах&у (13)
гОх.у)
Величина (13) согласно [Боровков А.А.Математическая статистика М.:Наука.1984.472с.] называется расстоянием Кульбака-Лейблера между распределениями
2 У X у
р(1,1') = J Ji(t,Z)dtdZ и G(x,y) = J Jg(t)cp(Z)dtdZ
-CO —00 -со -со
Функционал (13) играет важную роль в математической статистике и в теории кнформацш.В качестве оценки функционала (13) предлагается следующая статистика
Ijr.g.V) = - 4 У in а ,
n fei
где
если £п(я,у) > ап>
*п(я,у) - | а^, если £п{х,у) < ап,
a in(cг,у), gjz) и срп(у) определены в (5),(6) и (7); й а^такие ,что XIœ cl = О.Ядра К^ (х), 1=1,2-некоторда плотности
П-ч»
удовлетворлщие условиям (8), (11), (12).
Пусть еще выполнено следующее условие регулярности | l-xp^iaDdr < <» , 1=1,2. (14)
Обозначим чзрез
Я' о ßWq(у) _
Ка.уНп'* --tadу - lz{t,g,y).
, v Их,у) О
Основной результат этого параграфа составляет
Г е'-о р в ы а 2.4.1. Пусть плотности распределения %{х), ф(у), i(x,y) строго положительны и имеют абсолютно интегрируемые третьи производные,
lim g'(а)=0, lim ф'(у)=0, lim l'(x,y)=0, |дг| -«X |у| -00 |а:| -«о л
lim tu (.х,у)-0, О ?! о2 < оо.
\у\-*оо а
Кроме того, ее ли выполнены условия (8), <12), (14),
а /гЛг -- о, пЛ4 —• », гЛб-» о,
гг
и существует целое число к>1, такое, что
(nh)h
ТО с.в.
*ix[ln(i,g,<p)-I(f,g,<p)]
распределена асимптотически нормально со средам 0 и дисперсией а2. Эта теорема позволяет построить асимптотический критерий для проверки гипотезы HQ,состоящей в том,что îq = = gQ-{р . Теорема 2.4.2. содержит описание асимптотического поведения мощности построенного критерия в случав последовательности альтернатив нп "близких" к основной гипотезе вида
Hn: ta(x,y) = С0(х,у) + /п (|>(г,£),где JJ(j>(r,y)drcli/ = о.
Автор выражает глубокую признательность своему научному руковадителю профессору Хашмову Ш.А. за постановку задач и помощь в работе над диссертацией.
Основное содержание диссертации опубликовано в следующих работах:
1.Асракулов М.М. Об асимптотических распределениях двувыборочной обобщенной tf-статисиоси. // Рук.двп. в ВИНИТИ, 1992. & 1725-92, деп. 47 с.
2. X а ш и м о в Ш.А., Асракулов М.М. Об одной кри-
терии однородности. // Компьютерный анализ данных и моделирование. г.Минск. 1992г. с.60. - 17 -
3. ¿оракулов М.М., X а ш и м о в Ш.А. Об одном
критерии независимости.// Сборник научных статей: "Компьютерный анализ данных и моделирование". БГУ, г.Минск, 1995.стр.36-39.
4. Асраку'лов М.М. Предельные теоремы для
распределения двувыборочных обобщенных и - статистик // Уз.М.Ж. Ташкент. 1995. № 2 с. 3-9.
5. ¿оракулов М.М. Об одном критерии независимости.//
Тезисы докл. научной конференции "Молодых физиков и математиков", посвященной 75-летию ТашГУ.г.Ташкент,' 1995г. с. 132.
6. ¿оракулов М.М. О ядерной оценке расстояния
Кульбака - Лейблера // Докл. ¿Н РУз., 1996.' »7. - с.З - 5.
М.М.Асракулов Умумлашган иккитанламали. и-статистикалар таксимотларши асимптотик тахлил килиш ва уларни нопараметрик бахолалларга тадбики.
Диссертация иккитанламали умумлашган и-статистикалар таксшотларини асимптотик тахлил килишга ва уларни нопараметрик бахолашлар назариясига тадбик килишга багкшланган булиб.икки булимдан ташкил топгандир.
Учта параграфдан иборат булган биринчи булшда иккитанламали умумлашган и-статистикалар таксимотларши чексиз булинувчи конунларга интилишшинг заруриа ва етарли шартлари топилган.
Маълум бир шартлар бахарилганда иккитанламали уяумлашган и-статистикалар учун марказий лимит теореманинг уринли булиш исбот килингац.
Иккннчи булш турт параграфцан иборат булиб.унда иккита зичлик функциялар нопараметрик бахоларинивг урта квадратик четлашиши тахлил килинган.
Кульбак - Лейблер масофаси учун нопараметрик бахо таклиф килинган ва унинг асимптотик нормаллиги курсатилган.
M.K.Asrakulov Asymptotic analysis for the distributions oi two-sample generalized U-statiatioB and their application to the nonpararaetric estimation. In the candidate dissertation certain aaymptotio analysis for tha distributions of two-sample generalized U-etatistics and their applloation to the nonparametric estimation are considered.
The dissertation 0021 tains: In traduction, two Chapters and Bibliography.
In the first chapter neoassary and sufficient conditions for the convergence of the distributions of the two-sample generalized U-atatistios to some infinitly divisible laws are obtained. ©
Che oases of non-degenerate and degenerate kernels of the two-sample generalized U-statlstios have been considered.
In the second chapter limit distribution of quadratic divergence of two nonparamstrio estimators for density
functions are studied.
j -
On the basis of the kernel estimator of the Kullbaok -\ o
Iioibler's distance,proposed in the dissertation, the
statistical oriterion of independence of two random variables
has been constructed.