Асимптотический анализ распределений двухвыборочных обобщенных U-статистик и их применения к непараметрическому оцениванию тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Асракулов, Мирносир Мирсултонович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Ташкент МЕСТО ЗАЩИТЫ
1996 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Автореферат по математике на тему «Асимптотический анализ распределений двухвыборочных обобщенных U-статистик и их применения к непараметрическому оцениванию»
 
Автореферат диссертации на тему "Асимптотический анализ распределений двухвыборочных обобщенных U-статистик и их применения к непараметрическому оцениванию"

АКАДЕМИЯ НАУК РЕСПУБЛИКИ УЗБЕКИСТАН

ИНСТИТУТ МАТЕМАТИКИ ИМЕНИ В. И. РОМАНОВСКОГО

АСРАКУЛОВ Мириосир Мирсултонов!

АСИМПТОТИЧЕСКИМ АНАЛИЗ РАСПРЕДЕЛЕНИИ ДВУХВЫБОРОЧНЫХ ОБОБЩЕННЫХ и —

СТАТИСТИК И ИХ ПРИМЕНЕНИЯ К IIЕ П А Р АМ ЕТ Р И Ч Е С К ОМ У ОЦЕНИВАНИЮ.

01.01.05.— Теория вероятностей и математическая статистика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математ ических наук

Г Г Б ОД

^ 5 ДЕК Шэ

На правах рукописи

УДК 519.24

ТАШКЕНТ—1996

Работа выполнена в Институте математики имени В. И. Ром нозского АН РУз.

Научный руководитель:

доктор физико-математических наук, профессор Ш. А. ХЛШИМО

Официальные оппоненты:

доктор физико-математических наук, А. Б. МУХИН, кандидат физико-математических наук, Л. В. КИМ

Ведущая организация — Белорусский Государственный Уш верситет.

Защита диссертации состоится « и

в часов на заседании Объединенного Специализированног

Совета Д 015.17.01 в Институте математики имени В. И. Романов ского АН Республики Узбекистан по адресу: 700143, г. Таш кент-143, ул. Ф. Ходжаева, 29.

С диссертацией можно ознакомиться в библиотеке Институт, математики имени В. И. Романовского АН Республики Узбеки стан.

Автореферат разослан « 3 . . . 1996 г

Ученый секретарь Специализированного совета, доктор физ.-мат, наук, проф.

Ш. А. ХАШ1ШОЕ

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность теми. Теория и - статистик и функционалов Мизесэ занимает важное место в современной математической-статистике и ее многочисленных приложениях. Асимптотическая теория этих.функционалов .начатая еще в 40 - х годах работами П.Халмоша.Р.Мизеса.В.Хефдтагз.к настоящему времени по степени завершенности близка к современной теории суммирования случайных величин (с.в.).

В последние годы интенсивно развивается асимптотическая-теория так называемых обобщенных (когда ядра функционалов могут зэексоть и от индексов суммирования и от объема выборки) функционалов Мизеса и и - статистик.Это развитие в значитель -ной мере обусловлено тем,что многие интегральные статистики, играющие важную роль в теории непараметрического оценивания, могут бить представлены в виде функционалов Мизеса и и. - ста -тистик с переменным ядром.Естественно .специфическая природа этик статистик порождает новые идеи в технике доказательства предельных теорем для них.Первые такие предельные теоремы были установлены в работах Б.Розена,В.Михайлова,В.Гирко.В.Королюка и Ю.Боровских,П.Иолла,Ш.Хашимова и др.В работах Г.Малевич и Г.Абдурэхмановэ найдены условия сходимости распределения обобщенной и - статистики к пуассоновскому закону,а также к любому безгранично делимому закону(б.д.з.).Важное место в асимптотической теории обобщенных функционалов Мгоес'а и и -статистик занимают исследования по асимптотическим свойствам распределений обобщенны;: дзухвнборочных функционалов Мизеса и V - статистик.Так»лервие продельные теоремы для обычных двух -

выборочных и - статистик (когда ядро и - статистики не зависит

- 3 -

от индексов суммирования и от объема выборки) были установлены в работах Н.Худсона и'Г.Такера,А.Сигео,Н.Сигура и др.Асмшто -тическая нормальность двухЕыборочного обобщенного функционала Мизеса была установлена Ш.Хашимовым.Л.Сейделем были изучена предельные законы многовыборочного функционала Мизеса с полиномиальным ядром.Логика развитая предельных теорем для двухвыборочных обобщенных и-статистик требует решения следующих важных задач: а)доказательство центральной предельной теорема (ц.п.т.) при минимальных моментных условиях; б)уста -новление сходимости распределений к иуассоновскоиу закону; в)описание класса предельных распределений и установление необходимых и достаточных условий сходимости к б.д.з. В диссертации получено достаточно полное решение этих задач.

Следует отметить,что стимулирующим обстоятельством пред -принятого нами исследования упомянутых вше и - статистик явились интегральные статистики.возникающие в теории непараметрического оценивания.которые слуаат основой для построения критериев проверки различных статистических гипотез (критериев согласия,независимости,однородности'и т.д.).&та теория зародилась в 30-е годы и продолжает оурно развиваться и в наше время.

В 1975 году М.Рсзэнолатт для проверки гипотезы о независимости двух случайных величин (с.в.) предложил критерий,основанный па глобальном отклонении двух непараметрических оценок двух плотностей распределений. Э.Надарая б 1975 году для проварки однородности двух выборок рассмотрел критерий, также основанный на квадратическоы отклонении двух оценок плотностей распределений,построенных по каждой выборке в .отдельности. В упомянутых вше л в некоторых других работах В.Королюка и

- 4 -

Боровских, Ш.Хашимова исследованные квадратические или •лобальнне отклонение непараметрических оценок представляют :обой двухвыборочную обобщенную и - статистику.Однако в ©учении глобалышх отклонений непарэмэтрических оценок и в >ценивакии нелинейных функционалов оставались нерешенными :лэдуицке задачи: а ^становление необходимых и достаточных 'словий сходимости к предельному закону глобального отклонения двух непараметрических оценок плотностей распределений;

^получение Уп - состоятельной и установление предельного •акона непараметрической опенки для расстояния Кульбака -ййблера; в)построение на основе непараметрической оценки, асстояния Кульбака - Лейблера критерия независимости двух .в. к вычисление его асимптотической эффективности, аачительная часть диссертации также посвядеяа решению вше е^ечисленннх задач.

Цель работы. Основной целью работа является установление ходимости к любоиу б.д.з. распределения и - статистик,а таете писание при помощи этих результатов возможных предельных определений интегралных статистик,связанных с непараметри -эскими оценками неизвестных плотностей-вероятностей; асимто -етеский анализ распределений оценок некоторых нелинейных рнкционалов.

Методы исследования.В диссертации применяются современные этоды теории вероятностей и математической статистики,испо'ль-'щие .теорию мартингалов и праделыше теоремы для суш 1учайных векторов.

Научная новизна. Все основные результаты диссертации

- 5 -

являются новыми.К наиболее существенным ее положениям относятся следующие:

1.Установлена ц.п.т. для и - статистик от независимых векторов при условиях типа Линдеберга;

2.Для вше указанных статистик описан класс возможных предельных законов,содержащийся в классе безгранично-делимых распределений.Найдены необходимые и достаточные условия сходимости к б.д.з.;

3.Установлены необходимые и достаточные условия сходимости к предельному закону глобального отклонения двух непараметрических оценок плотностей распределений;

4.Построена Уп. - состоятельная оценка для расстояния Кульбака - Лейблера.Доказана её асимптотическая нормальность;

Б.Предложен критерий независимости двух с.в..основанный на непараметрической оценке расстояния Кульбака - Лейблера; вычислена ее асимптотическая эффективность.

Практическая ценность. В диссертации проведено систематическое исследование и - статистик.Доказанные в ней предельные теоремы показывают,что класс предельных законов для этих функционалов значительно шире,чем в случае классических и-статис -тик.Результаты работы позволяют решать ряд важных'задач теории непарамегрического оценивания.

Апробация работы. Результаты диссертации в разном объеме докладывались на республиканской научной школе-семенаре "Компьютерный анализ данных и моделирование"(г.Минск.дэкабрь, 199гг.), на семинарах по теории вероятностей и математической статистике Института математики им.В.И.Романовского АН РУз, на

- б -

городском семинаре по теории вероятностей и математической статистике в ТашГУ, на научной конференции "Молодых физиков и математиков".посвященной 75 - лети» ТашГУ (г.Ташкент, май, 1995г.),а также на ежегодных конференциях молодых ученых в Институте* математики 1Н РУз,посвященных памяти В.И.Романовского .(1993 - 1995 гг.).

Публикации. Основные результата диссертации опубликована в работах [1 - 6].

Структура и объем,работы. Диссертация' состоит го введения,двух глав,разбитых на параграфы, и списка литературы, содержащего 34 наименований.Общий объем работа - 113 страниц, объем без списка литературы - 109 страниц.

Содержание диссертации. Во введении сделан краткий обзор работ,связанных с темой диссертации, и сформулированы основные результаты работы.

V Первая глава диссертации,содержащая предельные теоремы для и - статистик от независимых векторов,состоит из трех параграфов.

Пусть на вероятностном пространстве (О, р) заданы две

Ш)

последовательности серий независимых случайных векторов Х1=Х1 ,

(П) (П) (11)

'•*,хп=хп и ^1=,г1 . — • ^ '••*» принимающих значения в некотором измеримом пространтсве (ж,А) и имеющие рзспредления

СП) СП) СП)

г1(л)=Р1 (х).....гп(г)=Рй («,... и ^(¡/1=0, <У),..-,оп(У)=

СП)

= °п (У)*"** соответственно.

Рассмотрим двухвыборочную обобщенную и - статистику, т.е.

ип= пё=пУ п(1)

где ь^Сг.т/Ьсишегрическая функция двух переменных,зависяща от п и .1,3.

Предположим, что

к шгщза1>*^<а>> ..........•

Распределения величины могут зависеть от 1 и п, а распреде ления могут зависеть от ,} и п, ядра (•£,</) могут не зг висеть от 1 и т.е. ~ однако он

объячательно зависят от п. .

В первом параграфе главы I установлены необходимые и дос таточше условия сходимости распределения величины (1) к б.д.

Введем обозначения

о^/и.у) = ф^сх^^и^р/^ = х, 5л=а]. где вектор У^ распределен как и не зависит от У1,...,Уп-

где символы М^ и означают усреднение по мере.поровденно величинами ^ и х^ соответственно,

Не ограничивая общности,положим,что

Мпп1;}(Х1,У;).) = о, 1,0=1,2,...

- 8 -

Предположим,что обобщенная и -статистика вырожденная,т.е.

= о, Vy, 1=1,2,., J^j^-j С л: ,у) 40 С у) = о, Ух, ¿=1,2,..

(3)

Рассмотрим класс последовательностей II -статистик (1), определяемый условиями: а) для любого е>0 при п-> «

L

1iji<Jin б) для любого S>0 при П

11)

СХ1,Х1)г[н^1(Х1,Х1) » en3a^j

о,

п~\гТ_Ki'v^Owvv > ^Я —>

с) n an 2_M[Gi3 (VVj -- 0 ^ n —"

Пусть теперь V(Z), z е R - какая-либо неубывающая ограниченная функция и РуСг) - функция распределения б.д.з., логарифм характеристической функции которой имеет вид

J {eltz-its ~l]z~ad7(z).

Основной результат этого параграфа следующее утверждение. Т а о р е и а 1.1.1. Пусть внполненн условия (2),(3) и а), б), с). Тогда для справедливости соотношения

р|ип//ШГ < --» Р7(х) при п --ж

с v(-oo)=o, v(-nw)=i необходимо и достаточно выполнение условия

V-(Z)= пг(п-1)га2 I I Z *

и ui ) 3=2 1=1

V(Z) при П - OO . ■ Во второй теореме этого параграфа установлено предельное распределение и -статистики (1) с невырожденным ядром.

Б 5 1,2 главк I получены теоремы о сходимости к нормаль -ному и пуассоновскому законам.которые выводятся из результатов первого параграфа.

Из этих теорем вытекают полученные ранее результаты работ В.С.Королюка и Ю.В.Боровских,В.Г.Михайлова,П.Холла.Ш.А.Хаши -мова.Сильвермана и Брауна,Т.Л.Малевич и Г-Р.Абдурахманова.

Заметим,что и -статистики (1).рассмотренные в диссертации,от обобщенных U-статисгик,изученых Т.Малевич и Г-Абду-рахмановда.отличаются по крайней мере двумя основными особенностями:

а) в каноническом представлении и -статистики (1) в отличие от обобщенных u-статистик присуствуот три слагаемые (а в представлении для и-статистик участвуют две слагаемые) и каждые слагаемые при определенных _условиях могут быть значимыми, вносящими основной вклад в предельных теоремах;

б) в отличие от и-статистик в (1) суммируется и по случайным величинам,принадлежащим различным сериям.

Вторая глава диссертации посвящена исследованию предельных распределений интегральных статистик и оценок нелинейного функционала,связанных с непараметрическими ядерными оценками плотностей вероятностей и состоит из четырех параграфов.

- 10 -

Интегральные статистики играют важную роль в теории непараметрического оценивания,так как,с одной стороны,они определяют качество непараметрической оценки,а с другой,на их основе строятся статистические критерии для проверки различных гипотез.

В первом параграфе главы 2 приведены некоторые вспомогательные результаты о ядерной оценке Парзена-Розенблатта, на которые опираются доказательства основных результатов главы 2.

Во втором параграфе главы 2 изучается квадратическоэ расхождение двух непараметрических оценок плотностей вероятностей.

Пусть имеются две независимые выборки {Х1> и {Т±}, 1=Т7п, из генеральных совокупностей с плотностями в(х) и ф(г), соответсвенно. На основании этих выборок построим две ядерные оценки Парзена РозенСлатта

—Г 4—]. © (2)=-!-у кГ^Ьп,

15Г ^ гЛ Л ->

где К(аг) - некоторая функция,удовлетворяющая определенным условиям регулярности,а Ь=к{п)~ последовательность положительных чисел,такая,что И -> о, пь -» ю при и ».

За меру расхоадения меяду оценками бп(£) и <рп(£) принимается функционал

оо

тш = ТГ |[в^(®)-<Рп(я)]га№)аг,

-<я

где а (л:) - некоторая весовая функция.

Предположим, что справедлива гипотеза но, согласно которой 8(3)=ф(2)=10(:е) (10(х) - заданная плотность) и вып -

- 11 -

олненн условия

sup к(г) < да, ж (г) е ь1 (R) (4)

СС

В этом параграфе,представляя величину Тп1 в ввде обобщенного функционала Мизеса.с помощью теоремы 1.1.1 устанавливаются условия сходимости распределения Т1Г, к б.д.з.

Обозначил через R (г) функцию распределения б.д.з., логарифм характеристической функции которой имеет вид

J {eifcr- it2 - ijx^dw(x).

Основной результат этого параграфа составляет

Теорема 2.2.1. Пусть имеет место предположение Hq и выполнены условия (4).Тогда,если го(х) имеет равномерно ограниченную производную, то для справедливости соотношения

pj _ni-< х

п1

при

с w(-<»)=o, W(+»)=1 необходимо к достаточно выполнение условия Wn(Ib ф- M?l^(Zl,Z2)l[iln(Z1-,Z2)<22",rn3/2] * W(Z) при п-оо, где

В частности,отсода следует сходимость распределения Тп1 к нормальному закону.Эти результаты позволяют построить асимптотический критерий уровня а проверки гипотезы H0:s(x) - fix). <

Сходимость распределения валичшш (Тп1-МТп1 )ДОп1 Г1/г к нормальному закону методом одного вероятностного пространства

- 1ё -

!была установлена Э.Надарая в 1975 году.Однако из теоремы 2.2.1 ;вытекает,что результат Э.Надарая .справедлив при менее ограничительных условиях на функцию

В третьем параграфе глава II изучаются асимптотические свойства интегральной • статистики, связанной с непараметрическнми оценками двух плотностей-вероятностей.

Пусть (£,т)) -двумерный случайный вектор принимающий . значения из пространства Е2 и с плотностью распределения £(х,у), (х,у)сЕг. Далее, пусть и <р(у) - плотность

распределения с.в. £ и т] соответственно.

Одной из основных задач математической статистики является построение критериев для проверки различных статистических гипотез,в частности,проверки гипотезы о независимое™ с.в. £ и т),' т.е.

Но: 1(г, у) = в(г)<р(у).

Целью данного параграфа является исследование асимптота -ческого поведения статистики

где .

К1(х), 1=1,2,- функции удовлетворяющие следующим условиям

• - 13 -

регулярности:

sup ¡i^GOj < 1=1,2, (в)

JjK^aOjür < », 1=1,2, (9)

[к^лоах = 1, 1=1,2, (10)

J re21(з:> Jar < <», 1=1,2, (11)

кхСа:) = ^(-г), 1=1,2, (12)

а последовательность положительных чисел ?i=ft(n) такая, что lim /1=0 И lim n?i2= ce.

а п -м»

Естественно,статистику Т^ мокно представить в виде обобщенного функционала МизесаЛогда с помощью теоремы 1.1.1 доказывается основной результат этого параграфа

Теорема 2.3.1. Пусть выполнены условия (8)-(12). Если функции g(x) и <р(у) имеют перше производные такие, что

ß'(x) е Lipa, ф'(S) с lipa, о < а $ 1, то при справедливости гипотезы Но величина

/Г' [гЛ^-АЫ)

распределена асимптотически нормально со средним О i дисперсией о тогда и только тогда, когда при п-- <»

h~zm^{z^zz)l{hn{z^,zz) > en-2«?2)->о,

где

А(п) = гЛ2!®^, о2 = (г,»/) а2 (л:, у) <1хау ^ (з:) (х) <И,

Ф1(у)=Д1(2)К1(у+л:)ау, 1=1,2.

Этот результат позволяет построить критерий независимости.

Величина впервые была введена ¿1 изучена

М.Розенблаттом.В последующем Э.Надарая установил предельное распределение этой величины,когда функции <р(х) и &{х) имеют ограниченные и непрерывные вторые производные и 1г=п~7, 0<7<1/Э.Как следует из теоремы 2.3.1,асимптотическую нормальность величины Тп2 можно установить при менее ограничительных условиях на функции Ф (а:),е {:г) и параметр и,чем в работе Э.Надарая.

В §4 главы II рассматриваются асимптотические свойства предложенной наш одной ядерной оценки расстояния Кульбака -Лейблера.

Пусть (£,1?) двумерный случайный вектор с плотностью вероятности х(х,у), (х,у) е й2. Обозначим через &(х) и ф(у) -плотности распределения с.в. £ и т} соответственно.

Целью данного параграфа является построение и исследова ~ ние асимптотических свойств непарамегрической ядерной оценки величины

Я8(х)<р (У)

Нх,у)1п-ах&у (13)

гОх.у)

Величина (13) согласно [Боровков А.А.Математическая статистика М.:Наука.1984.472с.] называется расстоянием Кульбака-Лейблера между распределениями

2 У X у

р(1,1') = J Ji(t,Z)dtdZ и G(x,y) = J Jg(t)cp(Z)dtdZ

-CO —00 -со -со

Функционал (13) играет важную роль в математической статистике и в теории кнформацш.В качестве оценки функционала (13) предлагается следующая статистика

Ijr.g.V) = - 4 У in а ,

n fei

где

если £п(я,у) > ап>

*п(я,у) - | а^, если £п{х,у) < ап,

a in(cг,у), gjz) и срп(у) определены в (5),(6) и (7); й а^такие ,что XIœ cl = О.Ядра К^ (х), 1=1,2-некоторда плотности

П-ч»

удовлетворлщие условиям (8), (11), (12).

Пусть еще выполнено следующее условие регулярности | l-xp^iaDdr < <» , 1=1,2. (14)

Обозначим чзрез

Я' о ßWq(у) _

Ка.уНп'* --tadу - lz{t,g,y).

, v Их,у) О

Основной результат этого параграфа составляет

Г е'-о р в ы а 2.4.1. Пусть плотности распределения %{х), ф(у), i(x,y) строго положительны и имеют абсолютно интегрируемые третьи производные,

lim g'(а)=0, lim ф'(у)=0, lim l'(x,y)=0, |дг| -«X |у| -00 |а:| -«о л

lim tu (.х,у)-0, О ?! о2 < оо.

\у\-*оо а

Кроме того, ее ли выполнены условия (8), <12), (14),

а /гЛг -- о, пЛ4 —• », гЛб-» о,

гг

и существует целое число к>1, такое, что

(nh)h

ТО с.в.

*ix[ln(i,g,<p)-I(f,g,<p)]

распределена асимптотически нормально со средам 0 и дисперсией а2. Эта теорема позволяет построить асимптотический критерий для проверки гипотезы HQ,состоящей в том,что îq = = gQ-{р . Теорема 2.4.2. содержит описание асимптотического поведения мощности построенного критерия в случав последовательности альтернатив нп "близких" к основной гипотезе вида

Hn: ta(x,y) = С0(х,у) + /п (|>(г,£),где JJ(j>(r,y)drcli/ = о.

Автор выражает глубокую признательность своему научному руковадителю профессору Хашмову Ш.А. за постановку задач и помощь в работе над диссертацией.

Основное содержание диссертации опубликовано в следующих работах:

1.Асракулов М.М. Об асимптотических распределениях двувыборочной обобщенной tf-статисиоси. // Рук.двп. в ВИНИТИ, 1992. & 1725-92, деп. 47 с.

2. X а ш и м о в Ш.А., Асракулов М.М. Об одной кри-

терии однородности. // Компьютерный анализ данных и моделирование. г.Минск. 1992г. с.60. - 17 -

3. ¿оракулов М.М., X а ш и м о в Ш.А. Об одном

критерии независимости.// Сборник научных статей: "Компьютерный анализ данных и моделирование". БГУ, г.Минск, 1995.стр.36-39.

4. Асраку'лов М.М. Предельные теоремы для

распределения двувыборочных обобщенных и - статистик // Уз.М.Ж. Ташкент. 1995. № 2 с. 3-9.

5. ¿оракулов М.М. Об одном критерии независимости.//

Тезисы докл. научной конференции "Молодых физиков и математиков", посвященной 75-летию ТашГУ.г.Ташкент,' 1995г. с. 132.

6. ¿оракулов М.М. О ядерной оценке расстояния

Кульбака - Лейблера // Докл. ¿Н РУз., 1996.' »7. - с.З - 5.

М.М.Асракулов Умумлашган иккитанламали. и-статистикалар таксимотларши асимптотик тахлил килиш ва уларни нопараметрик бахолалларга тадбики.

Диссертация иккитанламали умумлашган и-статистикалар таксшотларини асимптотик тахлил килишга ва уларни нопараметрик бахолашлар назариясига тадбик килишга багкшланган булиб.икки булимдан ташкил топгандир.

Учта параграфдан иборат булган биринчи булшда иккитанламали умумлашган и-статистикалар таксимотларши чексиз булинувчи конунларга интилишшинг заруриа ва етарли шартлари топилган.

Маълум бир шартлар бахарилганда иккитанламали уяумлашган и-статистикалар учун марказий лимит теореманинг уринли булиш исбот килингац.

Иккннчи булш турт параграфцан иборат булиб.унда иккита зичлик функциялар нопараметрик бахоларинивг урта квадратик четлашиши тахлил килинган.

Кульбак - Лейблер масофаси учун нопараметрик бахо таклиф килинган ва унинг асимптотик нормаллиги курсатилган.

M.K.Asrakulov Asymptotic analysis for the distributions oi two-sample generalized U-statiatioB and their application to the nonpararaetric estimation. In the candidate dissertation certain aaymptotio analysis for tha distributions of two-sample generalized U-etatistics and their applloation to the nonparametric estimation are considered.

The dissertation 0021 tains: In traduction, two Chapters and Bibliography.

In the first chapter neoassary and sufficient conditions for the convergence of the distributions of the two-sample generalized U-atatistios to some infinitly divisible laws are obtained. ©

Che oases of non-degenerate and degenerate kernels of the two-sample generalized U-statlstios have been considered.

In the second chapter limit distribution of quadratic divergence of two nonparamstrio estimators for density

functions are studied.

j -

On the basis of the kernel estimator of the Kullbaok -\ o

Iioibler's distance,proposed in the dissertation, the

statistical oriterion of independence of two random variables

has been constructed.