Асимптотический анализ распределений некоторых асимптотических эффективных статистик в задачах проверки гипотез тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Бенинг, Владимир Евгеньевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1997
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
им. М.В.ЛОМОНОСОВА ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ
На правах рукописи УДК. 519.2
БЕНИНГ Владимир Евгеньевич
АСИМПТОТИЧЕСКИЙ АНАЛИЗ РАСПРЕДЕЛЕНИЙ НЕКОТОРЫХ АСИМПТОТИЧЕСКИ ЭФФЕКТИВНЫХ СТАТИСТИК В ЗАДАЧАХ ПРОВЕРКИ ГИПОТЕЗ
01.01.05—теория вероятностей и математическая статистика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора физико-математических наук
Москва
1997
Работа выполнена на кафедре математической статистики факультета Вычислительной Математики и Кибернетики Московского Государствен ного Университета им. М.В.Ломоносова.
Официальные оппоненты: академик РАН И.А. Ибрагимов; доктор физ.-мат. наук, профессор Ю.Н. Тюрин; доктор физ.-мат. наук A.B. Бернштейн.
Ведущая организация: Московский Государственный институт электроники и математики.
Защита состоится " ^ 3 " С^фрЫ^ 199$ г.
в » /|{ " часов на заседании специализированного совета Д 053.05.38 при МГУ им. М.В.Ломоносова (119899, ГСП-3, Москва В-234, Воробьёвы горы, МГУ, факультет ВМиК, ауд.685).
С диссертацией можно ознакомиться в библиотеке факультета вычислительной математики и кибернетики МГУ.
Автореферат разослан " 5" » Мц/М^ 199<? г.
Ученый секретарь специализированного совета,
профессор СН. П. ТРИФОНОВ
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы.
Асимптотические методы находят широкое применение в математической статистике. Это связано с тем, что при неасимптотических постановках решение часто зависит от конкретного типа распределения, объема выборки и т.п., в то время как асимптотический подход позволяет делать достаточно обшие выводы об исследуемом объекте. При этом анализ асимптотики высших порядков в задачах математической статистики актуален как с прикладной, так и с теоретической точки зрения, поскольку он позволяет сравнивать асимптотически эквивалентные процедуры (например, критерии, имеющие одинаковую предельную мощность или асимптотическую эффективность). Как правило, он опирается на асимптотические разложения (а.р.), которые важны и сами по себе, поскольку позволяют повысить точность численных расчётов.
Возможность построения а.р., а значит, и исследования асимптотики высших порядков обычно связана с наличием явного выражения для распределения или его характеристической функции либо с представлением рассматриваемой статистики в виде суммы независимых случайных величин. Вывод а.р. в первом случае проводится в основном средствами анализа, а во втором случае основным инструментом служит хорошо развитая теория суммирования независимых случайных величин.
Однако существует много оценок и статистик критериев к которым эти методы неприменимы. Здесь можно выделить два подхода, позволяющих исследовать асимптотические свойства статистик в некоторых случаях. Первый подход основывается на том, что рассматриваемая статистика допускает стохастическое разложение определенного вида, т.е. представляется с точностью до остатка в виде полинома от нормированных сумм случайных величин. А.р. для таких статистик при минимальных моментных условиях получено Д.М.Чибисовым. Приложению таких статистик к задачам проверки гипотез и задачам оценивания уделялось большое внимание, наибольшие продвижения получены в работах Д.М.Чибисова и И.Пфанцагля (J.Pfanzagl).
Другой подход был применен В.Альберсом, П.Бикелом и В.Ван Цветом {ААГ.А1Ьег8, РЛ.ЕИске1, АУ.11.уап Zwet) при получении а.р. для распределений линейных ранговых статистик (11-статистик) в двухвыборочной проблеме и проблеме симметрии и заключался в том, что рассматривалось некоторое условное распределение исходной статистики и для него
строилось а.р. Затем после усреднения получалось искомое а.р. Однако и эти методы применимы не всегда. Примерами могут служить линейные комбинации порядковых статистик (L-статистики) и U-статистики. Это связано с тем, что стохастические разложения этих статистик нельзя представить в виде полинома от нормированных сумм независимых случайных величин. В последнее время заметно повысился интерес к L- и U-статистикам. Это вызвано тем, что они находят широкое применение в теории оценивания и непараметрической статистике. Важным достоинством этих статистик является их вычислительная простота и робаст-ность, при этом при достаточно общих условиях регулярности в классах таких статистик существуют асимптотически эффективные статистики. Многие авторы при различных условиях регулярности получали асимптотическую нормальность и оценки типа Бэрри-Эссеена для распределений L-и U-статистик. А.р. для L-статистик было получено Р.Хельмерсом и В.Ван Цветом (R.Helmers, W.R. van Zwet) а для U-статистик — П.Бике-лом, Ф.Гётце и В.Ван Цветом (P.J.Bickel, F.Goetze, W.R.van Zwet).
В диссертации рассматриваются некоторые вопросы асимптотической теории проверки гипотез. Все сказанное выше можно интерпретировать как результаты, касающиеся распределений статистик критериев при справедливости нулевой гипотезы. Однако, в задачах проверки гипотез при исследовании свойств мощностей критериев необходимо рас-смативать распределения статистик критериев и при альтернативах.
Диссертация посвящена изучению свойств распределений (оценкам скорости сходимости, асимптотическим разложениям) асимптотически эффективных статистик при справедливости альтернативных гипотез. Исследуются также некоторые свойства второго порядка мощностей критериев, основанных на таких статистиках (находится асимптотический дефект). Полученные общие результаты в терминах произвольного статистического эксперимента применяются к L-, R-, U-статистикам и к L-, R- и U-критериям.
Мы рассматриваем только асимптотический подход, при котором с ростом объема выборки тг размер критериев отделен от нуля, и имеем дело с последовательностью локальных альтернатив, при которых мощность отделена от единицы. Специальное внимание уделяется асимптотически эффективным критериям, основанным на L-, R- и U-статистиках при проверке простой гипотезы в однопараметрическом семействе. Мы рассматриваем только "регулярные" семейства, в которых эти локаль-
ные альтернативы приближаются к гипотезе как Ап~1/2, А > 0.
Во многих случаях распределения при альтернативах изучались теми же методами, что и при гипотезе. Например, пусть распределение исходных наблюдений зависит от параметра в и проверяется гипотеза Н0 : в = вй. Предположим, что критерий основан на статистике 5„, которая асимптотически нормальна с некоторыми параметрами (цп(в)),<т%(в)). Тогда подстановка 9 = 90 даёт распределение при Н0, а подстановка в ф в0 — распределение при альтернативе Н^ При локальных альтернативах вп в0 получаем, что распределение асимптотически нормально с параметрами (ц„(9„)),ст1(9п)).
Этот прямой подход, однако, не учитывает специфики задачи, связанной с локальностью альтернатив и ведет к излишним условиям регулярности, накладываемым при справедливости альтернативных гипотез. Метод, адекватный постановке задачи, даёт теория Л.Ле Кама (Ь. ЬеСат), основанная на понятии контигуальности. В частности, если Л„ — логарифм отношения правдоподобия при 9„ и 90 и совместное распределение (Л„, 5„) при 9 = 90 имеет слабый предел, то и распределение (Л„,5„) при 9 = 9„ имеет слабый предел, который легко определяется (если предельные распределения имеют плотности Ро(х,у) и рх(х,у), то р1(х,у) = егрй(х,у)).
Одно из эффективных применений этого метода было в случае ранговых статистик, поскольку распределение вектора рангов при альтернативах значительно сложнее, чем при гипотезе, что затрудняет применение прямого подхода. По этой причине при получении а.р. В.Альберсом, П.Бикелом и В.Ван Цветом рассматривались условные распределения.
В диссертации рассматриваются асимптотически эффективные статистики 5„, т.е. такие статистики, для которых разность
Дп = А„ - Г„,
в некотором смысле "мала", где Тп = а„5„ + /?„, ап > 0, — линейное преобразование исходной статистики, не влияющее на мощность критерия. Для таких статистик предложен общий метод получения предельных распределений, оценок скорости сходимости и асимптотических разложений при альтернативах. При этом условия регулярности делятся на две группы: — условия регулярности на Л„ при справедливости нулевой гипотезы Н0 и условия регулярности, используемые ранее при
доказательстве нормальности, нахождении оценок скорости сходимости и а.р. для Sn при Но- В качестве статистик S„ рассмотрены, в частности, L-, R- и U-статистики. Причем в случае R-статистик а.р. при альтернативах получено без использования условных распределений.
Далее, обозначим через тг* мощность наилучшего критерия уровня а е (0,1) для проверки простой гипотезы Н0 : в = 0 против последовательности близких альтернатив Н1п : в = Лп-1/2,0 < Л < С,С > 0. Согласно лемме Неймана-Пирсона, этот критерий основан на логарифме отношения правдоподобия Л„. Заметим, что Л„ зависит от Л и поэтому не может использоваться в качестве статистики критерия. Этим мотивируется необходимость нахождения критерия, не зависящего от А, но в определённом смысле "близкого" к наилучшему критерию. Пусть 7г„ — мощность критерия того же уровня, основанного на асимптотически эффективной статистике S„. Типичным образом
- 7ГП —> 0, п оо.
Д.М.Чибисовым и И.Пфанцаглем было доказано, что "из асимптотической эффективности критериев следует асимптотическая эффективность второго порядка", то есть более того
y/n(lГ* - 7Г„) ->• 0, п —>• оо.
Для сравнения таких критериев представляет интерес нахождение величины
г = lim n(iг* — 7г„).
Величина г тесно связана с асимптотическим дефектом, введённым Д.Ходжесом и Э.Леманом (J.L. Hodges Jr., E.L. Lehmann (1970)), и линейно через него выражается. Исследование эффективности критериев обычно основывается на построении а.р. функций мощности тг„ и тг*, которые следуют из соответствующих а.р. для функций распределения (ф.р.) статистик S„ и Лп как при нулевой гипотезе, так и при альтернативе.
В отличие от этого подхода в работах Д.М.Чибисова(1982,1985) эффективность критериев исследовалась с использованием свойств отношения правдоподобия, как в описанном выше подходе Jle Кама, без построения
а.р., и была получена формула для вычисления величины г в виде некоторой условной дисперсии. При этом предполагалось, что Д„ допускает стохастическое разложение, зависящее от сумм независимых случайных величин. Однако это предположение не выполняется для широкого класса статистик, представляющих интерес, например, для 11-, Ь- и 1Г-статистик, поскольку в этих случаях Д„ не представляется как функция от сумм независимых с.в. В диссертации доказан аналог формулы для г в случае И.-, Ь- и и-статистик (критериев). Причём достаточные условия для справедливости этой формулы приведены в терминах произвольного статистического эксперимента.
Цель работы — систематическое изучение с единой точки зрения распределений асимптотически эффективных статистик при справедливости альтернативных гипотез в задачах проверки гипотез.
Методы исследования. Основные результаты диссертации получены с помощью методики, сочетающей элементы метода характеристических функций и свойств эмпирических процессов. Также используются прямые вероятностные методы. В рассматриваемых нами задачах эффективным оказалось представление исходных статистик в виде достаточно гладких функционалов от эмпирических функций распределения.
Научная новизна работы состоит в следующем:
1. Впервые с единых позиций исследуются оценки скорости сходимости и асимптотические разложения для распределений асимптотически эффективных статистик.
2. Получены а.р. при альтернативах для статистик, допускающих стохастическое разложение, зависящее от сумм независимых случайных величин.
3. Известная формула для асимптотического дефекта обобщается на случай 11-, Ъ- и и-критериев.
4. Получена формула для асимптотического дефекта комбинированного Ь-критерия.
Теоретическое и прикладное значение. Работа имеет теоретический характер. Показано, что асимптотические свойства часто используемых асимптотически эффективных статистик могут быть исследованы единым методом, сочетающим технику преобразований Фурье с возможностью представления рассматриваемой статистики в виде гладкого функционала от эмпирической функции распреде-
ления.
Результаты могут найти применения в прикладных исследованиях, поскольку их использование приводит к сокращению вычислений, повышению точности и возможности сравнивать асимптотически эквивалентные критерии, при этом понятие дефекта является также важным для приложений, поскольку может быть интерпретировано в терминах числа наблюдений, необходимого для различения гипотез с заданной точностью.
Апробация работы. Результаты диссертации докладывались в разное время на 4 Советско-Японском Симпозиуме (Тбилиси 1982) по теории вероятностей и математической статистике, на 16 Всесоюзной школе-коллоквиуме по теории вероятностей и математической статистике (Бакуриани 1982), на Эй-леровском семинаре посвященном А.Н.Колмогорову (Санкт- Петербург, 1993), на Ломоносовских чтениях в МГУ (1994), на международных семинарах по проблемам устойчивости стохастических моделей (Казань 1995, Дебрецен 1997), на международной конференции по прикладной информатике (Носвай, Венгрия, 1997), на Всероссийской конференции по теории вероятностей и математической статистике (Абрау-Дюрсо, 1995), на семинарах по математической статистике МИРАН (руково-итель Д.М.Чибисов) и Санкт-Петербургского отделения МИРАН (руководитель И.А.Ибрагимов), на семинаре по избранным вопросам теории вероятностей (руководители В.М.Золотарёв, В.М.Круглов, В.В.Калашников), а также в Пекинском университете (1995) и университетах Голландии (Амстердам, Лейден, Утрехт, 1995, 1996).
Всего по теме диссертации опубликовано 25 работ, 19 из которых цитируются в диссертации.
Структура и объём работы. Диссертация состоит из введения, трёх глав и списка литературы, содержащего 177 наименований. Объем работы — 212 страниц.
Во введении (27 стр.) излагается история проблемы, обсуждаются общие постановки задач и их современное состояние, описываются основные результаты, представленные в диссертации.
В главе 1 (29 стр.) получены оценки скорости сходимости функций распределения статистик, "близких" к оптимальным в задаче проверки гипотез, при справедливости альтернативной гипотезы. Доказывается общая теорема в терминах произвольного статистического эксперимента.
Затем эта теорема применяется к Ь-, II- и и-статистикам.
В главе 2 (58 стр.) строятся а.р. при альтернативах для "близких" статистик и статистик, допускающих стохастическое разложение, зависящее от нормированных сумм независимых случайных величин. Рассмотрены также Ь-, Л- и и-статистики.
В главе 3 (73 стр.) получена формула для предельного отклонения функции мощности асимптотически эффективных Ь-, И,- и 11-критериев от огибающей функции мощности. Доказана общая теорема, которая применяется, как к специальному случаю, к критериям основанным на Ь-, К,- и 11-статистиках. Рассмотрены также комбинированные Ь-крите-рии.
СОДЕРЖАНИЕ РАБОТЫ
Пусть Х„—наблюдаемый случайный элемент со значениями в измеримом пространстве (Ип, Рассмотрим задачу проверки гипотезы
Н0п : £(Хп) = Р0„ (1)
против альтернативы
Н1п : £(Х„) = Р1п, (2)
где Pon, Pin— два распределения на (') с плотностями трап(х) и Роп(я) относительно некоторой с-конечной меры, С(Хп)—распределение случайного элемента Х„. Обозначим символами Е0, Ei соответственно математическое ожидание относительно Р0 := Р<ь, Pi := Pin-Определим логарифм отношения правдоподобия
д _ ^РЦ
Р0п(Х„)
с обычными соглашениями при обращении в ноль плотностей р0п(Х„), Pln(X„).
По лемме Неймана-Пирсона наиболее мощный критерий размера а € (0,1) имеет критическую функцию вида
> Сп,
= ^ 0t Лп
причём
(з)
Е0Ф;(Л„) =
Обозначим мощность этого критерия (огибающая функция мощности) через
К = ЕхФ;(Лв). (4)
Рассмотрим некоторую действительную статистику Sn = S„(X„) и для той же задачи введём критерий размера а вида
где БоФ«(5„) = а. Обозначим мощность этого критерия через
^^„(S,,). (6)
Необходимость рассмотрения статистики S„ мотивируется не только сложной структурой Л„, но и тем, что Л„ зависит от альтернативы и, вообще говоря, не может рассматриваться как статистика критерия для проверки Но„ против сложной альтернативы.
Пусть т„ 6 (0,1] — последовательность действительных чисел. Назовем последовательность критериев Фn(S„) тп-эффективной (см. P.J.Bickel, D.M.Chibisov, W.R.van Zwet (1981)), если
<-fn = 0(т„), п-¥ со. (7)
В обычной терминологии, если Х„ = (ЛГх, • • • ,Х„), где Л"; — независимые одинаково распределенные случайные величины (н.о.р.с.в.), то асимптотическая эффективность первого и второго порядков соответствует т„-эффективности с т„ = 1 и т„ = п~1/2 соответственно.
Обычно для сравнения таких критериев представляет интерес нахождение величины
Величина г тесно связана с асимптотическим дефектом и линейно через него выражается.
Исследование эффективности критериев обычно основывается на построении а.р. функций мощности жп и 7г* (J.Pfanzagl (1980)), которые следуют из соответствующих а.р. для ф.р. 5„ и Л„, как при гипотезе Н0п , так и при альтернативе Hi„. Так, например, для случая н.о.р.с.в. типичным образом т„ = га-1/2, и если известны разложения
7г* = а* + п~^2Ъ* + п~1с* + о(п-1), (9)
7г„ = а + п~1^2Ь + п-1с + о(п-1), (10)
то критерий, основанный на статистике £„, будет асимптотически эффективным, если а* = а, и асимптотически эффективным второго порядка, если кроме того Ъ* = Ь. В этом случае
г = с — с.
В отличие от этого подхода, требующего чрезвычайно громоздких вычислений, в работах Д.М.Чибисова эффективность критериев исследовалась с использованием свойств отношения правдоподобия (как и в третьей лемме Ле Кама) без построения а.р. типа (9),(10).
В работе (Р..1.Вкке1, Б.М.СЫЫбоу, М'.И.уап Zwet (1981)) было показано, что свойство (7) является следствием "близости" Л„ и некоторого линейного преобразования статистики 5„, не меняющего мощность критерия Ф„(5„), то есть в случае, если для ап > 0, Д, величина
ДП = ЛП-ГП, Т„ = а„5„ + Д„, (11)
в некотором смысле "мала". Для н.о.р.с.в. из гладкого параметрического семейства это свойство выполняется, если у Тп и Л„ совпадают главные члены стохастических разложений.
В диссертации рассматривается общая схема, описанная выше, и в основном асимптотически эффективные статистики 5„ (другие статистики рассматриваются в §7 главы 2), для которых "мала" величина А„ (см.(11)). В качестве приложения общих результатов рассматривается схема н.о.р.с.в., т.е. Х„ = (Хь • • • ,Хп), где Х{ — независимые одинаково распределённые с.в. с плотностью р(х,в), в е 6 с Ы\ причём множество в содержит некоторую окрестность нуля. Для п = 1,2,... рассматривается задача проверки гипотезы
Н0 : 9 = 0 (12)
против последовательности сближающихся сложных альтернатив
Н1п : в = АтГ1/2, 0 < А < С, С > 0. (13)
Далее приняты следующие обозначения: Iд, Ае — соответственно индикатор и дополнение множества А, Ф(-), у(-) — ф.р. и плотность
стандартного нормального закона, т = для функций /{х,в) производные по х и в обозначаются символами типа
и т.п., в точке в = 0 аргумент в опускается, например,
9=0
9=0
В качестве примеров асимптотически эффективных статистик рассматриваются сумма н.о.р.с.в., Iг, И- и и-статистики вида
¡=1
Sn2 = Tl'1/2 ^ bin(Xi.„), »=1
Sn3 = n-1/2fia(Rt)sgn(Xi),
«= l
S„4 =
l<t<j<n
(14)
(15)
(16) (17)
где
, ¿ = 1,2,.
9=0
Цх,в) Ш logp(x,9), 1'Цх) = j^logp(l,i) F-1(s) = inf{a;: F(x) > s},
F(s) = P0{Xi<s},
и Xt;n обозначает i-ю порядковую статистику выборки (Хь • • • ,Х„); (Л?, • • •, R+) — вектор рангов (|Xi|, • ■ •, |ЛГ„|). При использовании ранговой статистики Sn3 мы дополнительно предполагаем, чтор(х,в) = р{х—в)
и р(—х) = р(х), то есть при гипотезе Н0 с.в. Х{ имеют симметричное распределение. Функция Ф(х,у) является симметричной и удовлетворяет условию
Заметим, что при справедливости гипотезы Н0 статистика Sn3 может быть представлена как сумма независимых одинаково распределенных с.в., в то время, как при альтернативе Hi„, это уже не так (см. W.Albers, P.J.Bickel, W.R.van Zwet (1976)).
Глава 1
В главе 1 доказана общая теорема в задаче проверки гипотез (1), (2), позволяющая получать оценки скорости сходимости для ф.р. асимптотически эффективных статистик S„ при справедливости альтернативы Hi„ в случае, если нам известна оценка скорости сходимости этой статистики при справедливости основной гипотезы Н0п- Оценки скорости сходимости такого рода могут быть использованы для получения оценок для функций мощности 7г„ (см. (6)), они также описывают изменение предельного закона при отклонении от исходного распределения.
В §1 формулируется, а в §2 доказывается теорема 1.1.1, упрощённый вариант которой выглядит следующим образом. Теорема 1.1.1.
Пусть существуют абсолютно непрерывные ф.р. G0n(x) , числа т„ 4-О, а„ > 0, &„, an > 0, ß„, множества Dn € Тп и константы А„ > О, С > О, 8 > 0 такие, что
1- Р«{Х„ G D„} < Cr*+Ä, t = 0,1.
2. sup|P0{5„ < x} - G0n(x)| < Crn1+Ä.
3. Pi{\kn - bn| > а„} < Стп1+г, t = 0,1.
4. Eo|Ä„| < Ct*+s, E0exp{An}I(AniOo)(|Än|) < Cr„+S, Ä„ = Ä„-Tn, Tn = anSn+ßn.
Тогда для любого 7 существует константа С7 такая, что справедливо неравенство
sup|Pi{5„ < х} - Gin(e)| < C7rn,
i<71
где
Gin{x) = f exp{a„u + (Jn}G'Qn(u)du.
J—OO
Заметим, что в случае, когда Х„ = (Хи • • • ,Х„) — н.о.р.с.в., типичным образом
г„ = п_1/2, G0„(x) = ФСакГ1),* = О,
Gi„(x) = Ф ((* - Ао->-1)» = Eo(^)(Xj))2, Л„ — "регуляризиро-ванный" логарифм отношения правдоподобия. Условие (2) описывает скорость сходимости S„ к предельному закону при справедливости основной гипотезы Я0„. Условие (3) характеризует вероятность больших уклонений А„, а условие (4) описывает "близость" А„ и 5„.
В §3 эта теорема применяется к статистикам (14)—(17) (теорема 1.3.1). При этом условия регулярности накладываются при справедливости основной гипотезы Н0 и делятся на две группы. Первая группа (см. условие (L)) характеризует гладкость исходного семейства распределений и совпадает с условием Аз3) из работы (D.M.Chibisov, W.R.van Zwet (1984)), там же имеется обсуждение условий такого типа. Эти условия к настоящему моменту являются минимальными. Вторая группа условий обеспечивает выполнение условия (2) теоремы 1.1.1. В частности, для случая L-статистики S„2 (см.(15)) эти условия взяты из работ (R.Helmers(1980), W.R.van Zwet(1979)), в которых были получены оценки скорости сходимости L-статистик при справедливости гипотезы Но, они также являются минимальными.
Для иллюстрации приведём условие (L) и часть теоремы 1.3.1, касающуюся статистики Sn3.
Условие (L).
Существует е > 0 и семейство измеримых множеств А», 9 € U = [0,е] такое, что As t> при в 10, р(х,0) > 0 при х е М = Usee и
Р0-№ е AD = о(в3).
1. Для любого х е А0, р{х,9) дважды непрерывно дифференцируема по 6 £ [0,£д(а;)], £д(х) = sup[0 < 9 < е : х £ Ag] и р^(х, в) абсолютно
непрерывна по 9 € [0, £.4(2;)] .
Для любого О е и, р^(х,в) существует для почти всех х 6
2. Е0
PU)(Xi)
з/jr
limsupEs
PiX г)
<00, j = 1,2,3; i>(3)(*ü
< E0
Теорема 1.3.1.
Пусть выполнено условие (Ь), а2 = Е0 (А'х)}" > 0 и функция /(в) удовлетворяет условию Липшица. Тогда для любого у существует кон-статнта С > О такая, что
sup
*<7
Р^З <х}-Ф
Act2
В §4 теорема 1.3.1 доказывается.
Глава 2.
В главе 2 изучаются а.р. для ф.р. асимптотически эффективных статистик в задаче (1), (2) методами, описанными выше.
В §1 на эвристическом уровне описывается формальное правило получения первых к е {0,1, • • •} членов а.р. по степеням малого параметра т„ при справедливости альтернативной гипотезы Hi„. В §2,3 формулируется и доказывается общая теорема 2.2.1, которая является аналогом приведённой выше теоремы 1.1.1, дающая достаточные условия для справедливости а.р. при альтернативах.
В §4 эта теорема применяется к статистикам (14)—(17) (теорема 2.4.1), при условиях регулярности, близких к условию (L) и условиях, обеспечивающих справедливость а.р. при справедливости гипотезы Н0 статистик (14)—(17). В явном виде приведены члены порядка пЗаметим, что в отличие от работы (W.Albers, P.J.Bickel, W.R. van Zwet (1976)), в случае ранговой статистики Sn3 а.р. при альтернативе получено без использования условных распределений и при ослабленных условиях регулярности.
В §5, 6 теорема 2.4.1 доказывается.
В §7 рассматриваются а.р. при альтернативах для статистик, допускающих стохастическое разложение, зависящее от сумм независимых с.в. В заметке (В.Г.Елисеев(1979)) приведена без доказательства теорема, позволяющая получать а.р. при альтернативах для таких статистик. Мы приводим полное доказательство этого результата при ослабленных условиях регулярности и строим более удобный формальный алгоритм получения а.р.
Пусть ХхУ'--,Хп — н.о.р.с.в., имеющие плотность р{х,т]), т] е £> С Л1. Определим векторы
(У]о,¥а, ■ ■ ■, Ур) = (ВД), ВД), • • •, ВД)), % = 1, • • •, п,
все компоненты которых — действительные измеримые функции от с.в. Х{. Введем с.в.
в„ = (5п1,• • ■,5„р), = гГ1'2¿У«, / = 0,• • ■ ,р.
1=1
Пусть задан конечный набор полиномов по х, у б 77)},
зависящий от п и т). Образуем с.в.
= £,о + £ п~»%п (5„о, Б„, г,). (18)
Задача получения а.р. для ф.р. с.в. Zn при фиксированном значении параметра г] может быть решена методами работ (Д.М.Чибисов (1979),(1980)). Для статистических приложений желательно иметь равномерную по т] в В оценку остаточного члена в а.р. Для этой цели может быть применена теорема В работы (Б.М.СЫЫбоу (1980)). Однако на практике условия этой теоремы трудно проверяемы и носят в основном теоретический характер. Было бы более удобно, если бы условия теоремы такого рода делились на две группы: первая группа — условия на распределение вектора (У0рч),• • -,УР(Х1)) при т] = 0; вторая группа — условия на плотность р{х,т}). Приведённая в §7 теорема 2.7.1 удовлетворяет этим требованиям.
Особый интерес, например, для получения а.р. функций мощности критериев, основанных на статистиках вида (18), представляет случай близких альтернатив:
Ч = АгГ1/2, 0 < А < С, С > 0.
В этом случае удаётся ослабить условия, при которых существует искомое а.р., до условий из работы (Б.М.СЫЫзоу, \\М1.тап Т^меЬ (1984)), а также сформулировать прямой алгоритм его получения. Заметим, что если Уо(х) = №(х), то статистика 2п (см. (18)) будет асимптотически эффективной в задаче проверки гипотез (12), (13). Случай, когда статистика 2п зависит и от Ъ-статистики, рассмотрен в работе автора (1980). Теорема 2.7.2.
Пусть существуют положительные числа г0 > 3, ги - ■■ , гр такие, что Г1<г0, / = !,•••,р и
1. Полиномы Ь.]П(х,у,т\) имеют равномерно по тг и 0 < А < С ограниченные коэффициенты, Е0|У/(Х1)|Г' < оо, / = 0, • • • ,р, Е0У^2 = 1 и Е0У( = 0, если п > 1, I = 0, • ■ • ,р. Для каждого ] и каждого слагаемого вида я™0г/™1 ••■у™", входящего с ненулевым коэффициентом в Н]„(х,у,тХ), справедливо неравенство
2. Распределение вектора (Уо(Х!), • • ■, УР(Х1)) при т) = 0 удовлетворяет условию (С) Крамера.
3. Существует е > 0 и семейство измеримых множеств А9, в е и — [0, е] такое, что А9при 9 10, р(х,0) > 0 при х е А0 = иАв и
а) Для любого х € Ао плотность р(х, в) непрерывно дифференцируема по в € [0, £а(®)]> £л (х) = зир[0 < в < £ : А$], к +1 раз и р<*+1> (х, 0) абсолютно непрерывна по в € [0,£д(^)] •
Для любого в £ и, р(к+2\х,в) существует для почти всех х £ А$.
Тогда существуют все моменты, входящие в а.р. Фи для любого С > 0
sup supIPifZ« < х} - Ф„,*,л(х)! = о(п~к/2).
Р0{Хг G АП = o(9k+'2), к = [го - 2).
0<а«7 х
А.р. Ф„,*,л(я) имеет достаточно сложный вид. Прямое применение формул определяющих это а.р. затруднительно из-за громоздкости выкладок, приводящих к конечному результату. Приводимая также в §7 теорема 2.7.3 облегчает получение этого а.р.
Доказательства теорем 2.7.1, 2.7.2 и 2.7.3 помещены соответственно в §8, 9, 10.
Глава 3
В главе 3 получены формулы для асимптотических дефектов критериев, основанных на Ь-, II- и и-статистиках вида (15)—(17). Рассмотрен также дефект комбинированного критерия, основанного на Ь-статистиках.
В работе (Д.М.Чибисов (1985)) для задачи проверки гипотез (12), (13) в случае, где Х„ = (Х1, • ■ • ,Х„) — н.о.р.с.в., для величины г (см.(8)) получена формула
г = ^Б[п|Л = ь]р(Ь), (19)
где П и Л — с.в. такие, что
(>/пД„,Лв) -А (П,Л) (20)
и Ь = - а), Фг(г) — предельная ф.р. для Л„ при Н0 и р(х) — Ф[(х). Подчеркнем еще раз, что эта формула получена без использования а.р. При этом предполагалось, что Д„ (см.(11)) допускает стохастическое разложение, зависящее от нормированных сумм независимых с.в. типа (18). Однако для широкого класса статистик, например, для Ь-, В,- и и-статистик вида (15)—(17), это предположение не выполняется. В главе 3 доказан аналог формулы (19) для случая Ь-, И- и и-статистик. Приведены явные формулы для условных дисперсий, при этом выражения для г в случае 11-статистики согласуется с результатом работы (\Y.Albers, Р.Л.В1ске1, \У.11.уа.п Zwet (1976)), полученным с помощью прямого применения а.р. и при более ограничительных условиях регулярности.
В §1 приведен эвристический вывод формулы (19) в терминах произвольного статистического эксперимента (71„,Р„, {Роп,Р1п}) (см. (1), (2)). В этих терминах в §2 формулируется общая теорема 3.2.1, дающая достаточные условия для выполнения (19).
В §3 рассмотрены Ь-, II- и и-критерии, приведены эвристические выводы соответвующих формул для г. Показано, что Л и П (см. (20))
являются соответственно линейным и квадратичными функционалами от броуновского моста В(-). Например, для L-критерия
г = g^jVK - AV7)D [к - \Li\Li = uaVl\, (21)
где
Lk = - Г Jk(8)B(s)dF~1 («), Jo
Jt(s) = (l{k)(x))'\ ,k = 1,2;
K = -f1jil\s)B>(s)dF-\s), Jo
Ф(иа) = 1-а, / = Е0(Я(Х1))2. Найдено также явное выражение для этой условной дисперсии
Л£з|Хх = и„л/7| =г;0 + «1А+^А2, (22)
«о = 2(7| - 2hh + /па) + 4(1 - «£)(/? - /ш), их =Aua(l0h - /он), = -Tool — II
Ъ= Г J&is^tfdF-^s), ¿ = 0,1;
Jo
I2= f141\s)s(l-s)dF-1(s), Jo
Iiji = С i\j^s)J^j(t)ii-~l+\s)^\t)K\s,t)dF-1(s)dF-1(t), Jo Jo
hj — 0,1; / = 1,2, K(s,t) = min(s,i) - st,
В §4, 5 доказывается теорема 3.2.1, в §6 формулируются теоремы 3.6.1, 3.6.2 и 3.6.3, в которых получены формулы типа (21) соответственно для L-, R- и U-критериев. Далее формулируются теоремы 3.6.4, 3.6.5
и З.б.б, в которых найдены явные выражения для условных дисперсий типа (22) для этих критериев.
§7 содержит доказательства теорем 3.6.1—3.6.6. В §8 рассмотрен комбинированный критерий, основанный на Ь-стати-стиках. Предположим, что исходная выборка разбита на фиксированное число т частей:
(Хг, •••,ХП1),-- • ,(Х„-Пт+1у - ■ • ,ЛГ„), щЧ-----Нпт = тг,
причём
>0, 1 = 1,■■•,т (23)
п
и по каждой части построены с помощью формул (15) асимптотически эффективные Ъ-статистики 1 = 1 Рассмотрим комбиниро-
ванную Ь-статистику вида
т
= (24)
1-1
и критерий уровня а для проверки гипотезы Н0 (12) против последовательности альтернатив Н1п (13). Пусть пп2 — мощность этого критерия и 7гп2—мощность критерия того же размера а, основанного на Ь-статистике (15). В §8 формулируются и доказываются теоремы 3.8.1 и 3.8.2, в первой из которых находится предел вида
1ш1 п(п„±- ТТп2)
п-*оо 4
в терминах условных дисперсий, а во второй получено явное выражение для этих условных дисперсий.
Комбинированные критерии рассматривались ранее в работах (\y.Il.van Л.Оо81егЬоЯ(1967), \У.А1Ьегв(1989)). В работе (\У.А1Ьеге(1989)) при выполнении условия (23) для 11-статистик доказывается утверждение, аналогичное утверждению теоремы 3.8.1, причём здесь опять метод доказательства существенно опирается на построение а.р. для 7г*, 7г„, 7г„, и рассматриваемый предел находится прямыми вычислениями, основанными на этих а.р., без использования формулы для дефекта. Доказательство теоремы 3.8.1 опирается на общую теорему 3.2.1 и не использует а.р. Этим методом могут быть доказаны аналогичные теоремы и для
комбинированных R- и U-критериев, причём при ослабленных условиях регулярности.
Заключение
Основными результатами, полученными в диссертации, являются следующие:
1. Разработан общий метод, позволяющий исследовать оценки скорости сходимости и а.р. при альтернативах для асимптотически эффективных статистик.
2. Продемонстрированы приложения этого метода на примерах сумм независимых с.в., L-, R- и U-статистик.
3. Получены а.р. при альтернативах для статистик, допускающих стохастическое разложение, зависящее от сумм независимых с.в.
4. Обобщена известная формула для асимптотического дефекта на случай произвольного статистического эксперимента.
5. С помощью этого результата найдены асимптотические дефекты для L-, R- и U- критериев.
6. Получены формулы для асимптотического дефекта комбинированного L-критерия.
Публикации
Основные результаты диссертации опубликованы в следующих работах
1. Бенинг В.Е.
Асимптотические разложения для распределения статистики, допускающей стохастическое разложение, зависящее от линейной комбинации порядковых статистик, при близких альтернативах, ДАН СССР, 1980, т.251, н.1, стр.14—16.
2. Bening V.E.
Asymptotic expansions under local alternatives,
4 USSR-Japan Symposium on Probability Theory and Math. Stat., 1982, Tbilisi, Abstract of Commun., v.l, p.120—121.
3. Бенинг В.Е.
Асимптотические разложения при близких альтернативах, 16 Всесоюзная школа-коллоквиум по теории вероятностей и матем. статистики, Бакуриани, 1982, Мецниереба, стр. 112—113.
4. Бенинг В.Е.
Один метод получения аимптотических разложений при альтернативах, Вестник МГУ, сер. 15, Выч. мат. и киберн., 1994, н.2, стр. 36—44.
5. Бенинг В.Е.
Асимптотические разложения при близких альтернативах, Вестник МГУ, сер. 15, Выч. мат. и киберн., 1994, н.4, стр. 31—44.
6. Бенинг В.Е.
Оценки скорости сходимости при альтернативах для L- и R-статистик, В кн. Тез. докл. Всеросийской школы-коллокв. по стохаст. методам геометрии и анализа, Абрау-Дюрсо, 1994, стр. 14—15, изд. ТВП, Москва.
7. Бенинг В.Е.
Один метод получения аимптотических разложений при альтернативах, основанный на свойствах логарифма отношения правдоподобия, Статистические методы оценивания и проверки гипотез, Межвузовский сборник научных трудов, 1995, вып. 10, стр. 4—25, Изд. Пермского Университета.
8. Бенинг В.Е.
Оценки скорости сходимости при альтернативах для L- и R-статистик, Вестник МГУ, сер. 15, Выч. мат. и киберн., 1995, н.4, стр. 25—33.
9. Bening V.E.
On the rate of convergence of L- and R- statistics under alternatives, Journal of Math. Sciences, 1995, v.76, n.2, p. 2227—2240.
10. Bening V.E.
Asymptotic expansions for L- and R- statistics under alternatives, Journal of Math. Sciences, 1995, v.76, n.l, p. 2094—2109.
11. Bening V.E.
A formula for deficieny: one sample L- and R-tests 1, Math. Methods of Statistics, 1995, v.4, n.2, p.167—188.
12. Bening V.E.
A formula for deficieny: one sample L- and R-tests 2, Math. Methods of Statistics, 1995, v.4, n.3, p.274—293.
13. Bening V.E.
On the rate of convergence of L- and R- statistics under alternatives, 21st European Meeting of Statistician, 1995, Univer. of Aarhus, Programme and Abstracts, p.117.
14. Бенинг В.Е.
Оценки скорости сходимости при альтернативах некоторых статистик, ДАН, 1996, т.349, н.2, стр. 151—152.
15. Bening V.E.
A formula for deficieny,
Proceed. Euler seminar dedicated to the memory of A.N.Kolmogorov (1993), A Probab. Theory and Math. Statist. (I.A. Ibragimov, A.Yu. Zaitsev eds.), Gordon-Breach, 1996, p.243—252.
16. Bening V.E.
A formula for deficieny (L- and R-tests), Journal of Math. Sciences, 1996, v.78, n.l, p.18—27.
17. Бенинг B.E.
О дефекте комбинированного критерия, основанного на L-статистиках, В кн. Тез. докл. Всеросийской школы-коллокв. по стохаст. методам геометрии и анализа, Туапсе, Тезисы докладов, 1996, стр. 25—27, Издательство ТВП, Москва.
18. Бенинг В.Е.
Некоторые свойства асимптотически эффективных U-статистик, Теория вероятностей и её применения, 1997, т.42, н.2, стр. 382—384.
19. Бенинг В.Е.
Линейные комбинации порядковых статистик: асимптотические свойства и применения в задачах проверки гипотез,
Обозрение промышленной и прикладной математики, 1997, т.4, в.З, стр. 499—522, Изд. ТВП.