Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба

Чирина, Анна Владимировна

Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Чирина, Анна Владимировна АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Санкт-Петербург МЕСТО ЗАЩИТЫ

2005 ГОД ЗАЩИТЫ

01.01.05 КОД ВАК РФ

Диссертация по математике на тему «Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба»

Автореферат диссертации на тему "Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба"

на правах рукописи

Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба.

01.01.05 — теория вероятностей и математическая статистика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

САНКТ-ПЕТЕРБУРГ - 2005

Работа выполнена на кафедре теории вероятностей и математической статистики Санкт-Петербургского государственного университета.

НАУЧНЫЙ РУКОВОДИТЕЛЬ:

доктор физико-математических наук, профессор Я.Ю. НИКИТИН

ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ:

Б.П. ХАРЛАМОВ

кандидат физико-математических наук, доцент Н.В. ГРИВКОВА

ВЕДУЩАЯ ОРГАНИЗАЦИЯ:

Московский государственный университет (МГУ)

Защита состоится " ^ тЛиЛ. 2006г. в " ' часов на заседании

диссертационного совета Д002.202.01 в Санкт-Петербургском отделении Математического института им. В.А.Стеклова РАН по адресу: 191023, Санкт-Петербург, наб. р. Фонтанки, д.27, к.311.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского отделения Математического института им. В.А.Стеклова РАН.

доктор физико-математических наук

Автореферат разослан

;; 1с «Д^ 2006г.

Ученый секретарь

диссертационного совета Д002.202.01 доктор физико-математических наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность темы. Экспоненциальное распределение играет важную роль в теории вероятностей, математической статистике и их приложениях, таких, как теория надежности, теория массового обслуживания, анализ данных типа времени жизни и др. Первые критерии экспоненци-альности, свободные от масштаба, появились в середине XX века: крите* рий Гринвуда (1946), критерий Морана (1951), позже - критерии Лилье-форса (1969) и Стивенса (1978). В последние 20 лет было построено множество критериев для проверки экспоненциальности в тех или иных нспараметрических классах распределений (работы Ангуса, Барингхауза и Хенде, Клара, Коула, Литвиновой, Мейнтаниса, Тауфера и Дж. Рао, Фортиана и Гране и ряд других.)

В настоящее время для большинства известных критериев найдены и табулированы предельные (а иногда точные) распределения при гипотезе экспоненциальности, построены критические области для стандартных уровней значимости. В то же время, вопрос о состоятельности для критериев Морана, Джини, Стивенса и ряда других популярных критериев экспоненциальности до сих пор не обсуждался в общем виде: известно было лишь об их состоятельности против отдельных параметрических семейств альтернатив. Мы отчасти заполняем этот пробел и доказываем состоятельность изучаемых асимптотически нормальных критериев в классах альтернатив с монотонной интенсивностью отказов.

Для того, чтобы выбрать среди состоятельных критериев наиболее подходящий в той или иной ситуации, необходимо уметь вычислять эффективности критериев. В настоящее время лишь для немногих критериев экспоненциальности вычислена асимптотическая относительная эф» фективность (АОЭ) по Бахадуру. Основные трудности, возникающие при нахождении этого вида эффективности, связаны с нахождением грубой асимптотики вероятностей больших уклонений. Большая часть настоящей диссертации посвящена вычислению функций уклонений и АОЭ по Бахадуру всех изучаемых статистик, разбитых на классы в соответствии с их структурой.

РОС. НАЦИОНАЛЬНА» ) БИБЛИОТЕКА ,

Цель работы. Цель работы заключается в асимптотическом сравнении разнообразных критериев экспоненциальности на основе бахадуров-ской асимптотической эффективности. Для этого в диссертации изучается асимптотика вероятностей больших уклонений критериальных статистик, представляющая самостоятельный интерес.

Методы исследования. В настоящей диссертации использованы предельные теоремы теории вероятностей, теория больших уклонений, теория асимптотической эффективности, а также методы классического и функционального анализа.

Основные результаты.

1. Доказаны общие теоремы об асимптотике вероятностей больших уклонений для обширных классов функций от экспоненциально распределенных выборок. С их помощью для всех изучаемых статистик найдены функции уклонений при гипотезе экспоненциальности.

2. Доказана состоятельность изучаемых статистик для проверки экспоненциальности, имеющих асимптотически нормальное распределение, в классах альтернатив с возрастающей или убывающей функцией интенсивности отказов.

3. Вычислены значения локальной АОЭ по Бахадуру для всех изучаемых критериев.

4. Изучены условия локальной асимптотической оптимальности по Бахадуру для всех изучаемых критериев.

Научная новизна. Все основные результаты диссертации являются новыми.

Практическая и теоретическая ценность. Диссертация носит теоретический характер. Разработанные в ней методы вычисления асимптотики вероятностей больших уклонений имеют самостоятельное значение. В то же время, найденные в диссертации условия состоятельности и численные значения АОЭ позволяют давать рекомендации по практическому применению критериев экспоненциальности.

Апробация работы. Результаты диссертации докладывались на международной конференции "Асимптотические методы в теории вероятностей и математической статистике"в Санкт-Петербурге в 1998г.; на международной конференции молодых статистиков (ЕУБМ) в Марли-ле-Руа (Франция) в 1999 г.; на международной конференции "Модели долговечности, старения и деградации в теории надежности, здравоохранении, медицине и биологии"в Санкт-Петербурге в 2004 г.; на семинаре летней школы по математической статистике в Торньоне (Италия) под руководством проф. К. Клаассена в 2004 г.; на семинаре СПбГУ по предельным теоремам теории вероятностей под руководством проф. В.В.Петрова в 1997 г.; на городском семинаре по теории вероятностей и математической статистике под руководством акад. И.А.Ибрагимова в 2005 г.

Публикации. Основные результаты изложены в семи работах [1] -

[7].

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, разбитых на разделы и подразделы, заключения и списка литературы, включающего 68 названий. Общий объем диссертации - 83 страницы.

СОДЕРЖАНИЕ РАБОТЫ.

Общая постановка задачи проверки экспоненциальности выглядит так: пусть Х\,... ,Хп - повторная выборка, т.е. набор независимых одинаг ково распределенных случайных величин (н.о.р.с.в.), имеющих функцию распределения (ф.р.) Л Требуется на основании этой выборки проверить сложную основную гипотезу Но, состоящую в том, что Р принадлежит классу экспоненциальных распределений £:

£ = №■. Р(х) = 1-е-**, А > 0, я > 0}.

Альтернативная гипотеза Н\ состоит в том, что ^ не принадлежит £. Иногда класс альтернатив сужается, например, до класса альтернатив с возрастающей или убывающей функцией интенсивности отказов (ВФИ, УФИ), класса «новое-лучше-старого» или более специальных классов.

При изучении асимптотических свойств критериев бывает полезно сгруппировать их исходя не из способа построения, а из их структуры. Мы предлагаем выделить среди известных статистик для проверки экс-поненциальности следующие три группы.

Для построения и изучения статистик, свободных от масштаба, удобно перейти к нормированным случайным величинам Щ = Х{/Х, г = 1 ,...,п, где X - выборочное среднее, и пусть < ... < £/(„) - соответствующий вариационный ряд.

Статистики из первой группы имеют вид

где г - некоторая функция, заданная на положительной полуоси. К этой группе, например, относятся хорошо известные статистики Гринвуда и Морана, отвечающие г (а;) — х2 и г(х) = 1пх соответственно, а также ряд других статистик.

Во вторую группу входят статистики вида

где г (в, х) - функция, определенная на первом квадранте. Сюда относятся статистики Лильефорса (1969), Барингхауза - Хенце (2000), а также их взвешенные варианты.

Наконец, третья группа содержит нормированные ¿-статистики (то есть линейные комбинации порядковых статистик с коэффициентами Щ,п, г = 1,...,п:

К этой группе можно отнести статистику Джексона (1967), статистику Джини-ГейлагГаствирта (1978) и статистику Фортиана - Гране (2002). С ¿-статистиками связаны весовые функции

(1)

(3)

тп{х) = при

г — 1

^ х < -, п

причем для х, лежащих внутри интервала (0,1), имеет место сходимость (как минимум, поточечная)

1лп(х)-> ю(х) (функция меток).

п-юо

Такой подход имеет ряд преимуществ. Во-первых, варьируя г (в), г(.$, х) или г = 1,..., п, соответственно, мы можем строить новые критерии экспоненциальности, имеющие очень простой для вычисления и исследования вид. Во-вторых, мы можем вычислять асимптотические характеристики не для отдельных статистик, а сразу для всей группы (разумеется, при некоторых ограничениях).

Сравнение критериев друг с другом и выбор наилучшего критерия для больших выборок производится обычно на основе понятия асимптотической относительной эффективности (АОЭ), к определению которой существует несколько подходов. Теория асимптотической эффективности критериев подробно изложена в книге Я.Ю.Никитина (1995).

Основная цель данной работы - сравнение рассматриваемых критериев экспоненциальности на основе понятия асимптотической эффективности по Бахадуру, предложенной Бахадуром в 60-х годах. Этот вид эффективности выбран по нескольким причинам. Во-первых, для вычисления АОЭ по Бахадуру не требуется асимптотическая нормальность, а статистики из второй группы не являются асимптотически нормальными. Во-вторых, АОЭ по Бахадуру позволяет различать статистики, имеющие одинаковую питменовскую эффективность, то есть является более тонким методом сравнения критериев. В-третьих, вычисление бахадуровской эффективности требует нахождения грубой асимптотики больших уклонений, что, на наш взгляд, для статистик из вышеперечисленных трех групп является нетривиальной математической задачей, представляющей самостоятельную ценность. Задача вычисления асимптотики больших уклонений для критериев экспоненциальности до сих пор была решена лишь в единичных случаях.

Перейдем теперь к обзору содержания диссертации.

Первая глава носит обзорный характер: в ней описаны изучаемые в диссертации критерии экспоненциальности, перечислены некоторые

свойства и характеризации экспоненциального распределения, основные определения и теоремы теории Бахадура.

Опишем рассматриваемые нами статистики для проверки экспонен-циальности.

1. Центрированная и нормированная статистика Морана определяется формулой

где С - постоянная Эйлера.

2. Статистика Стивенса

получающаяся из асимптотически нормальной статистики Гринвуда

2-¿t (§)'),

t=l 4 '

при помощи монотонного преобразования.

3. Статистика Лильефорса(19б9) - это статистика Колмогорова - Смирнова, в которой неизвестный параметр масштаба заменен его оценкой:

Lin = suplí- Fn(x) - е-х/7|.

х>0

Предельное распределение Ып изучалось Pao и Сетураманом (1975).

4. Статистика Барингхауза - Хенце (2000) - статистика типа Колмогорова - Смирнова, основанная на характеризации экспоненциальности:

ВНп = sup i>0

Барингхауз и Хенце доказали, что при нулевой гипотезе статистика ВНп совпадает по распределению, с точностью до бесконечно малого слагаемого, с классической статистикой Колмогорова - Смирнова.

+0О

Fn(u)du/X - F„(x)

5. Статистика (или отношение концентрации) Джини

G = ^ ~

2п(п - 1 )JC

Гейл и Гаствирт (1978) предложили использовать G„ для проверки экспоненциальное™ и доказали ее асимптотическую нормальность.

6. Статистика Фортиана - Гране (2002) основана на вычислении максимального коэффициента корреляции по Хеффдингу между эмпирической и теоретической функциями распределения:

FGn = j=j(- ln(l - x))F^\x)dx. о

7. Статистика Джексона (1967) - это нормированная ¿-статистика, коэффициентами которой являются математические ожидания порядковых статистик для выборки из стандартного экспоненциального распределения:

j _ 1VV 1 ^

Вторая глава посвящена нахождению больших уклонений. Для статистик вида (1) и (3) доказаны общие теоремы, которые затем применяются к конкретным статистикам. Это наиболее содержательная и трудоемкая часть работы. Сформулируем основные результаты.

Теорема 2.2. Пусть Х\, ... - н.о.р.с.в., каждая из которых имеет гамма-плотность с параметром а, и пусть функция r(s) монотонна и удовлетворяет ряду естественных дополнительных условий. Пусть {Тп} - последовательность статистик вида (1), построенная по случайным величинам {Xj} и функции r(s). Тогда существует такое положительное ад, что для любого а € [0, оо)

k(a) = lim п-11пР(Т„ > а) = inf{-ац + <р(р)),

Я 40© /1^0

где <р(ц) вычисляется по формуле

+ In J saexpAs + - ЬГ(1+а) j.

о ' При этом к (а) непрерывна на [0, ао) и

lim а к(а)

2l 1 + о

а "б+ v ; 2(«т2(1 4- а) — г2) '

где

„2

Теорема описывает большие уклонения функций от выборки из гамма-распределения, частным случаем которого при а = О является экспоненциальное.

Для широкого класса монотонных функций r(s) полностью описано поведение функции уклонений не только вблизи нуля, но и на всей положительной полупрямой, за исключением, может быть, одной точки.

С помощью теоремы 2.2 найдены функции уклонений односторонних статистик Гринвуда и Морана,а также двусторонней статистики Морана. Приводится также переформулировка этой теоремы для критериев равномерности на отрезке, основанных на суммах функций от спейсингов.

Во втором разделе главы 2 мы находим, опираясь на теорему 2.2, функцию уклонений для статистики Лильефорса:

Теорема 2.3. Для достаточно малых а > 0 при нулевой гипотезе

к(а) = lim n_1lnP(Li„ > а) = max ( sup к+(а, х), supÄL(a, а;) ) ,

Wo х20 )

где

к+(а, х) - + е~х) + A- l- lnA-Aa; + ln(e" + е** -1)}

к-(а, х) = infд<1{-м(о-е~х) + Х-1-ЫХ-\х + In(e^ + е^-1)}.

При этом функция к (а) непрерывна в окрестности нуля и имеет в нуле асимптотику

к(а) = — sup(е~2г (е* — х2 — 1))^ а2(1 + о(1)), а->-0+.

Функция уклонений для статистики Барингхауза - Хенце выводится с помощью ее связи со статистиками Колмогорова-Смирнова.

Большие уклонения нормированных L-статистик описываются следующей теоремой.

Теорема 2.5 Пусть Xi,...,Xn- экспоненциальные независимые с.в. и пусть статистика Тп определяется формулой (3), причем построенная по функции меток функция

W{x) = —i- I w(u)du, 0 < x < 1 J. «С у

удовлетворяет следующим условиям: 1 1 J W(x)dx = О, 0 < J W2(x)dx < +оо,

/¿х

——; . . = +оо, где М = вир Ш{х) < +оо, м — \У{х)

и существует такое ао 6 (О, М), что для любого а £ [0, оо) и для любого 4 6 ( О, ¿/У верен предельный переход

1 " Г

Ит - 1п (1 - - а)) = / 1п (1 - - а)) dx > - оо,

П <=1 о

1 "

где

Тогда при 0 ^ а < oq функция уклонений статистики Тп может быть вычислена по формуле

k(a) = lim n-1lnP(T„ > а) = inf / In--,-rdx,

K ' n-voo ' m J 1 - t(W(x) - a)

причем fc(a) непрерывна в окрестности нуля и имеет при а —t 0+ асимптотику

к(а) = - J W\x)dxj • а2(1 + о(1)).

Теорема 2.5 позволяет вычислить функции уклонений двусторонней статистики Джини и ее односторонних вариантов, а также односторонних вариантов статистик Фортиана - Гране и Джексона.

В третьей главе обсуждается вопрос о состоятельности изучаемых статистик в классах ВФИ(УФИ) и вычисляются точные наклоны и знаг чения локальной АОЭ по Бахадуру для следующих четырех модельных параметрических семейств альтернатив: плотность Макегама, плотность Вейбулла, плотность с линейной интенсивностью отказов (л.и.о.) и гаммат плотность.

Известно, что статистики Лильефорса и Барингхауза - Хенце состоятельны против всех альтернатив. Для статистик Морана, Стивенса -Гринвуда, Джини, Джексона и Фортиана - Гране нами доказана состоятельность в классах альтернатив с монотонной функцией интенсивности отказов. Сформулированы также достаточные условия состоятельности статистик первой и третьей групп против подобных альтернатив.

Лемма 3.1. Пусть {Тп} - последовательность статистик вида (1). Построим по функции г (s) функцию R(s):

00 00 R{s) = r(s) - е" J r(u)e~udu = r(s) - j r(u + s)e~udu.

Если R(s) возрастает (убывает) па (0, +оо), то статистика Тп состоятельна в классе ВФИ (УФИ).(В классе УФИ мы предполагаем дополнительно, что математическое ожидание конечно.)

Лемма 3.2. Пусть {Тп} - последовательность нормированных L-статистик с функцией меток ги(х), и пусть W(x) определена по w(x) так же, как в теореме 2.5. Если при любом х G (0,1)

q(x) s J W{u)du > (<) О, о

то Тп состоятельна в классе ВФИ (УФИ с конечным математическим ожиданием).

В таблице 1 собраны значения локальной асимптотической эффективности по Бахадуру для всех изучаемых статистик для модельных семейств альтернатив.

Таблица 1: Значения локальной АОЭ по Бахадуру.

Название статистики Плотность Макегама Плотность с л.и.о. Плотность Вейбулла Гамма-плотность

Морана 0,6941 0,3876 0,9426 1

Гринвуда, Джексона, Фортиана - Гране 0,75 1 0,6079 0,3876

Джини 1 0,75 0,8762 0,6941

Лильефорса 0,6071 0,3563 0,5381 0,5027

Барингхауза - Хенце 0,75 0,5413 0,5875 0,4914

Из таблицы, в частности, видно, что статистика Джини локально асимптотически оптимальна (ЛАО) для альтернатив Макегама, односторонние

статистики Джексона, Фортиана - Гране и Стивенса - Гринвуда являются JIAO для альтернатив с линейной интенсивностью отказов, а статистика Морана - для гамма-альтернатив.

В четвертой главе найдены условия локальной бахадуровской асимптотической оптимальности всех изучаемых критериев.

Пусть при альтернативе случайные величины Xi, i = 1,2,... имеют плотность f{x,6), причем f(x, 0) = е~х,х > 0. Определим по f(x,6) функцию h(x):

h(x) = ~f(x, 0)| .

При выполнении некоторых условий регулярности справедлива следующая

Лемма 4.1. Статистика вида (1), определяемая функцией r(s), для которой выполнены условия теоремы 2.2, является JIAO по Бахадуру для семейства альтернатив f(x, 9) тогда и только тогда, когда соответствующая функция h(x) удовлетворяет условию

h(x) = (0г(х) + 7 (ж - 1))е~х

при произвольных вещественных ¡3 > 0 и 7.

Для статистик вида 2 и 3 доказаны аналогичные леммы 4.2 и 4.3.

Плотность f(x, в) неоднозначно восстанавливается по h(x). В частности, функция h(x) = х — у, отвечающая лемме 4.1 для односторонней статистики Гринвуда и лемме 4.3 для односторонних статистик Джексона и Фортиана - Гране, соответствует не только семейству альтернативных плотностей с линейной интенсивностью отказов, но и обобщенному семейству плотностей Парето.

В заключении даны рекомендации по практическому применению изучаемых критериев.

Работы автора по теме диссертации.

[1] ЧИРИНА, А.В. (1997). Бахадуровская эффективность критерия экспоненциальности, основанного на свойстве отсутствия последействия. Записки научных семинаров ПОМИ РАН, 244, 315-329.

[2] ЧИРИНА, А.В. (2002). Асимптотическая эффективность и локальная оптимальность по Бахадуру критерия экспоненци-альности, основанного на статистике Морана. Записки научных семинаров ПОМИ РАН, 294, 245-259.

[3] ЧИРИНА, А.В. (2003). Большие уклонения некоторых свободных от параметра масштаба функций от выборки из гамма-распределения. Записки научных семинаров ПОМИ РАН, 298, 252-279.

[4] nlkitin, Ya.Yu., tchirina, A.V. (1996). Bahadur efficiency and local optimality of a test for the exponential distribution based on the Gini statistic. J. Ital. Statist. Soc., 5, No. 1, 163-175.

[5] Nikitin, Ya.Yu., tchirina, A.V. (1998). Tests of exponentiality based on characterizations and their efficiencies. Международная конференция "Асимптотические методы в теории вероятностей и математической статистике". Санкт-Петербург, 24 - 28 июня 1998 г. Тезисы докладов, 207 - 210.

[6] tchirina, A.V. (1999). Asymptotic properties of a test for exponentiality based on the Gini statistics. Eleventh European Young Statisticians' Meeting (EYSM), Marly-le-Roi, France, 186-199.

[7] tchirina, A.V. (2004). Asymptotic Comparison of Scale-Free Exponentiality Tests. .Модели долговечности, старения и деградации в теории надежности, здравоохранении, медицине и биологии (Материалы международной конференции LAD'2004, Санкт-Петербург), том 2, 308 - 309.

Подписано в печать 19.12.05. Формат 60*84 1/16. Бумага офсетная. Печать офсетная. Печ. л. 1,0. Тираж 100 экз. Заказ 131.

Отпечатано с готового оригинал-макета в типографии Издательства СПбГЭТУ "ЛЭТИ"

Издательство СПбГЭТУ "ЛЭТИ" 197376, С.-Петербург, ул. Проф. Попова, 5

I >

* - f 8 я Й

Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Чирина, Анна Владимировна

Введение.

1 Вспомогательные сведения.

1.1 Свойства и характеризации экспоненциального распределения.

1.2 Критерии экспоненциальиости.

1.3 Асимптотическая эффективность по Бахадуру. Большие уклонения.

2 Большие уклонения.

2.1 Большие уклонения интегральных статистик.

2.1.1 Введение.

2.1.2 Вычисление функции <£>(/.«).

2.1.3 Исследование функции (р(ц). Вычисление функции уклонений.

2.1.4 Случай ограниченной функции r(s).

2.1.5 Примеры. Связь с равномерным распределением.

2.2 Большие уклонения статистик типа супремума.

2.2.1 Статистика Лильефорса.

2.2.2 Статистика Барингхауза - Хенце.

2.3 Большие уклонения нормированных L-статистик.

2.3.1 Вычисление и исследование функции уклонений.

2.3.2 Примеры.

3 Асимптотическая эффективность.

3.1 Состоятельность.

3.2 Вычисление точных наклонов.

3.3 Значения ЛАЭ по Бахадуру.<

4 Условия локальной асимптотической оптимальности.

4.1 Введение.

4.2 Интегральные статистики.

4.3 Статистики типа супремума.

4.4 Нормированные L-статистики.

Введение диссертация по математике, на тему "Асимптотическая эффективность критериев экспоненциальности, свободных от параметра масштаба"

Экспоненциальное распределение играет важную роль в теории вероятностей, математической статистике и приложениях, таких, как теория надежности, анализ данных типа времени жизни и др. (см., например, [2], [4], [5]). В последние годы было построено множество критериев проверки экспоненциальности в тех или иных непараметрических классах распределений ([29], [50], [17], [25], [30], [35], [60] и др.). Первые же критерии экспоненциальности появились, по-видимому, в середине двадцатого века (критерии Гринвуда [28], Морана [40] и ряд других [55], [18], [24], несколько позже - критерий Лильефорса [37]).

Регулярно появляются обзорные работы, где систематизируются методы построения и исследования критериев экспоненциальности (кроме статьи Эп-стейна [24], которая была, по-видимому, первой работой такого рода, упомянем также обзоры [21], [58], [13], [32] и соответствующие разделы в [4] и [20] ). Имеются даже два справочника, посвященные экспоненциальному распределению и родственным с ним распределениям [15], и [41], в которых описан ряд критериев экспоненциальности.

Самая общая постановка задачи проверки экспоненциальности выглядит так: пусть A'i,.,Хп - повторная выборка, т.е. набор независимых одинаково распределенных случайных величин (н.о.р.с.в.), имеющих функцию распределения (ф.р.) F. Требуется на основании наблюдений Xi,.,Xn проверить сложную основную гипотезу состоящую в том, что F принадлежит классу экспоненциальных распределений £ с неизвестным параметром масштаба Л:

F: F(x) = 1 — e~Al, А > 0, ж > 0}.

Альтернативная гипотеза Hi состоит в том, что F не принадлежит S. Иногда класс альтернатив сужается, например, до класса альтернатив с возрастающей или убывающей функцией интенсивности отказов (соответственно, ВФИ или УФИ), класса «новое-лучше-старого» (см., например, [33]) или до так называемых £-, М- и £Л1-классов (см. [30], [35], [36], где построены критерии, состоятельные в этих классах).

Весьма популярны критерии, основанные на многочисленных характериза-циях экспоненциального распределения. Например, в [12] и [11] построены статистики, основанные на свойстве отсутствия последействия и его «упрощенных» вариантах, которые могут быть выражены функциональными уравнениями для экспоненциальной функции распределения. Другие критерии, основанные на характеризациях экспоненциального распределения, подробно изучаются в диссертациях [б] и [47]. Критерии экспоненциальности, основанные на характеристических свойствах экспоненциально распределенных случайных векторов и их преобразований, построены в работах [3] и [60]. В последнее время при построении критериев экспоненциальности используются также функциональные уравнения для преобразований Лапласа и Фурье для экспоненциального распределения (например, работы Барингхауза и Хенце [16], Хепце и Мейнтаниса [31]). Кроме того, для проверки экспоненциальности против параметрических альтернатив могут использоваться критерии отношения правдоподобия (например, как показали Моран [40] и Шорак [56], критерий Морана является равномерно наиболее мощным против гамма-альтернатив; см. также [5], Глава 3). Однако такие критерии редко имеют удобный для вычисления вид и, кроме того, могут оказаться непригодными при изменении альтернативы.

Критерии экспоненциальности часто не сводятся к известным и хорошо изученным видам статистик (таким, как суммы независимых случайных величин или [/-статистики), а имеют довольно причудливую структуру, так что иногда даже нахождение предельного распределения при нулевой гипотезе становится нетривиальной задачей (см., например, [60]).

Для построения и изучения критериев, свободных от масштаба, удобно перейти к нормированным случайным величинам Ui = Xi/X, i = 1,. , п, где X выборочное среднее случайных величин Х\,. ,Хп. Эти случайные величины, очевидно, зависимы (их сумма равна п). Можно построить на основе этих случайных величин эмпирическую функцию распределения и изучать функционалы от нее. Предельные теоремы для статистик такого рода изучались, например, в [46].

При изучении асимптотических свойств критериев бывает полезно сгруппировать их, исходя не из способа построения, а из структуры. Так, в работе [б] исследование критериев становится возможным благодаря тому, что все они имеют структуру U- или У-статистик, для которых хорошо развита асимптотическая теория. Мы же предлагаем выделить среди известных критериев экспоненциальности еще три группы.

Пусть случайные величины £/j, г = 1,.,п, определены как выше, и пусть Щ1) < . < [/(„) - соответствующий вариационный ряд. Критерии из первой группы имеют вид где г - некоторая функция, заданная на положительной полуоси. К этой группе относятся хорошо известные статистики Морана и Гринвуда, а также статистики Шермана [55], Кокса - Оукса [5], Эппса - Пулли [23] и ряд семейств статистик, недавно предложенных Хенце и Кларом (см. [30], [35], [36]).

Во вторую группу входят критерии вида где r(s, х) - функция, определенная на первом квадранте. Сюда относятся критерии Лильефорса [37], [22], Барингхауза - Хенце [17], а также их взвешенные варианты.

Наконец, третья группа, предложенная Шораком и Уэллнером в [57], содержит нормированные L-статистики (то есть линейные комбинации порядковых статистик f/(j)) с коэффициентами witn, г = 1,., п: i=l

Как отмечалось в [57], к этой группе можно отнести статистику Джексона [34]; статистика Джини [26] и недавно предложенная в [25] статистика Фортиана -Гране также принадлежат к этой группе.

Перечислим преимущества такого подхода. Во-первых, варьируя r(s), r(s,x) или Wi>n, i = 1,. ,п, соответственно, мы можем строить новые критерии экс-поненциальности, имеющие очень простой для вычисления и исследования вид. Во-вторых, мы можем вычислять асимптотические характеристики не для отдельных статистик, а сразу для всей группы (разумеется, при некоторых ограничениях). Наконец, любые утверждения, доказанные для случайного вектора (U\,., Un), допускают переформулировки в терминах двух других распределений, имеющих многочисленные приложения в теории вероятностей и математической статистике: это равномерное распределение на отрезке и многомерное распределение Дирихле на симплексе.

При построении и изучении критерия чрезвычайно важен вопрос о состоятельности, то есть о стремлении мощности критерия к единице при возрастании объема выборки. Как правило, требование состоятельности учитывается при построении критерия, однако для ряда давно известных и употребительных критериев (статистики Морана, Стивенса [59], Джини [26] и некоторые другие), построенных из «эмпирических» соображений, более или менее общие условия состоятельности до сих пор не были установлены: известно было лишь о состоятельности этих критериев против отдельных параметрических семейств альтернатив. В главе 3 настоящей работы мы доказываем состоятельность этих статистик в классе альтернатив с ВФИ или УФИ. Более того, мы выводим общие достаточные условия состоятельности в этих классах для статистик из первой и третьей групп.

Сравнение критериев друг с другом и выбор наилучшего критерия в применении к той или иной модели производится обычно на основе понятия асимптотической относительной эффективности (АОЭ). Существует несколько подходов к определению АОЭ - это эффективность по Питмену, Ходжесу - Леману, Бахадуру и некоторые другие (см. [7]).

Основная цель данной работы - асимптотическое сравнение рассматриваемых критериев экспоненциалыюсти по Бахадуру. Этот вид эффективности выбран по нескольким причинам. Во-первых, для вычисления АОЭ по Бахадуру не требуется асимптотическая нормальность, а статистики из второй группы, очевидно, не являются асимптотически нормальными. Во-вторых, АОЭ по Бахадуру позволяет различать статистики, имеющие одинаковую нитменовскую эффективность, то есть является более тонким методом сравнения критериев. В-третьих, вычисление бахадуровской эффективности требует нахождения грубой асимптотики больших уклонений, что, на наш взгляд, для статистик из вышеперечисленных трех групп является нетривиальной математической задачей, представляющей, в том числе, и самостоятельную ценность. Задача вычисления больших уклонений для критериев экспоненциалыюсти до сих пор была решена лишь в единичных случаях ([б], [47], [8], [65]).

Вычисляя АОЭ критериев экспоненциалыюсти, мы можем оценить их качество и дать обоснованные рекомендации по их использованию на практике.

Диссертация состоит из четырех глав. Первая глава носит обзорный характер: в ней описаны изучаемые в диссертации критерии экспоненциалыюсти, перечислены некоторые свойства и характеризации экспоненциального распределения, основные определения и теоремы теории Бахадура. Вторая глава посвящена нахождению больших уклонений. Для первой и третьей групп статистик доказаны общие теоремы, которые затем применяются к конкретным статистикам; для каждой из двух статистик второй группы также найдена функция уклонений. Это наиболее содержательная и трудоемкая часть работы. Результаты первого раздела этой главы можно также применить к большим уклонениям статистик, основанных на спейсингах равномерного распределения.

В третьей главе обсуждается вопрос о состоятельности изучаемых статистик в классах ВФИ(УФИ) и вычисляются точные наклоны и значения локальной АОЭ по Бахадуру для следующих четырех модельных параметрических семейств альтернатив: плотность Макегама, плотность Вейбулла, плотность с линейной интенсивностью отказов и гамма-плотность. В четвертой главе выводятся условия локальной асимптотической оптимальности всех изучаемых критериев.

По теме диссертации опубликовано 7 работ, они перечислены в конце списка литературы под номерами [62] - [68]. Результаты диссертации докладывались на международной конференции "Асимптотические методы в теории вероятностей и математической статистике"в Санкт-Петербурге в 1998 г.; на международной конференции молодых статистиков (EYSM) в Марли-ле-Руа (Франция) в 1999 г.; на международной конференции "Модели долговечности, старения и деградации в теории надежности, здравоохранении, медицине и биологии"в Санкт-Петербурге в 2004 г.; на семинаре летней школы по математической статистике в Торньоне (Италия) под руководством проф. К. Клаассена в 2004 г.; на семинаре СПбГУ по предельным теоремам теории вероятностей под руководством проф. В.В.Петрова в 1997 г.; на городском семинаре по теории вероятностей и математической статистике под руководством акад. И.А.Ибрагимова в 2005 г.

Заключение диссертации по теме "Теория вероятностей и математическая статистика"

Заключение

Результаты настоящей работы позволяют дать рекомендации по проверке экспоненциальности с помощью всех изучаемых статистик. В случае, когда нам неизвестен вид альтернативы, стоит воспользоваться одной из изученных нами статистик типа Колмогорова - Смирнова: статистики Лильефорса или статистики Барингхауза -Хенце. При этом статистика Барингхауза - Хенце в большинстве случаев предпочтительнее. Для рассмотренных альтернатив она обладает, как правило, чуть более высокой эффективностью, и при этом, в отличие от статистики Лильефорса, имеет стандартное предельное распределение. Впрочем, как видно из последней главы, существуют альтернативы, для которых и статистика Лильефорса локально оптимальна. К преимуществам этих двух статистик можно отнести еще и то, что для их состоятельности не требуется существования математического ожидания наблюдений при альтернативе.

Если известно, что при альтернативе распределение наблюдений принадлежит классу ВФИ (УФИ), то можно применить один из критериев первой или третьей группы, для которого выполнены условия теорем 2.2 или 2.5. Если же альтернатива регулярна и известен ее вид, то статистика первой или третьей группы, построенная согласно замечанию 4.1, при выполнении ряда условий является ЛАО по Бахадуру. Таким образом, нами предложен способ построения локально оптимальных по Бахадуру критериев, имеющих довольно простой вид и асимптотически нормальных.

10] abrahamson, i.g. Exact Bahadur efficiencies for the Kolrnogorov - Smirnov and Kuiper one- and two-sample statistics// Ann. Math. Stat., 1967, 38, No. 5,1475-1490.

11] Ahmad, I., Alwasel, I. A goodness-of-fit test for exponentiality based on the meinoryless property// J. Roy. Stat. Soc., 1999, B61, Pt. 3, 681 - 689.

12] Angus, J.E. Goodness-of-fit tests for exponentiality based on a loss-of-memory type functional equation// Journ. Statist. Plann. Inference, 1982, 6, 241 - 251.

13] Asher S. A survey of tests for exponentiality// Cornmun. Stat. Theory and Methods, 1990, 19, 1811 - 1825.

14] BAHADUR, R.R. Some limit theorem in statistics. Philadelphia: SIAM, 1971.

15]*Balakrishnan, N., basu A. (Eds.). The Exponential Distribution: Theory, Methods and Applications . Gordon and Breach: 1995.

16] baringhaus, L., Henze, N. A class of consistent tests for exponentiality based on the empirical Laplace transform// Ann. Inst. Statist. Math., 1991, 43, 551 - 564.

17] baringhaus, L., Henze, N. Tests of fit for exponentiality based on a characterization via the mean residual life function// Statistical Papers, 2000, 41, 225-236.

18] Bartholomew, D.J. Testing for departure from the exponential distribution// Biometrika, 1957, 44, 253 - 256.

19] Chernoff, H. A measure of asymptotic efficiency for tests of a hypothesis based on sums of observations//Ann. Math. Stat., 1952, 23, No. 4, 493-507.

20] D'Agostino, R., Stephens, M. Goodness-of-fit techniqus. New York: Marcel Dekker, Inc, 1986.

21] doksum, K.a., Yandell B.S. Tests of exponentiality. //In: Handbook of Statistics, 1984, 4(2), North-Holland, 579 - 612.

22] Durbin, J. Kolmogorov - Smirnov tests when parameters are estimated with applications to tests to exponentiality and tests on spacings// Biometrika, 1975, 62, 5-22.

23] Epps T.W., Pulley L.B. A test for exponentiality vs. monotone hazard alternatives derived from the empirical characteristic functions// J. Roy. Stat. Soc., 1986, Ser.B, 48, 206 - 213

24] Epstein, B. Testing for the validity of the assumption that the underlying distribution of life is exponential// Technometrics, 1960, 2, 1 - 2, p.83 - 101, 167 - 183.

25] Fortiana, G., Grane, A. A scale-free goodness-of-fit statistic for the exponential distribution based on maximum correlations// Journ. of Statist. Plann. Inference, 2002, 108, 85-97.

26] Gail, M.H. and GASTWIRTH, J.L. A scale-free goodness-of-fit test for the exponential distribution based on the Gini statistic// J. Roy. Stat. Soc., 1978, B40, No. 3, 350-357.

27] Girone, G. La distribuzione del rapporto di concentrazione per campioni casuali di variabili esponenziali. In: Studi di Probability, Statistica e Ricerca Operativa in onore di G. Pompilj, G. Dall'Aglio (ed.), 1971, Oderisi, Gubbio, 320 - 326.

28] Greenwood, M. The statistical study of infectuous diseases// J. Roy. Stat. Soc., 1946, Ser.A, 109, 85-110.

29] Grzegorzewski P., Wieczorkowski, R. Entropy-based goodness-of-fit tests for exponentiality// Commun. Stat. - Theor. Meth., 1999, 26, 1183 -1202.

30] Henze, N. and Klar, B. Testing exponentiality against the £-class of life distributions// Mathern. Meth. Stat., 2001, 10, 232 - 246.

31] Henze,N., Meintanis, S.G. Goodness-of-fit tests based on a new characterization of the exponential distribution// Commun. Statist. - Theor. Meth., 2002, A31, 1479 - 1497.

32] Henze,N., Meintanis, S.G. Recent and classical tests of exponentiality: a partial review with comparisons// Metrika, 2005, 61, 29 - 45.

33] Hollander, M., Proschan, F. Testing whether new is better than used// Ann. Math. Stat., 1972, 43, p. 1136 - 1146.

34] jackson, O.A.Y. An analysis of departures from the exponential distribution// J. Roy. Stat. Soc. , 1967, B29, 540-549.

35] klar, B. On a test for exponentiality against Laplace order dominance// Statistics, 2003, 37, 505 - 515.

36] KLAR, B. Tests for exponentiality against the M. and CM classes of life distributions// Test, 2005, 14, No.2.

37] Lilliefors, H. On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown// J. Amer. Stat. Ass., 1969, 64, 387-389.

38] litvinova, V.V. Asymptotic Properties of Some Tests for Exponentiality// Модели долговечности, старения и деградации в теории надежности, здравоохранении, медицине и биологии (Материалы международной конференции LAD'2004, Санкт-Петербург, 3-5 июня 2004), том 2, стр.206.

39] Metz, J.A.J., Haccou, P. and Meelis, E. On the Shapiro-Wilk test and Darling's test for exponentiality// Biometrics, 1994, 50, 527-530.

40] moran, P. The random division of an interval- Part II// J. Roy. Stat. Soc., Ser. B, 1951, 13, No. 1, 147-150.

41] Nabendu, P., Chun J. and Crouse, R. Handbook of Exponential and Related distributions for Engineers and Scientists. Chapman and Hall: 2002.

42] Nikitin Ya.Yu. Bahadur efficiency of a test of exponentiality based on a loss-of-memory type functional equation// J. Nonparametric Statist., 1996. 6, No. 1, 13 - 26.

43] Patel, Jagdish K., Kapadia, C.H., Owen, D.B. Handbook of statistical distributions. Statistics: Textbooks and Monographs., Vol.20. New York -Basel: Marcel Dekker Inc., 1976.

44] plachky, D., Steinebach, J. A theorem about probabilities of large deviations with an application to queuing theory// Periodica Mathematica Hungar-ica, 1975, 6, No. 4, 343-345.

45] PURI, p.S. and Rubin, H A characterization based on the absolute difference of two i.i.d. random variables// Ann. Math. Stat., 1970, 41, 2113-2122.

46] Randles, R.H. On the asymptotic normality of statistics with estimated parameters// Ann. Statist., 1982, 10, No. 2, 462-474.

47] Rank, R.F. Statistische Anpassungtests und Warscheinlichkeiten grofier Ab-weichungen. Vom Fachbereich Mathematik der Universitat Hannover zur Er-langung des Grades Doktor der Naturwissenschaften Dr.rer.nat. genehmigte Dissertation. Hannover, 1999.

48] Rao, J.S. Bahadur efficiency of some tests for uniformity on the circle// Ann. Math. Stat., 1972, 43, No.2, 468 - 479.

49] Rao, J.S. and Sethuraman, J. Weak convergence of empirical distribution functions of random variables subject to perturbations and scale factors// Ann. Statist., 1975, 3, No.2, 299-313.

50] Sen, K.S. and Srivastava P.V. Tests for exponentiality against new better than old in expectation and new better than some used in expectation alternatives// Сornmun.Statist. - Theor. Meth., 2000, 29, 157 - 180.

51] sethuraman, J., Rao, J.S. Pitman efficiencies of tests based on spacings// Nonparametric Techniques in Statistical Inference, 405-416, Cambridge: Cambridge Univ. Press, 1970.

52] Shanbhag, D.N. Characterizations for exponential and geometric distributions// J. Amer. Stat. Ass., 1970, 65, 1256-1259.

53] SHAO, Q.-M. Self-normalized large deviations// Ann. Probab., 1997, 25, 285328.

54] Shapiro, S., Wilk, M. An analysis of variance test for the exponential distribution complete samples// Technometrics, 1972, 14, 355-370.

55] Sherman, B. A random variable related to the spacing of sample values// Ann. Math. Stat., 1950, 421, 339 -361.

56] SHORACK, G.R. The best test of exponentiality against gamma alternatives// J. Amer. Stat. Ass., 1972, 67, No. 337, 213-214.

57] Shorack, G.R., Wellner, J.A. Empirical Processes with Applications to Statistics. New York: Wiley, 1986.

58] Spurrier, J.D. An overview of tests for exponentiality. // Commun. Statist. - Theor.Meth., 1984, 20, 33-35.

59] Stephens, M.A. On the W test for exponentiality with origin known// Technometrics, 1978, 13, 1635 - 1654.

60] taufer, e. and Jammalamadaka, S.R. Testing exponentiality by comparing the empirical distribution function of the normalized spacings with that of the original data// J. Nonparametric Stat., 2003, 15, No.6, 719 - 729.

61] Ziiou, X., Jammalamadaka, S.R. Bahadur efficiencies of spacings tests for goodness of fit// Ann. Inst. Statist. Math., 1989, 41, No. 3, 541-553.

Публикации автора по теме диссертации.

62] Чирина, А.В. Бахадуровская эффективность критерия экспоненциалыюсти, основанного на свойстве отсутствия последействия// Записки научных семинаров ПОМИ РАН, 1997, т. 244, с. 315-329.

63] Чирина, А.В. Асимптотическая эффективность и локальная оптимальность по Бахадуру критерия экспоненциальности, основанного на статистике Морана// Записки научных семинаров ПОМИ РАН, 2002, т. 294, с. 245-259.

G4] Чирина, А.В. Большие уклонения некоторых свободных от параметра масштаба функций от выборки из гамма-распределения// Записки научных семинаров ПОМИ РАН, 2003, т. 298, с. 252-279.

65] Nikitin, Ya.Yu., Tchirina, A.V. Bahadur efficiency and local optimality of a test for the exponential distribution based on the Gini statistic// J. Ital. Statist. Soc., 1996, Vol. 5, No. 1, 163-175.

66] Nikitin, Ya.Yu., Tchirina, A.V. Tests of exponentiality based on characterizations and their efficiencies. // Международная конференция "Асимптотические методы в теории вероятностей и математической статистике". Санкт-Петербург, 24 - 28 июня 1998 г. Тезисы докладов, стр.207 - 210.

67] TCHIRINA, A.V. Asymptotic properties of a test for exponentiality based on the Gini statistics. //Eleventh European Young Statisticians' Meeting (EYSM), Marly-le-Roi, France, August 24 - 28, 1999, pp. 186-199. http: / / www.inra.fr/miaj / public/SCS/EYSM/eysmactes.ps

68] TCHIRINA, A.V. Asymptotic Comparison of Scale-Free Exponentiality TestsjjМодели долговечности, старения и деградации в теории надежности, здравоохранении, медицине и биологии (Материалы международной конференции LAD'2004, Санкт-Петербург, 3-5 июня 2004 г.) , т. 2, стр. 308 - 309. т