Алгебраические методы оптимального статистического оценивания тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Сапожников, Павел Николаевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Пермь
МЕСТО ЗАЩИТЫ
|
||||
1998
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
Введение
Глава 1. Семейства вероятностных распределений, порожденных группами преобразований
1. Семейства сдвигов
2. Примеры нахождения инвариантных мер для некоторых хорошо известных групп и общий вид семейств сдвига на однородных пространствах этих групп.
3. Вспомогательные сведения и утверждения алгебраического характера
КГ 1
4. Структура экспонентных семейств сдвигов Я \
5. О характеризации экспонентной) семейства сдвигов достаточной статистикой-б'З
6. Примеры экспонентных семейств сдвигов, не допускающих характеризации с точностью до выбора начала отсчета
7. Семейства сдвигов на множествах матриц
8. О концепции достаточности в математической статистике
Глава 2. Алгебраический метод получения распределений достаточных статистик
1. Методы нахождения распределений функций случайных величин
2. Распределение достаточных статистик для семейств сдвигов общего вида. Алгебраические условия полноты достаточных статистик--—-х^о
3. Иллюстрация алгебраического подхода получения плотностей распределения достаточных статистик для семейств сдвига
4. Распределение достаточных статистик для семейств сдвига при нарушении условий регулярности
5. Универсальные формулы получения НОРМД произведения плотностей
6. Некоторые приложения. Иллюстрация алгебраического метода получения НОРМД произведения плотностей семейства сдвигов
7. Алгебраический подход к оцениванию и характеризации линейной регрессии
Глава 3. Прогностические оценки плотностей
1. Эквивариаятные обобщенно байесовские оценки произведения плотностей семейства сдвигов
2. Унификация процедур оптимального оценивания плотностей экспонентного семейства сдвигов
3. Распределения некоторых инвариантов и их роль в задачах оптимального оценивания плотностей- '
4. Примеры нахождения плотностей распределения инвариантов и оптимальных оценок
5. О характеризации распределений распределением инвариантов
6. Примеры характеризаций распределением инвариантов
Диссертация посвящена разработке методов статистического оценивания и характеризации инвариантных семейств распределений некоторыми свойствами статистик. Предполагается, что значения наблюдаемых случайных элементов могут быть не только числами (или числовыми векторами), но и точками поверхности (многообразия) достаточно общего вида. Ограничение, которому должна удовлетворять область значений случайного элемента, состоит в том, что при воздействии любого преобразования из некоторого множества <9 точки этой области переходят в точки той же области (многообразия), а само множество преобразований содержит тождественное преобразование, обратное преобразование для каждого элемента и любое преобразование, являющееся результатом последовательного выполнения двух преобразований. Множество преобразований с указанными свойствами называют группой, а многообразие X, точки которого преобразуются в точки того же многообразия под воздействием любого преобразования из группы С, - ее инвариантным пространством или ^-пространством [34]. Если любая точка многообразия X может быть переведена в любую другую с помощью некоторого преобразования из С, его называют однородным пространством этой группы преобразований. Распределение случайного элемента со значениями на (^-пространстве также преобразуется определенным образом, если сам случайный элемент подвергается воздействию какого-либо преобразования из в. В результате данному случайному элементу можно поставить в соответствие семейство, элементами которого являются распределения случайных элементов, полученных всевозможными преобразованиями из
О исходного случайного элемента. О таком семействе говорят, что оно порождено сдвигами фиксированного распределения или является семейством сдвигов. Случайный элемент, распределение которого принадлежит семейству сдвигов, будем называть совокупностью сдвигов.
Прообразами совокупностей сдвигов являются случайные величины со значениями на вещественной прямой, плотности распределения которых принадлежат одному из следующих параметрических семейств:
Л(* - о), (£), -ьь , а е я1, ъ > о, где fk(x) - заданные плотности распределения. Если - случайная величина с плотностью распределения /к(%) относительно меры Лебега, то плотности распределения случайных величин £1 + а, Ь ■ £2, Ь • £3 + а принадлежат указанным семействам, соответственно. Исследованию указанных семейств (совокупностей), называемых в отечественной литературе семействами сдвига и (или) масштаба, посвящено значительное число работ. Рассмотрение таких семейств началась с работы Е.Питмена (1939,[126]), в работе Е.Б.Дынкина (1951, [15]) было получено описание экспонентных семейств сдвига, допускающих нетривиальные достаточные статистики на основе повторной выборки. Задачи оценивания параметров, функций параметров и характеризации этих семейств рассматривались в работах [144, 98, 97, 100, 24, 51, 29, 22] и др. Так как в диссертации термин "сдвиг" служит синонимом термина "преобразование посредством некоторого элемента из группы преобразований достаточно общего вида ", то все указанные семейства плотностей являются частными примерами семейств сдвига.
Проблема характеризации семейств сдвига, допускающих нетривиальные достаточные статистики на основе повторной выборки, вновь появилась и была решена в работе В.М.Максимова (1967, [44]) уже для случайных совокупностей, заданных на бикомпактной топологической группе. В ранних работах П.Сапожникова [56, 58] показано, что при условиях регулярности Дынкина-Брауна (1964, [86]) инвариантное семейство, заданные на однородном пространстве связной группы Ли Ст, тогда и только тогда допускает нетривиальную достаточную статистику, на основе повторной выборки, когда оно является экспонентным и линейное пространство порожденное логарифмами плотностей семейства и константы является инвариантным пространством представления группы С?.
Однако ни в одной из указанных работ не рассматривался вопрос о структуре параметрических функций экспонентного семейства сдвигов, играющих решающую роль в характеризации семейств заданной достаточной статистикой. В первой главе диссертации получены алгебраические уравнения для параметрических функций экспонентного семейства сдвигов, коэффициентами которых являются элементы матрицы представления группы преобразований в базисе инвариантного пространства, порожденного направляющей функцией семейства и константой. Указаны необходимые и достаточные условия характеризации регулярных семейств сдвига достаточной статистикой с точностью до инвариантных параметров без привлечения аппарата характеристических функций. Дело в том, что обобщение классического подхода к характеризации распределений свойствами статистик, разработанного в книге А.М.Кагана, Ю.В.Линника, С.Р.Рао (1972, [25]) и основанного на использовании аналитических свойств характеристических функций случайных величин и (или) векторов, на инвариантные статистические модели общего вида сопряжено со значительными принципиальными трудностями [51]. Кстати, на возможность характеризации достаточностью, реализованным в диссертации методом, указывают сами авторы книги [25].
Нерегулярный случай представлен семействами сдвигов, порожденных распределениями прямоугольных матриц и векторов, элементами которых являются такие матрицы. Распределения из этих семейств непосредственно, или после незначительной модификации, служат основой получения оптимальных оценок произведения плотностей в смысле различных критериев, которые будут получены в 3-ей главе, см. также [3].
Одно из центральных мест в теории оценивания на основе инвариантных статистических моделей занимают эквивариантные оценки параметра сдвига. Методы получения и свойства этих оценок рассматривал А.Л.Рухин на абелевой группе (1970, [51]) и многомерной сфере (1972, [53]). Инвариантные статистические модели общего вида отношения между ними и свойства эквивариантных решающих правил (частным случаем которых являются эквивариантные оценки) изучены в работе Г.П.Климова и А.Д.Кузьмина (1975, [34]). Эквивариантные оценки параметра сдвига для ряда избранных статистических моделей, статистические свойства этих оценок, задачи характеризации мизесовских семейств и устойчивости характеризации получены в работах В.Н.Никулина (1985, [46, 47] и др.). В диссертации эквивариантные оценки параметра сдвига также играют ключевую роль во всех построениях, поэтому в первой главе указан новый метод получения этих оценок. Несмотря на отмеченную сложность решения проблемы построения оптимальных эквивариантных оценок, предложенный метод легко реализуется, так как здесь находится просто эквивариантная оценка в весьма узком классе статистик. Результаты первой главы отражены в публикациях [63, 64, 66, 136] и докладывались на международных конференциях Перми 1992, Казани 1994, Эгере 1996, Минске 1995.
Известно, что при наличии полных достаточных статистик оптимальные решения обычно являются функциями этих статистик. Поэтому нахождение распределений достаточных статистик обычно является составной частью практической реализации статистических методов. Принципиально простой подход к ее решению основан на идее замены переменных в факторизационном тождестве Халмоша-Сэвиджа (1949, [106]), что позволяет представить плотность распределения достаточной статистики в виде произведения двух множителей, один из которых не зависит от параметра. Непосредственное нахождение этого множителя, как правило, представляет собой технически сложную задачу. Возможность обойти эту трудность в статистических моделях, наделенных структурой сдвигов, была указана в работе Раша (1948,[131]) для нахождения распределения Уишарта. Суть его подхода в том, что свободный от параметров функциональный множитель не вычисляется непосредственно, а рассматривается как функция, удовлетворяющая определенному набору уравнений. Позднее, этот подход, называемый методом функциональных уравнений, применяли Г.П.Климов для вычисления фидуциальных распределений (1973, [33]), В.Л.Гирко в задачах нахождения распределений собственных значений случайных матриц (1988, [13]) и другие. Новизна, рассматриваемых в главе 2 результатов, заключается в том, что здесь получены условия существования решений функциональных уравнений, возникающих при нахождении распределения достаточной статистики и Нсшден общий вид решения этих уравнений. Это позволило указать универсальные формулы для плотности распределения эквивариантных достаточных статистик с точностью до нормирующей константы, нейтральные по отношению к высокой размерности пространства достаточных статиг.тик. как для регулярных, так и для нерегулярных семейств сдвига. Услишае применимости формул является алгебраическим и заключается в однородности внутренности пространства значений достаточной статистики относительно группы аффинных преобразований, порожденной выбран ной статистикой. Показано, что для экспонентного случая это условие однородности эквивалентно полноте достаточной статистики и является необходимым условием полноты в общем случае. При отсутствии полноты указана модификация формулы, которая позволяет найти распределение эквивариантной части достаточной статистики. Однако во многих задачах необходимо иметь именно распределение инвариантной части достаточной статистики, так называемой дополнительной (или вспомогательной) статистики. Метод функциональных уравнений, к сожалению; здесь бессилен, и задача остается чрезвычайно сложной. Некоторые примеры нахождения распределений дополнительных статистик указаны в параграфе 4. В качестве приложения полученных формул в пятом параграфе этой главы указан новый метод получения несмещенных оценок равномерно минимальной дисперсии. Основные результаты главы содержатся в статьях [67, 68, 69, 70] и докладывались на семинарах "По проблемам устойчивости стохастических моделей" [132, 134].
Третья глава посвящена проблеме получения оптимальных оценок плотности распределения исходной совокупности, рассматривавшейся в работах [37, 31, 36, 90, 96, 121, 122, 125, 148, 149, 150] и ряде других. Термин "оптимальная оценка" в рамках диссертации означает оценку принадлежащую одному из следующих классов: несмещенных оценок равномерно минимальной дисперсии и оценок минимизирующих априорный риск в классе эквивариантных прогностических оценок для ряда популярных типов функций потерь: Кульбака-Лейблера, интегральной квадратичной функции потерь, функции потерь Хеллингера, хи-квадрат и др. Эти оценки, будучи оценками плотности ненаблюдаемых случайных элементов, принципиально отличаются от несмещенных оценок равномерно минимальной дисперсии, которые являются оценками плотности части выборки по всей выборке [40]. Несмотря на это, существуют такие семейства плотностей, для которых оба типа оценок могут быть получены из одной и той же формулы (генератора оптимальных оценок) посредством алгебраических преобразований [66, 67, 69, 133, 135, 137, 139, 70]. В гл. 3 показано, что генератор оптимальных оценок существует для всякого экспонентного семейства сдвигов, заданного на однородном пространстве связной группы Ли и допускающего полную достаточную статистику. Получены универсальные формулы для построения генератора оптимальных оценок произведениия плотностей на основе повторной выборки из экспонентной совокупности сдвигов.
Установлена глубокая связь между максимальными инвариантами в избранных классах статистик и оптимальными оценками плотностей, а также получены общие формулы для распределения соответствующих инвариантов [68, 135]. Два последних параграфа третьей главы посвящены приложению алгебраических методов к проблеме характеризадми семейств сдвига распределением подходящих инвариантов, постановка которой содержится в работе Ю.В.Прохорова ([50], 1965). Получено достаточно общее и конструктивное решение проблемы характеризацик регулярных в смысле Дынкина-Брауна семейств сдвига распределением избранных максимальных инвариантов. В этих методах не используется аппарат характеристических функций, поэтому они существенно отличаются от результатов работ [25, 92] и в значительной мере нейтральны к высокой размерности многообразия элементарных исходов. Одна из первоначальных попыток реализации этой идеи отражена в тезисах [61]: Новые результаты докладывались на международных конференциях в Дебрецене 1997 и Вологде 1998 и опубликованы в [138, 136]. В последнем параграфе наряду с известными ха.ра.ктериза.циями одномерных распределений приведен ряд примеров характеризации распределений много мерного статистического анализа и указаны подходы к получению иных идейно близких результатов. Значительная часть результатов диссертации содержится в монографии [70].
1. Абусев P.A. Групповая классификация. Пермь: Изд-во Перм. ун-та, 1992.
2. Абусев P.A., Лумельский Я.П. Статистическая групповая классификация. Перм. ун-т. Пермь. 1987.
3. Абусев P.A., Лумельский Я.П. Математические модели классификации многомерных наблюдений. Обозрение прикладной и промышленной математики. 1996, Т. 3, вып. 1, С. 7-30.
4. Андерсон Т. Введение в многомерный статистический анализ. М.: Наука, 1963.
5. Баррут А., Рончка Р. Теория представлений групп и ее приложения. М: Мир, 1980. Т.1.
6. Бейтмен Г., Эрдейи А. Высшие трансцендентные функции. М.: Наука, 1973. Т.1; 1974. Т.2.
7. Бурбаки Н. Общая топология. М.: Наука, 1968.
8. Боровков A.A. Математическая статистика. М.: Наука, 1984.
9. Вахания H.H., Тариеладзе В.П., Чобанян С.А. Вероятностные распределения в банаховых пространствах. М.: Наука, 1985.
10. Виленкин Н.Я. Специальные функции и теория представлений групп. М: Наука, 1965.
11. Воинов В.Г., Никулин М.С. Несмещенные оценки и их применения. М.: Наука, 1989.
12. Володин И.Н. О различении распределений Гамма и Вейбулла . Теория вероятностей и ее прим. 1974. Т. XIX, вып.2, С.398-404.
13. Гирко. Спектральная теория случайных матриц. М.: Наука, 1988.14 1516 17 [18 [192021 2223