Регрессивный инфлюентный анализ с применением ортогональных полиномов Чебышева тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Свиркин, Михаил Владимирович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1999 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Диссертация по математике на тему «Регрессивный инфлюентный анализ с применением ортогональных полиномов Чебышева»
 
 
Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Свиркин, Михаил Владимирович, Санкт-Петербург

САНКТ-ПЕТЕРБУРГСКИИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Свиркин Михаил Владимирович

РЕГРЕССИОННЫЙ ИНФЛЮЕНТНЫЙ АНАЛИЗ С ПРИМЕНЕНИЕМ ОРТОГОНАЛЬНЫХ ПОЛИНОМОВ ЧЕБЫШЕВА

Специальность: 01.01.09 - математическая кибернетика Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель: доктор физико-математических наук, профессор

Хоменюк Владимир Владимирович

Санкт-Петербург 1999

ОГЛАВЛЕНИЕ

Введение..........................................................................................................4

Глава I. Восстановление законов распределения вероятностей.................11

§ 1. Плотности распределения случайных величин и системы

ортогональных полиномов, задаваемые уравнением Пирсона............11

§ 2. Нахождение эмпирической плотности распределения

вероятностей по методу Грама - Шарлье...........................................25

§ 3. Разложение плотности распределения вероятностей по системам

ортогональных полиномов.......................1.. .......................................34

Глава II. Методы регрессионного анализа и системы ортогональных

полиномов...............................................................................................41

§ 1 .Меры связи и формы зависимостей случайных величин.......................41

§ 2. Построение однофакторных моделей регрессий через ортогональные полиномы Чебышева..............................................................................52

§ 3. Композиционный принцип построения многофакторных полиномиальных моделей регрессии..........................................................................68

Глава III. Регрессионный инфлюентный анализ...........................................82

§ 1. Основные положения и подходы к решению задач

инфлюентного анализа..........................................................................82

§ 2. Решение основных задач инфлюентного анализа.................................90

§ 3. Регрессионный инфлюентный анализ экологической

системы.....................................................................................................94

Заключение ................................................................................................. 101

Литература.................................................................................................. 102

Приложение..................................................................................................107

Введение.

В настоящее время в различных областях научных исследований (создание, исследование функционирования сложных систем и управление ими) все большее внимание привлекают проблемы разработки методов оценивания результатов функционирования сложных систем. В современной научной литературе теория и практика управления сложными системами рассматривается, как правило, с позиций разработки математических методов моделирования и оптимизации функционирования сложных систем. Однако, для того, чтобы разобраться в особенностях функционирования сложной системы, недостаточно знать пространственно - временную и функционально - целевую структуры сложной системы, факторы и показатели ее функционирования. Необходимо уметь находить оценки влияния этих факторов на изменение результирующего показателя. Методы же анализа и получения оценок результатов деятельности систем (по плановым и фактическим значениям показателей и факторов), практически не рассматривались, хотя необходимость в развитии этого направления обусловлена необходимостью получения объективной информации органами управления и принятия решения по дальнейшему совершенствованию и повышению эффективности деятельности системы.

В диссертационной работе разработаны новые методы математического аппарата регрессионного инфлюентного анализа для нахождения оценок влияния изменений факторов на отклонения результирующих показателей по заданным плановым и фактическим значениям и полученным зависимостям показателей от факторов. Оценки влияния определяют ха-

рактер воздействия изменяющихся факторов на отклонение показателя выполнения плана в положительную или отрицательную сторону и дают возможность упорядочить факторы по характеру и степени их влияния, то есть служат основой для формирования процедур принятия решений. Это означает, что с позиций регрессионного инфлюентного анализа процесс принятия решений в сложных системах основывается на оценках влияния факторов (определяемых по результатам деятельности системы), выявлении "узких" мест (наихудших факторов), детализации причин и формировании вариантов по дальнейшему совершенствованию и повышению эффективности функционирования системы.

Постановка задачи.

Рассмотрим некоторую сложную систему & Пусть деятельность этой системы характеризуется совокупностью результирующих показателей уь... ,ут зависящих от выбранной совокупности факторов х,,..., хи Не

умаляя общности (далее это будет показано), будем считать, что имеется один результирующий показатель, то есть у - скаляр, и он зависит от факторов х5,...,хи.

Поставим задачу: проанализировать деятельность системы и сформулировать условия по совершенствованию ее функционирования. При этом будем считать, что зависимость между результирующим показателем у = / (хх,...,хп) и выбранной совокупностью факторов хх, ...,хпнеизвестна. Решать эту задачу будем методами регрессионного

инфлюентного анализа. Использование методов детерминированного инфлюентного анализа, в такой постановке задачи, невозможно, так как нет явной аналитической зависимости и предполагается, что влияние неучтен-

ных факторов элиминировано (то есть либо не учитывается , либо исключено). На практике, как правило, аналитические зависимости неизвестны, а результирующие показатели и факторы представлены соответствующими выборочными значениями. Поэтому для выяснения их зависимости возникает необходимость использования методов регрессионного инфлюентного анализа.

Пусть результирующий показатель деятельности системы у и совокупность факторовх,,... ,хи, от которой результирующий показатель зависит, заданы своими плановыми и фактическими значениями:

У — плановые значения результирующего показателя у, {у^}^,,

у1— фактические значения результирующего показателя у, {у)}^,

{х®,• • •,х°п} - плановые значения факторов {х°}, 1 = \,п, / = 1, /V .

,х1п) -фактические значения факторов {х *}, I = 1,п, ] = 1,N .

При этом неизвестна зависимость результирующего показателя от факторов, и выбранная совокупность факторов не обязательно полная, то есть на значения у могут оказывать влияние и другие неучтенные факторы.

В общем виде задачи решаемые в диссертационной работе могут быть описаны следующим образом:

1. Найти непараметрическую оценку кривой распределения вероятностей, отвечающей дополнительным требованиям

a) оценка кривой распределения вероятностей должна иметь вид, удобный для дальнейших приложений , а именно представляться в виде разложения по системе ортогональных полиномов.

b) Должна иметься возможность сравнения полученной оценки кривой распределения вероятностей с некоторой базовой известной кривой распределения вероятностей.

2. Найти /°,/': / = • •,), У = /'«,-,х\) ■

3. Найти инфлюенты - оценки влияния факторов на Ау = у1 - у".

Для решения первой задачи - нахождение оценки непараметрической плотности распределения вероятностей, в диссертационной работе разрабатывается новый метод, основанный на использовании метода кривых Пирсона, рядов Грама-Шарлье и общего подхода по разложению функций распределения по ортогональным полиномам Чебышева. Далее полученный метод будет применен во второй главе диссертации для нахождения условного закона распределения вероятностей.

Для нахождения оценок влияния факторов на результирующий показатель системы необходимо восстановить зависимости плановых и фактических значений результирующего показателя от плановых и фактических значений факторов соответственно, учитывая данные выборки. Зависимости (по плану и факту) соответственно будем искать в виде многофакторной модели регрессии. То есть будем строить две кривые регрессий:

, у =/>;,•-X) ■

Найдя эти модели, уже можно будет решать задачи инфлюентного анализа, в частности основную задачу регрессионного инфлюентного анализа: нахождение оценок влияния изменения факторов на изменение результирующего показателя.

Так, учитывая аксиому регрессионного инфлюентного анализа:

д, = £ А» + л£,,

1 = 1

где А^— оценка влияния изменения фактора х, на изменение результирующего показателя у (инфлюента),

А — оценка влияния неучтенных факторов, представление отклонения результирующего показателя получим в виде:

Таким образом решение задачи сводится к отысканию плановой и фактической зависимостей между показателем и факторами и применению методов инфлюентного анализа. В отличие от детерминированного ин-флюентного анализа (в котором предположение о задании аналитической зависимости у = / (х), по существу, заранее исключает влияние прочих факторов, кроме тех, зависимость от которых функционально содержится в /(х)), здесь возникает новая проблема - оценить степень влияния неучтенных факторов, так как регрессионные модели представляют собой не "законы" связи результирующего показателя у с факторами ххп, а статистическую форму зависимости в среднем значений у от ххп по заданной выборке. Влияние неучтенных факторов характеризуется наличием остаточной дисперсии и значениями свободных членов регрессионных моделей /*. (Особо стоит проблема устойчивости влияния неучтенных факторов, поведение их при увеличении степени полиномов).

При построении многофакторных моделей регрессий возможны два принципиально разных подхода.

Если изначально предполагать существование некоторой функциональной зависимости между показателем и факторами, то следует находить неизвестную аналитическую зависимость. Для этого можно, например, воспользоваться Чебышевскими формулами интерполирования, которые выражаются при помощи его ортогональных полиномов.

Если же априори можно говорить лишь о вероятностной связи между случайными величинами, то тогда в качестве зависимости следует брать регрессионную зависимость. То есть, исходя из определения, находить её как условное математическое ожидание результирующего показателя. В связи с чем необходимо прежде восстановить плотность распределения

фактора и условную плотность распределения показателя каким-либо непараметрическим способом.

Обе возможные ситуации (функциональная и вероятностная) будут подробно исследованы. Следует отметить, что в вероятностном методе непараметрическая оценка плотности распределения вероятностей, получаемая проекционным способом, т.е. в результате проекции в некоторую ортогональную систему, как и в случае функциональной зависимости, будет выражаться в терминах ортогональных полиномов Чебышева.

В диссертационной работе показано, что наиболее оправданным, с методологической и с вычислительной точек зрения, является представление многофакторной модели регрессии в виде линейной композиции од-нофакторных моделей регрессии:

1=\

п

где а = (а1,---,ап) вектор параметров а1 > 0; = 1 ,

г=1

а fl (х1)— однофакторные полиномиальные регрессии.

Используя в качестве меры точности остаточную дисперсию, оказывается, что композиционная многофакторная модель регрессии сколь угодно точно отражает неизвестную зависимость результирующего показателя от выбранной совокупности факторов, если однофакторные модели регрессии найдены достаточно точно.

Строиться однофакторные модели регрессии будут в виде интерполяционного ряда Чебышева. Поэтому в диссертации представлена общая теория построения ортогональных полиномов по способу Чебышева.

Для построения регрессий необходимо строить подходящие системы ортогональных полиномов. В диссертации предлагается следующий подход для решения этой задачи: используя теорию построения кривых

Пирсона и обобщенную формулу Родрига, построить ортогональные полиномы соответствующие кривым Пирсона, полученным по заданным выборочным данным. Далее, обобщая метод построения кривых Грама - Шар-лье, получить разложение эмпирической плотности распределения вероятностей по ортогональным полиномам с весовыми функциями равными кривым Пирсона.

Далее строить композиционные многофакторные полиномиальные регрессии по плану и факту соответственно, и на их основе решать задачи регрессионного инфлюентного анализа.

Глава I. Восстановление законов распределения вероятностей.

В данной главе построен метод получения непараметрической оценки кривой распределения вероятностей на основе применения метода кривых Пирсона, рядов типа Грама-Шарлье, обшей теории классических ортогональных полиномов, теории непрерывных дробей и подхода Чебышева по разложению в ряд по ортогональным полиномам закона распределения вероятностей. Полученная оценка кривой распределения вероятностей, удовлетворяет требованиям, сформулированным в общей постановке задач, решаемых в диссертационной работе.

§1. Плотности распределения случайных величин и системы ортогональных полиномов, задаваемые уравнением Пирсона.

Одним из методов нахождения неизвестной плотности распределения вероятностей на основе выборочных данных является метод системы кривых Пирсона. С помощью этого метода можно получить, основываясь на выборке, отвечающей некоторой случайной величине, эмпирическую плотность распределения.

В зависимости от некоторых параметров, связанных с коэффициентами дифференциального уравнения Пирсона, различают восемь типов кривых Пирсона, включая нормальное распределение [32]. Поэтому этот метод будет использован нами для классификации выборочных распределений, а далее для построения систем ортогональных полиномов, соответствующих различным типам решений уравнения Пирсона.

и

Получение и классификация кривых Пирсона.

В своих работах по математической статистике К. Пирсон детально исследовал биномиальное распределение и затем перешел к рассмотрению более сложных стохастической схем, чем схема Бернулли. В частности он рассмотрел задачу приближения гипергеометрического распределения непрерывной кривой. В результате было получено дифференциальное уравнение [32] вида

1 dy _ х

у dx а0х + а^х + а2 '

интегральная кривая которого является непрерывной и приближенно представляет дискретное гипергеометрическое распределение.

Передвинув начало координат в какую-нибудь другую точку на оси х,

и, обозначив через X моду кривой для новых осей, мы получим уравнение

1 dy = х — X у dx b0x2 +bxx + b2

Уравнение (1) называется дифференциальным уравнением Пирсона. Кривые, получаемые из него, называются кривыми распределения Пирсона. Таким образом, кривые Пирсона являются решением дифференциального уравнения Пирсона, которое он вывел из гипергеометрического распределения, а затем обобщил его на другие типы распределений. Английская статистическая школа конца 19-го, начала 20-го веков, в отличие от российской и скандинавской, отличалась нестрогим математическим подходом при доказательствах, то есть многие положения были основаны на эмпирических выводах. Так было и с кривыми Пирсона. Они имели уже широкое применение на практике, в частности в задачах страхования, но не имели должного теоретического обоснования. Но сначала A.A. Марков

теоретически обосновал большинство типов кривых (за исключением типов IV и VII ), а затем, и А.Н. Колмогоров показал, что можно построить стохастические схемы, которые приводят к любой из кривых Пирсона. Таким образом кривые Пирсона получили строгое математическое обоснование.

Отметим наиболее важные свойства кривых Пирсона, выполнение которых действительно характеризует любое решение дифференциального уравнения Пирсона как некоторую кривую распределения вероятностей, и выполнение которых мы далее будем принимать по умолчанию.

1) на концах интервала распределения мы должны иметь либо у- О, либо хк(Ь0х2 +Ьхх + Ь2) = 0 для к, принимающего целые положительные значения (включая ноль) до некоторого предела, который не менее 4;

2) в промежуточных точках у должно быть положительным числом;

3) площадь под кривой должна равняться объему выравниваемого распределения.

С учетом этих свойств будут исследоваться кривые, представленные уравнением (1). Далее рассмотрим принцип классификации, по которому все решения дифференциального уравнения Пирсона будут разбиты на соответствующие типы распределений. Дополнительно рассмотрим условия, которым должны дополнительно удовлетворять решения (1), чтобы их можно было использовать при построении нового метода нахождения кривых распределения вероятностей.

Рассмотрим некоторую случайную величину представленную выборочными данными х1,...,хм, где N - объем выборки. Используя однозначную связь между коэффициентами уравнения Пирсона и моментами случайной величины £ можно найти соответствующий тип распределения Пирсона.

Использование эмпирических моментов вместо теоретических может привести к неоднозначности выбора типа распределения Пирсона. И это должно учитываться при дальне