Многомерные исследовательские группировки в сложных системах: матрично-аппроксимационный подход тема автореферата и диссертации по математике, 01.01.11 ВАК РФ

Миркин, Борис Григорьевич АВТОР
доктора технических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1989 ГОД ЗАЩИТЫ
   
01.01.11 КОД ВАК РФ
Автореферат по математике на тему «Многомерные исследовательские группировки в сложных системах: матрично-аппроксимационный подход»
 
Автореферат диссертации на тему "Многомерные исследовательские группировки в сложных системах: матрично-аппроксимационный подход"

(о

ВСЕСОЮЗНЫЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ СИСТЕМНЫХ ИССЛЕДОВАНИЙ АН СССР И ГОСПЛАНА СССР

Специализированный совет Д 003.63.02

На правах рукописи

УДК 007

МИРКИН Борис Григорьевич

МНОГОМЕРНЫЕ ИССЛЕДОВАТЕЛЬСКИЕ ГРУППИРОВКИ В СЛОЖНЫХ СИСТЕМАХ: МАТРИЧН0-АППР0КСИМАЦИ0ННЫЙ ПОДХОД

Специальность 01.01.11 — Системный анализ и автоматическое управление

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора технических наук

МОСКВА 1989

Работа выполнена в Центральном экономико-математическом институте АН СССР

Официальные оппоненты:

член-корреспондент АН СССР доктор физико-математических наук профессор Журавлев Ю. И. доктор технических наук Маркова Е. В. доктор технических наук Д о р о ф е го к А. А.

Ведущая организация — Институт экономики и прогнозирования научно-технического прогресса АН СССР

Защита состоится «_»_19-г. в-час. на

заседании Специализированного совета Всесоюзного научно-исследовательского института системных исследований по адресу: г. Москва, проспект 60-летия Октября, д. 9. Телефон Совета: 135-54-57

С диссертацией можно ознакомиться в библиотеке Всесоюзного научно-исследовательского института системных исследований.

Автореферат разослан «_»_ 19_г.

Ученый секретарь Специализированного совета д. ф.-м. н.

В. С. Левченков

ОНЦАЯ ХАРАКТЕРИСТИКА РАБСТУ Актуальность теш

Исследовательская группировка - это группировка объектов на основе многомерной разнородной (количественной, качественной, структурной и пр.) информации, предназначенная для выявления закономерностей функционирования сложных социальных, технических, биологических систем. Разработка методологического, математического и методического аппарата исследовательской группировки необходима не только для использования в фундаментальных или прикладных научных исследованиях, но и в качестве важной составной части систем обработки данных для задач социального управления и автоматизации принятая решений. Формирование типологии населения по образу жизни или городских поселений по уровне их социально-экономического развития на основе комплексной статистической и анкетной информации; выявление формы связей между отдельный аспектами социального поведения, отраженными "крупными блоками" вопросов анкетного исследования; анализ структуры сложной организационной системы; исследование и контроль знаний - вот типичные примеры, показывающие, что задачи исследовательской группировки находятся на стыке таких научных направлений, как системный анализ и принятие решений, прикладная н математическая статистика, информатика.

Различные аспекты указанной проблематики разрабатываются в трудах таких известных советских специалистов, как С.А. Айвазян, Ц.А.Айзерман, Г.Б.Бокий, ВЛ.Волкович; Е.Н.Гаврилец, А.АДорофеся, С.В.Емельянов, Ю.К.Журавлев, Н.Г.Загоруйко, Т.Л.Заславская, А.Г.Ивахненко, О.И.Ларнчев, Г.С.Поспелов, Д.А.Поспелов и др., а также иностранных исследователей: О.Араби, ЛШ^дмзн, Э.Дидэ, У.Крускэл, Р.Шепард, Д.Тызки, Д.1артигэн и др.

-г -

Вместе с тем проблематика исследовательской группировки как самостоятельный объект не выделена и не систематизирована . Привлекаемый математический и алгоритмический аппарат (прежде всего методы распознавания образов, факторного и кластерного анализов) не приспособлен для решения задач исследовательской группировки, а именно:

а) поскольку задачи исследовательской группировки не систематизированы, то отсутствует сколько-нибудь универсальный комплекс методов для их решения;

б) хотя для некоторых типов задач методы их решения для определенных данных имеются, но они, как правило, не "состыкованы" ни по входной информации, ни по критериям обработки, что не дает возможности получать сопоставимые решения;

в) слабо разработаны вопросы оценки степени соответствия получаемых группировок и имепцихся данных и тем более формирования интерпретируемых характеристик;

г) при организации вычислений даже по приемлемым конкретным алгоритмам используется много гкспертно задаваемых характеристик (формулы расчета мер близости между объектами и классами, число классов, порог существенности связи и т.п. для выбора которых нет сколько-нибудь четких рекомендаций.

Таким образом, для создания аппарата многомерной исследовательской группировки необходимо выполнить систематизации и форшлизациг задач исследовательской группировки для разнотипных многомерных данных разработать го мл леке моделей, методов и алгоритмов решения этих задач, связанный с существующими подходами многомерной статистики, во без'указанных недостатков.

Цель работы; разработка методологического, математического и методического аппарата исследовательской группировки, его теоретическое и экспериментальное обоснование с учетом поставленных задач.

Методика проведения исследований. В исследовании использова-

ны метода системного анализа, обцей и. прикладной многомерной статистики, теории линейных пространств. Для экспериментального обоснования разработано и многократно апробировано програшное обеспечение для ЭВМ различных типов. Научная новизна работы.

1. Выделены основные типы исследовательских группировок (представляющая, структурная, относительная), разработана концепция их формализации и алгоритмизации на основе матрич-но-аппроксимационного подхода;

2. Предложены штричные модели представления разнотипной информации (количественные и качественные признаки, группировки, распределения, множества, бинарные отношения, графы, матрица связи), позволявсна единообразным способом представлять разнородные' данные и соизмерять их друг с другом;

3. Разработан штрично-аппроксимационный аппарат формирования основных типов исследовательской группировки, согласующийся с традиционными средствами многомерной статистики, включая меры связи признаков и объектов, а также дисперсионные характеристики вклада различных элементов решения в разброс исходных данных. В этих яе терминах квадратичного разброса применительно к рассматриваемым задаем дан вариант решения фундаментальной проблемы соотношения количественной и качественной информации;

4. Показано, как предложенные матрично-аппроксимационные критерии исследовательской группировки могут Сыть эквивалентным образом переформулированы для различных способов представления данных (распределения, матрицы ойьек*-признак, матрицы связи). При атом оказалось, .что - указанные критерии могут быть интерпретированы и в геометрических терминах кластер-анализа, и в терминах статистического подхода к построению группировок, и в терминах исследования структуры связей между объектами, что позволяет рассматривать матрично-аппро-ксимационный подход как ойцую базу теории автоматической классификации;

5. Исходя из указанных критерив с помощью моделирования

оскошых приемов логического грушшрования (на основе предложенных автором принципа оследовательного исчерпания ж концепцаи локального алгоритма классификации) разработаны матрично-аппроксимационные алгоритмы группировки, следующие традиционным схемам кластер-анализа, но более эффективные в следующих отношениях:

- теоретическом: увязывают различные критерии грушшров-ки, приводят к заведомо "компактным" кластерам;

- прикладном: позволяет обрабатывать разнотипные данные, сопровождаются большим количеством интерпретирующих характеристик, дают согласованные решения при разных способах представления данных,

- вычислительном: позволяют автоматизировать выбор основных параметров алгоритмов (числа классов, порога существенности, мер близости между объектами в классами), выбирать необходимую глу&ну вычислений;

6. В рамках матрично-апароксимацисвного подхода предложены методы решения ряда новых задач анализа данных: для целей представляющей группировки - методы качественного факторного анализа для разнотипных данных (включая методы построения аддитивных кластеров) ж порядковой классификации; для целей структурной группировки - методы выявления структуры основных связей; для целей относительной группировки -методы оценки связей и взвешивания разнотипных признаков, выявления детерминирующих подсистем и формирования иерархических группировок;

7. Разработаны методические вопросы использования предложенных методов представляющей группировки при типолотачес-ком анализе многомерных статистических таблиц (метод главных кластеров), исследовании образа жизни (порядковая классификация) , анализе структуры знаний (аддитивные кластеры);

8. Разработаны методические вопросы использования методологии структурной группировки для задач анализа организационных структур и систем молекулярно-генетического управления. В частности, найдена интерпретация модели структурной

- Б-

группировки в терминах организационного проектирования;

• 9. Разработаны методические вопросы использования методологии относительной группировки для автоматизации анализа данных комплексных соцнологаческих исследований (с учетом наличия "крупных блоков" вопросов, их качественного характера, слабой связи, необходимости табличного представления результатов), а также разнотипных данных матричной формы (на примере задачи формирования агрегарсванных потребностей в измерениях в сельскохозяйственном производстве).

С использованием разработок пл. 7-9 с помощью матрично-аппроксимационной группировки получен ряд результатов, представляющих самостоятельный интерес в соответствующих прикладных областях: экспериментальная методика сценки знаний учащихся через понятийный контроль (МПМ), методика анализа и совершенствования организационной структуры крупных предприятий и объединений промышленности (ИЭиОПП СО АН СССР), выявление механизмов синтаксического и семантического уровня для конкретных молекулярно-генетических систем управления (локус "сшот", оперон гистидана у кишечной палочки и т.п.) (ИЦиГ СО АН СССР}", агрегированный ряд потребностей в измерениях для создания унифицированной системы приборов (НПО "Агроприбор") и т.д.

Совокупность полученных результатов может рассматриваться как новое перспективное научное направление - матрично-аппрокситционный подход, позволяющий с единых позиций анализировать разнотипные данные с целю построения исследовательских группировок. Практическая ценность работы

Разработан комплекс моделей и методов для анализа многомерных разнотипных анкетных, статистических и экспериментальных данных, отличающийся от других разработок в данной области не только ориентацией на задачи исследовательской группировки, но и существенно меньшими требованиями к априорной ин-ч формированности ЛПР (исследователя, эксперта или управляюце-9 го). Это связано, прежде всего, со следующими особенностями:

- возможностью одновременной обработки количественной и качественной информации,

- возможностью автоматизации выбора основных параметров алгоритмов,

- наличием "шлейфа" интерпретирующих характеристик,

- описанием основных методических схем проведения исследовательской группировки.

Основные области приложения указанного комплекса:

1) автоматизация обработки статистической или экспериментальной информации для формирования комплексных типологий;

2) обработка больших массивов данных крупномасштабных анкетных исследований образа жизни населения, трудовой мобильности, социальной лишены и профилактики на основе анкетных обследований;

3) исследование и контроль знаний;

4) анализ и совершенствование структуры организационных и иных сложных систем.

Реализация результатов работы

Методы реализованы в программных комплексах обработки многомерных данных, разработанных под руководством автора:

- больших массивов анкетной информации сложной структуры (Ростовцев П.С., Суховский М.1., ИЭ и ОПП СО АН СССР),

- анализа структуры матриц связей в организационных системах (Куперштох В.Л., Трофимов В.А., ИЭ и ОШ СО АН СССР),

- комплексного типологического анализа региональных данных (Высоцкая Н.В., ИНХ, г .Новосибирск),

- обработки данных зоологического мониторинга (Трофимов В.А., Шадрина В.И., Ш СО АН СССР),

- ойцесоюзной библиотеки прикладных програм* ЕИМ-М, предназначенной для использования на ЭВМ ЕС, СМ и БЭСМ (Абрамович Н.С., ИМ АН БССР).

Указанные комплексы используются для автоматизации принятия исследовательских решений при анализе многомерных данных в указанных и других организациях.

Перечислим некоторые основные направления реализации: * а) обработка данных комплексных социально-экономических анкетных исследований (ИЭ и ОШ СО АН СССР, ИСИ АН СССР, ЦЭЫИ АН СССР, И СУ при ЦК ЕШ);

б) автоматизированная система проведения и обработки результатов государственных экспертиз в НРБ (ИСУ при Ш ЕШ);

в). совершенствование организационных структур крупных предприятий и объединений промышленности с помощью анализа структуры технологических и управленческих связей (ИЭ и ОШ СО АН СССР);

г) типологазация городских поселений Западной Сибири для целей социального управления (ИСКТ, г.Новосибирск),

д) обработка психолингвистических данных для анализа и контроля знаний (ИЯ АН СССР, МГПИ);

е) анализ синтаксиса, семантики или эволюции конкретных молекулярно-генетических систем управления по данным генетических экспериментов (ИЦиГ СО АН СССР);

ж) формирование стандартизированного ряда агрегированных потребностей в измерении технологических процессов в сельском хозяйстве^'НПО. "Агроприбор"),

Отдельные полученные результаты включены в некоторые курсы вузовского и послевузовского обучения (ВШГЩ, МИСиС, ЛФЭЙ, ЕГУ, ИСУ при ЦК ШП и др.); материал монографии /I/ в 1977-1982 гг. использовался в программе кандидатского экзамена по системному анализу (специальность 05.13.02).

Апробация работы

Результаты диссертационной работы докладывались на 1-Ш Всесоюзных конференциях по проблемам и методам принятия решений в организационных системах управления (Звенигород, 1980, 1984, 1988 гг.), 1-Ш Всесоюзных школах-семинарах по программно-алгоритмическому обеспечению прикладного многомерного статистического анализа (Цахкадзор, 1979, 1983, 196Г7 г.), _ 1-Ш Всесоюзных конференциях по применению многомерного статистического анализа в экономике и сценке качества продукция

(Тарту, 1977, 1981, 1985 гг.), Всесоюзной конференции по математическим методам в решении задач классификации (Пущи-но, 1986 г.), 1-П Всесоюзных совещаниях по статистическому и дискретаему анализу нечисловой информации, экспертным оценкам г дискретной •оптимизации (Алма-Ата, 1981 г., Таллинн, 1984 г.), советско-французских семинарах по информатике и прикладной статистике (Сочи, 1981 г., Москва, 1984 г., Суздаль, 1987 г.) и ряде других конференций и семинаров. Публикации .

По материалам диссертации опубликовано 37 научных трудов, в тем числе 5 монографий, из которых две переведены на английский язык и изданы за рубежом. Структура и объем работ

Диссертация состоит из введения, пяти разделов (содержащих четырнадцать глав), заключения, приложения и списка литературы в 182 наименования. Работа содержит сораниц основного текста, 12. страниц приложений, 10 рисунков и 17 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Работа состоит из пяти основных разделов.

В разделе I рассматриваются некоторые задачи анализа и управления в сложных системах: анализ и совершенствование организационных структур, выявление дифференциации в сложных социально-экономических системах, анализ и контроль знаний и др., в решении которых существенную роль играют многомерные исследовательские группировки; выделяются основные типы исследовательских группировок, фиксируются требования к'мате-матическому и алгоритмическому обеспечению, определяются основные направления и подходы к его разработке.

Раздел П посвящен разработке штештического аппарата матрично-аппроксимацисвных группировок для разнотипных многомерных данных ç учетом выдвинутых требований.

В разделах Ш-У рассмотрены возможности и методика использования разработанного аппарата в конкретных задачах представляющей, относительной, и структурной группировок на

примере актуальных прикладных проблем анализа конкретных сложных систем. -

Рассмотрим теперь содержание указанных разделов более подробно.

Раздел_1^ Классификация, т.е. расчленение совокупности на отдельные классы (группы) принадлежит к основным операциям принятия решений. До недавнего времени операция выполнялась человеком чисто логически на основе имеющихся представлений о рассматриваемой системе и целях классификации. Однако задачи группировки взаимодействующих элементов организационных систем в целях совершенствования организационной структуры, типологазации населения по данным анкетного обследования образа жизни или городских поселений по комплексу социально-экономических условий в целях повышения эффективности управления, анализа структуры знаний в целях их оценки и контроля и др. не могут быть решены подобным образом, ни даже ранее разработанными методами автоматической классификации. Они относятся к задачам исследовательской группировки, поскольку они основаны на выявлении и исследовании закономерностей в массиве данных, в той или иной (подчас весьма косвенной) мере отражающих рассматриваемые стороны функционирования сложной системы. На основе изучения конкретных работ, выполненных в данной области советскими и зарубежными исследователями (С.А.Айвазян, А.Н.Бугаец, Ю.А.Воронин, Н.Г. Загоруйяо, Т.Н.Заславская, Ю.П.Дробышев, АД.Дорофеюк, В.И. Журавлев, А.Е.Лейбкивд, Г.С.Лбов, А.Г.Ивахненко, И.Б.Мучник, Б.Л.Овсиевич, В.Т.Перекрест, Б.Б.Розйн, Э.А.Тийт, Ф.Арайа, Э.Дидэ, М.2амбт, Д.Теки, Д.Хартигэн и др.), мы выделяем следующие три типовых задачи исследовательской группировки:

I. Представляющая группировка - шкала "внутренней" качественной переменной (типы образа жизни, элементарные семантические составляющие), представляющей измеряемые "внешние" проявления (характеристики трудовой, досуговой и др. деятель; ности, сходство между отдельными понятиями); £ 2. Структурная группировка - способ представления струк-^ туры сложной системы (группы соответствуют отдельным подсис-

-ТО-

темам) ;

3. Относительная группировка - способ установления связи между множеством переменных X, которые лежат в основании классификации ("входные" характеристики, скажем, показатели социально-демографической структуры населения) и совокупностью переменных У, относительно которых группы должны быть однородными ("результирующие" характеристики, скажем, потребления или времяпрепровождения индивидов).

Традиционно задачи многомерной группировки относят к многомерной математической или прикладной статистике, однако они не менее тесно связаны с проблематикой принятия решений, как она описана С.В.Емельяновым и О .И. Ларичевым (от- ' сутствие непосредственного объективного критерия, уверенности в адекватности.модели и, напротив, применимость всех признаков проблем принятия решений). Вместе с тем критерии оценки получаемого результата (степень соответствия данным, интерпретируемость, возможность описания в различных системах категорий) выделяют класс иоследовательвях решений из традиционных задач теории принятия решений.

Аппарат исследовательской группировки1 должен удовлетворять следующим основным требованиям:

I) универсальность относительно типовых задач и видов информации ;

. 2) соответствие основным способам логической классификации (разделение по существенным признакам, типологизация, систематизация);

3) наличие средств сценки соответствия данным и.интерпретации решений.

В специальной главе I.2 рассматриваются возможности использования существующих разработок системного анализа и прикладной статистики, прежде всего геометрического (кластер-анализ) ж статистического подходов к автоматической классификации. Отмечается соответствие некоторых из них логике классификационных построений и, шесте с тем, необходимость решения проблем, указанных на стр. 2»

Для решения этих проблем предлагается использовать матрично-аппроксимационный подход, включающий:

а) разработку единых матричных моделей для представления разных видов информации (количественные и качественные признаки, распределения, матрицы связи, группировки, разбиения, подмножества, бинарные отношения);

б) формализацию и исследование задач группировки как задач аппроксимации имеющихся данных с помощью матриц, отвечающих искомым группировкам. Аппроксимационный подход хорошо разработан для задач количественного анализа данных (факторный, регрессионный, дисперсионный анализы). Для задач неколичественного анализа, таких как задачи исследовательских группировок, аппроксимационный подход практически не исследовался, по-видимому из-за отсутствия единообразных моделей представления различных форм данных.

Раздел_1Ь Этот раздал посвящен разработке математического аппарата многомерной исследовательской группировки.

Сначала рассматриваются модели представляющей группировки для разных типов данных: распределений, ьитриц связи объект-объект и матриц объект-признак, характеризуемых соответствующими линейными подпространствами.

Задача построения представляющей группировки /? по отношению к имеющимся "косвенным" признакам 9 ... , зг^, формулируется как задача максимизации суммарного критерия связи $>(/?) = ЩГ<Р(Я, где :к) - мера связи

группировки Я с признаком ЭСК , имеющая различную форму в зависимости от способа представления признаков и группировок.

В терминах распределений связь между Я и качественными и количественными признаками можно оценивать исходя из следующих соображений.

Связь между Я и качественным признаком ОС вырака-ется таблицей сопряженности ( р^ ) , где - доля объек-

тов, попавших в 3 -3 класс /? и имеющих ¿-в градацию X • Коэффициент связи должен оценивать возможность описания гра-

с\г

1-4

Р

- о -

даций Ь классами Я^ по этой таблице. Естественные характеристики соответствия и £ имеют вид

Д «р^/р*.

(при больших ^ ) и

фс4,Л) = дс-ь/^/р.^ср^. ъ)

при малых . Усредняя эти значения в соответствии с распределением р , получим в качестве мер связи

Ux.fR) % I рД /р4. - I />Д (2.8)

/Р^.РчГ 77 > (2.9) характеризующие среднее приращение абсолютной и относительной доли правильных прогнозов Ь при получении информации (•РаЬ^' коэффициент широко известен как коэффициент

Пирсона; до сих пор не было известно его интерпретации как меры описания, он трактовался как мера отклонения распределения (р^) от статистической независимости.

Нетрадиционная мера соответствия и ~Ь , равная рр ^ — рлс , дает в качестве усредненной характеристики связи сс и Я расстояние между соответствующими отношениями эквивалентности (предложенное нами в 1969 г. Д2/; его дополнение до I получило известность как коэффициент Ранда по имени американского исследователя, предложившего его в 1971 г.).

При количественном ¿С в качестве меры связи между Я и ж . принято использовать относительное уменьшение разброса х в классах ¡Ъ . 2. __

=1<г2сх) -Г (2>17)

где - дисперсия ОС на объектах класса .

В терминах таблиц объект-признак данные можно охарактеризовать соответствующими линейгами пространствами , состоящими из всевозможных векторов вида СС. » Ха. (о—

произвольный вектор), где X _ /V*m. матрица признака 33 . Для количественного sc. матрица X - это просто соответствующий вектор-столбец таблицы данных [кп =1), для качественного же признака гЯ >-i и (i^-tj-fl элемент матрицы X равен i или 0 в зависимости от того, принимает ли признак сс. на ¿-и объекте "fc-e значение. Шжко показать, что пространство L.QX) характеризует множество допустимых преобразований соответствующего номинального или количественного признака. При этом пространство UCX) номинального признака вынужденно содержит "прямую", состоящую из векторов с одинаковыми компонентами, что определяется не существом дела, а лишь способом задания ОС матрицей X • поэтому в качестве L(X) далее рассматривается лишь ортогональное дополнение LOO до этой прямой.

В этих терминах близость признака 32 и группировки R , представленных на данных N объектах матрицами X и Z соответственно, оценивается величиной среднеквадратичного отклонения однсй из этих матриц до ее проекции на подпространство, порожденное другой матрицей:

PCx/z) =UX-"pzX\\z^ PCZ/X)=EZ-%ZU (2>20)

где Pz - операторы ортогонального проектирования.

Оказывается, эти меры близости в терминах матриц объект-признак могут йнть выражены через меры связи в терминах распределения, например при качественном сс

PCx/Z-^MJ-^-^/R»,

а при количественном сс

р(Х/21) = t=c) CI - •

Таблицы объект-объект использовалась для сценки связи количественных и качественных признаков Г.Дэниэлсом и М.Г. Нендаллом, показавшими, что коэффициенты корреляции матриц с элементами а.. -Сс.-Х- для количественного т. z et,..—

CNJ vi <) V

S -¿^гъОс,- X ^для рангового сс равны обычным коэффициен-

та

там корреляции и ранговой корреляции Кендаюш соответственно.

Для целей одновременного анализа количественных и номинальных признаков наш предлагается рассматривать матрицы связей Р = Сру) вида р,-• = с для количественного, предварительно нормированного признака ос ) и

/>.. = < "А. ' * '

с/ V-//// ,

для ношнального признака 5С- , где А/ - число объектов. Мерой связи признаков служат коэффициенты ковариации или корреляции соответствующих матриц, которые, как доказано, равны коэффициентам Пирсона и Чупрова Т г/Жт*Г-0(~\£1)

(в случав качественных признаков), коэффициенту детерминации (>"*- (в случае количественных признаков) и корреляционному отношению (в смешанном случае).

Удается установить также соответствие задач представляющей группировки с известными критериями кластер-анализа. Наиболее характерным является следующее утверждение.

Разбиение й данного множества объектов по количественным признакам минимизирует один из наиболее широко используемых критериев кластер-анализа (средневзвешенную внутриклассовую дисперсию признаков) тогда и только тогда, когда оно максимизирует сушу корреляционных отношений Г?г(хк/Я) или сушу матричных коэффициентов ковариации, или минимизирует сушу коэффициентов близости подпространств РСХ* /2), или максимизирует сушарную внутреннюю связь

3е*) =1- ~ТГ ^ (2-34)

где гп. - число классов разбиения И , - чис-

ло объектов в # , величина . связи объектов х : рав-

на суше вышеопределенных величин р.. для качественных и

Г-м

количественных признаков СС^. °

Концепция представляющей группировки получает дальнейшее развитие в терминах модели агрегирования данных, аналогичной модели факторного (точнее, компонентного) анализа и названной моделью главных кластеров /35/:

-¿к -«.-6

О XV-

где и. - элемент исходной или преобразованной матрицы объект-признак, -(А-зк.") ? С^Ч-^ ) - характеристики -го кластера (со^- вектор-эталон, ^ равно 0 или -I в зависимости от того, принадлежит ли объект, г. кластеру ■5 )» £--.. - невязка модели.

1.К г

Задача состоит в том, чтобы найти допустимые Т^

так, чтобы минимизировать сумму квадратов невязок.

Оказывается, данная модель, как правило, не дает сколько-нибудь однозначного решения. В количественном факторном анализе ее дополняют так называемыми "принципам простой структуры". Мы предлагаем использовать новый принцип - последовательного исчерпания, моделирующий пошаговый характер исследовательских решений. Согласно этому принципу, формирование кластеров производится последовательно, так, чтобы наидучшим образом аппроксимировать необьясненную на данном этапе информацию.

Математическое исследование данного принципа, проведенное в Приложении I, доказывает его'корректность применительно к широкому классу моделей агрегирования, а также связанную с ним декомпозицию квадратичного разброса данных

Е*? £ +£ (2.41)

2> и 1С Ь«-

когорая позволяет оценить вклад (значимость) любого элемента решения: отдельного кластера 4 , отдельного признака в дан-^ ном клсатере и т.д.,.что дает инструмент сценки степени сода ответствия решения и данных, а также интерпретации решения.

В случав априорного требования непересекаемости кластеров данная модель эквивалентна моделям представляющей группировки (в зависимости от способа стандартизации исходных данных).

Аналогичный принцип исчерпания используется применительно к моделям аппроксимации матриц связи В = ( ) между объектами с помощью матриц структурных признаков. Структурный признак - это пара (Я,ае), где - разбиение множества объектов, а ее. - граф существенных связей между его классами - значениями этого признака. Структурный признак ( К,32) может быть представлен булевой матрицей

.) , где П • =1 тогда и только тогда, когда ¿еК^ при • Независимо это понятие, назван-

ное блок-моделью, рассматривалось в США Ф.Араби, Дж.Бурмэ-ном и др. Частные случаи структурного признака - номинальный (9Е= ), атрибутивный (ее «=(4,6)), ранговый («£ «^(.-»^М ). порядковый (<ге = \С4/Ь)11-4-11 интервальный и др. Модель качественного факторного анализа матрицы В» ( £••) имеет вид:

где - вещественное число (вес "фактора" 6 ), а Г^ = С ) - булевская матрица из заданного исследователем класса допустима структурных признаков, которые отыскиваются из условия минимизации суммы квадратов невязок £ — .

Применение принципа рсчерпания к данной модели приводит к критериям, методам и декомпозициям, аналогичным тем, которые рассмотрены намг выше. Эти критерии подытоживаются в таблице 2.1, причем оказывается, что они совмещают в себе также другие критерии, развитые ранее в литературе применительно к различным стратегиям группировки.

Алгоритмизация построения оптимальных классификаций (с учетом принципа последовательного исчерпания) производится на основе требования соответствия методов исследовательской группировки принципиально локальным методам логического клас-

сифицирования. Это требование моделируется понятием локального алгоритма группировки, задаваемого системой окрестностей, определяемой логикой классифицирования. Таким способом мы приходим к алгомеративному алгоритму (разработай совместно с В.Л.Куперштохом и В.А.Трофимовым), алгоритмам присоединения и методу иерархической группировки (приводится версия, разработанная П.С.Ростовце-

вым) .

Критерий агломеративной группировки в терминах кластер-анализа состоит в том, чтобы найти разбиение К на множества объектов, максимизирующее критерий вида

Р(«,Х) =1 I (= - хи ,

4-4 ¿¿ев, * * С

где X - "мягкий" порог существенности связей , выбираемый из экспертных или модельных соображений. Необходимое ' условие локальной оптимальности критерия Р в агломеративной системе окрестностей выражает тот факт, что сумма величин (в^ -X) внутри каждого-класса положительна, а между люСыми двумя классами - нет. Агломеративный метод по критерию (2.60) дает именно такое разбиение (число классов заранее не задается, откуда вытекает его компактность в том смысле, что средние внутренние связи в классах выше . средних связей между ниш. 5

Рассматриваемый алгоритм близок традиционным агломера-тивным алгоритмам, но использование здесь аппроксимационного критерия влечет необходимость прекращения процесса объединений до того, как все объекты объединятся в один класс. Изменение величины ТС влечет изменение числа классов и их наполненности. Этот факт может быть использован, как показано на конкретней примере, для сопоставления результатов применения различных алгоритмов группировки в терминах порога ^с, имеющего согласно (2.60) смысл коэффициента компромисса между требованиями "компактности" и "равномерности" классифнка-ции.

Применение метода главных кластеров как модели тцаоло-гизации предполагает использование алгоритмов последовательного присоединения объектов как лекальных алгоритмов оптимизации алпроксимационного критерия в модели (2.36). Оказывается, эти алгоритмы шгут быть сформулированы как £ терминах связей, так и в более традиционных терминах "центров-эталонов" и расстояний до них, т.е. в стандартных терминах Ърямых" построений кластер-анализа, основанных на эвристических, а не модельных соображениях. Но аппроксимационный критерий, как и в предыдущем случае, дает здесь четкий критерий остановки процесса "наполнения" кластера как только средняя внутренняя связь станет вдвое, выше средней связи с любым внешним объектом ("сильный кластер"). При этом метод применим не только при априорном требовании пересекающихся кластеров, но и в условиях, когда кластеры могут пересекаться (в этом случае критерий остановки процесса вытекает из декомпозиции (2.41)).

Подобные алгоритмы разработаны и для модели вида (2.53), когда матрицы ( ) соответствуют отдельным кластерам. Эти алгоритмы могут рассматриваться как методы идентификации модели аддитивных кластеров, предложенной американскими исследователями Шепардом и Ара Си (1979 г.). Эффективность предложенных автором алгоритмов по сравнению с методами Шепарда, АраСи в др., обеспечивается не только с вычислительной сто-, раны (простота и наглядность расчета, управление знаком , но и чисто теоретически. Вес кластера 6 в модели (2.53) определяется не величиной ^^ (как считали американские исследователи) , а величиной ^ вклада кластера 2 в суммарный разброс связей, согласно принципу исчерпания.

Третий тип рассматриваемых алгоритмов - иерархические группировки - моделирует логику классифицирования с помощью разделения совокупности по существенным признакам. В терминах связей между признаками проблема может быть сформулирована следующим образом. Для двух совокупностей признаков X и У необходимо построить грушшревку й

в терминах X , максимизирующую суммарный критерий представляющей (при X =У ) или относительной (при Хт'У ) группировки. Идея метода состоит в том, чтобы последовательно разделять отдельные классы разбиения (вначале й состоит из одного класса, включающего все объекты) по признакам сс€ X так, чтобы на каждом шаге максимизировать рассматриваемый критерий. Эта идея реализована П.С.Ростовцевым под руководством автора в ряде алгоритмов последовательной группировки, использующих вышерассмотренные меры связи признаков. Типичный из этих алгоритмов включает три основные стадии (для простоты рассмотрим только случай качественных признаков): I) последовательное разделение множества объектов и отдельных классов по значениям признаков X по критерию ; 2) укрупнение тупиковых вершин

полученного древа; 3) описание классов R интерпретирующими их значениями признаков у. .

Эта форма алгоритма эффективна для больших массивов анкетной информации как с вычислительной, так и интерпретационной точек зрения.

Раздел_Ш_трактует вопросы использования теории представляющей группировки, которая, как показано в предыдущем разделе, может рассматриваться как теоретическое основание ряда важнейших методов кластер-анализа. Эффективность этого аппарата в теории и практике кластер-анализа демонстрируется на примере известного алгоритма "спектр", разработанного Э.М. Браверманом и А.А.Дорофеюком двадцать лет назад и доказавшего свою эффективность во многих конкретных технических и научных задачах. Этот алгоритм основан на последовательном упорядочении объектов по сходству с последующим "разрезанием" полученного упорядочения. Его практическое использование (как и других алгоритмов кластер-анализа) сталкивается с многочисленными проблемами: а) вычислительными (выбор меры связи, начального элемента, числа классов, критериев разрезания и др.), б) теоретическими (априорная гарантия "компактности"

получаемых кластеров, соответствия результатам использования других методов), в) интерпретации и принятия решений.

Методы главных и аддитивных кластеров являются непосредственными аналогами алгоритма "спектр" в теории представляющей группировки, которая дает конкретное реаение всех указанных проблем как вычислительного, так и теоретического плана.

Таким образом, с суда ой стороны, теория представляющей группировки приводит к известным многократно апробированным схемам кластер-анализа и, с другой стороны, дает более эффективные решения. Поэтому в описании конкретных приложений мы основное внимание сосредоточили на анализе нетрадиционных задач. В частности, при показе использования метода главных кластеров для тилологизации по данным статистических таблиц показаны возможности введения экспертных характеристик, отражающих управленческие цели типологии: а) сравнительная весомость признаков, б) нормативные значения признаков, в) уровень внутренних связей в кластерах.

Для возможности представления состояний изменяющейся системы по ее "статичной фотографии" (данным об элементах на какой-то момент времени) введено понятие порядковой классификации, где классы упорядочены, но не по доминированию, как обычно, а лишь по отношению соседства, отражающему возможности перехода из состояния в состояние. Эта концепция использована для анализа типов образа жизни населения, гипотетически связанных именно таким отношением. По критерию, вытекающему из теории представляющей группировки, под руководством автора был разработан специальный метод порядковой классификация, аналогичный известноцу методу к -средних; оба метода были применены к массиву данных о характеристиках жизнедеятельности и ее условий у работников сельского хозяйства Новосибирской области. На данном материале (с учетом обнаруженной слабой связи между признаками жизнедеятельности) с использованием соответствующих интерпретирующих характеристик была проинтерпретированы и сравнены раз-

биения, полученные указанными двумя методами, что привело к выводу о большей приемлемости порядковой классификации.

Другое нетрадиционное для кластер-анализа приложение методов представляющей группировки - анализ структуры знаний; Модель аддитивных кластеров (2.53) при - ^^ , где = " булевский вектор, характеризующий искомый

л-й кластер (возможно, сколь угодно сильно пересекающийся с другими кластерами), может рассматриваться как модель формирования наблюдаемых семантических связей между любыми двумя рассматриваемыми понятиями = N с помощью суммирования "весов значимости" тех кластеров Ь , которые содержат оба понятия . Кластер £ при этом задает элементарную смысловую составляющую данного семантического поля. Адекватность такой трактовки и предложенных методов подтверждена в двух типах экспериментов: а) психолингвистический классификационный эксперимент по анализу семантики так называемой "конкретной" лексики (ИЯ АН СССР), б) понятийный контроль знаний учащихся (МПШ).

Раздал_1У. Здесь рассмотрены приложения структурной группировки в анализе структуры сложных систем - организационно-хозяйственных и молекулярно-генетических.

Организационные системы состоят из элементарных единиц, объединяемых друг с другом в подсистемы на основе единства функций и связей в процессе функционирования. В зависимости от способа описания элементов - функциями или связями - могут использоваться методы в номинальной я структурной классификации. Подобные методы разрабатываются и используются в ИЛУ, ШИИСЯ, ИСЭП, ЦЭМИ, ИЭиОПП н др. организациях для анализа 2 совершенствования систем управления на разных уровнях народного хозяйства.

Мы сосредоточиваем основное внимание на задачах структурной группировки до информации о локальных взаимосвязях между отдельными элементами, где использованием матрично-аппроксимационного подхода позволило впервые сформулировать (в 1974 г.) модель, реализующую йв. традиционный принцип от-

носительной автономности подсистем, а структурный принцип, согласно которому элементы объединяются в подсистему по тому, насколько одинаково они взаимодействуют с элементами другая подсистем. АдпроксимационныЙ критерий формирования структурной группировки (Я,ае), где эе- граф связей между классами разбиения Я , здесь имеет вид

рск,эе,л.) И И -х) (4.1)

' Нетрудно видеть, этот критерий в качестве оптимального дает так называемый граф ¿с-сходства

Для получения более адекватного решения имеется два подхода;

а) ограничение множества допустимых структур более узким классом разбиений со структурой (/?}эе), например, когда к содержит не более заранее фиксированного числа классов т. ;

б) использование более сложной аппроксимационной модели.

Первое направление было исследовано *

В.Л.Куперштохом и В.А.Трофимовым, которые разработали соответствующую модификацию аглоперативного алгоритма, широко используемую в работах по анализу и совершенствованию организационных структур крупных.предприятий и объединений промышленности, проводимых в ИЭиОШ СО АН СССР под руководством Г.Б.Гренбэка. Основные проблемы в использовании критерия (4.1) связаны с отсутствием четких рекомендаций по выбору параметров т. и Л. , а также эмпирический характер результатов.

Второе направление проанализировано автором. Для более адекватного отображения структурной группировки ((? , ее.) мы представляем ее двумя матрицами - разбиения г*Сг^-) и структуры к где п^ =1, если содержатся в од-

нсы я том же классе К , а к.. »1, если , ¿¿^ъ

остадьных^сяучаях ГХ. = к\. =0). В

этих терминах модель структурной группировки

" ^ = (4'5)

требует минимизации средней квадратической погрешности

по искомым гг. , а также 7 До-

сказывается, модель (4.5) влечет критерий структурной группировки, являющийся комбинацией "номинального" критерия (2.60) и "структурного" критерия (4.1) (при разных порогах существенности связи X )• С одной стороны, это позволяет сформулировать "комбинированный" аглсыеративный алгоритм и автоматизировать выбор его параметров. С другой стороны, оказалось, что данный критерий может рассматриваться как критерий организационного проектирования, нацеленный на минимизацию напряженности управления. Указанная интерпретация позволяет более четко охарактеризовать условия применимости структурных группировок в анализе и синтезе организационных структур.

Эффективным оказалось использование методологии структурных группировок в анализе данных генетических экспериментов для восстановления структуры систем управления на молекулярном уровне (работа велась под руководством д.б.н. В.А. Ратнера совместно с группой сотрудников ИЦиГ СО АН СССР). В качестве исходных рассматриваются данные так называешго теста комплементарноети о парном взаимодействии разных мутаций одного и того же фрагмента генетического текста. В зависимости от того, к какому уровню текста относятся мутации - меж-цистрсяному или внутрицистронному (понятие цистропа - молекулярное уточнение классического термина "ген") - можно гово-. рить о разных носителях и механизмах мутирования. Межцистрон-ные мутации по данным теста должны допускать линейное картирование (специальная квазидиагональная структура матрицы комплементации), отражающее линейность генетического материала, тогда как внутрицистронные данные не имеют непротиворечивого представления (имевшиеся генетические шдели, включая модель Крика-Оргела, не соответствовали данным). Для данных межцис-тронной комплементации построены теория и методы линейного, а также частично нелинейного картирования на основе специально введенного понятия "комплот". Применение этих методов к 14 матрицам кемплементарования нутаций, вызванных у дрозофн-

лы чужеродными молекулами ДНК, обнаружило слэжную нелинейную картину, анализ которой привел к выводу о том, что мутации указанного класса не носят точечного или интервального характера, а поражают хромосому сразу в нескольких местах (позднее этот вывод был подтвержден с помощью непосредственных физико-химических наблюдений).

Структурная группировка внутрицистронных мутаций позволила, с одной стороны, подтвердить так называемый мозаичный механизм их комплементарности (предложенный £.А.Ратнером) и, с другой стороны, указать семантическую структуру рассматриваемых генетических систем (в частности, цистрсна гис-тидан-оперона кишечной палочки). Указав ряд других результатов, полученных с применением данного аппарата.

Раздел_У;_ В разделе рассматриваются два подхода к проведению относительной группировки: а) в терминах признаков и их связей, б) в терминах связей между объектами.

Первый подход реализуется на примере задач обработки социологической анкетной информации, специфика которой состоит в большом количестве наблюдений, наличии "крупных блочков" признаков, измеренных в шкалах разных типов, отражающих разные аспекты исследуемого явления и, как показывает опыт, относительно слабо связанны! друг с'другом. В этих условиях эффективно использование методов иерархической группировки на основе предварительного выделения детерминирующих прдсис-тем признаков ("окон" матрицы связей между признаками из указанных щ>упных блоков).

Метод выявления "окон" так же, как и методы аддититнт кластеров, основан на принципе исчерпания. С его помощью получаем совокупность тесно связанных пар подмножеств признаков и^ 9 , для ко-

торга и применяется метод иерархической группировки объектов (по признакам относительно признаков Уд ).

Дальнейший анализ проводится в разрезе выделенных "окон". Получаемые иерархические группировки удобны тем, что -логика группирования выражена в них легко интерпретируемыми комбинациями значений признаков, которые удобно ис-. пользовать для прогноза и принятия решений (как это показано в приводимых примерах).

Вместе с тем использование методов иерархической группировки ограничено ситуациями, когда число признаков относительно невелико, а связи между признаками невысоки. В других случаях удобно использовать метод относительной группировки непосредственно в терминах матриц связи между объектами. Согласно этому методу отыскиваются весовые коэффициенты входных показателей на основе аппроксимации матрицы связи между объектами (по выходным признакам) линейной комбинацией матриц связи по входным признакам. Оказывается, вычисление этих коэффициентов сводится к вычислению и преобразованию матричных коэффициентов корреляции. С учетом найденных коэффициентов формируется суммарная матрица связей между объектами по входным показателям, которая далее и используется для классификации по критерию вида (2.34) или (2.60).

Этот метод был применен в задаче формирования агрегированного ряда потребностей в измерениях, которая отличается наличием: а) признаков, измеренных в шкалах разных типов; б) выходного номинального показателя, характеризующего современную систему приборов, удовлетворяющих рассматриваемые потребности в измерении; в) характеристики массовости измерений. Разработанная применительно к этим особенностям методика бита применена к данным о потребностях в измерении ряда физических характеристик сельскохозяйственных технологических процессов (влажность, скорость вращения и пр.).

ЗАКЛЮЧЕНИЕ

Таким образом, в данной работе выделены и систематизированы задачи исследовательской группировки, возникающие при анализе и управлении в сложных системах на основе многомерной разнотипной информации. Предложен и обоснован матри-чно-аппроксимационный подход к их решению, который, с одной стороны, в основном удовлетворяет сформулированным требованиям к аппарату исследовательской группировки в, с другой стороны» позволяет объединить и унифицировать ряд казавшихся ранее разнородными построений прикладной статистики (прежде всего в кластер-анализе в исследовании связей между разнотипными данными). Перечислим некоторые основные полученные на этом пути результаты.

1. Выделены три типа задач исследовательской группировки и выявлены их особенности как задач принятия решений.

2. Предложены аппроксимационные модели представляющей группировки в терминах распределений, таблиц объект-признак и таблиц объект-объект, для которых математически установлены правила соответствия как друг с другом, так и некоторыми известными'моделями кластер-анализа н статистического подхода к формированию группировок.

3. Предложены принцип в метод последовательного исчерпывания данных, распространяющие на задачи исследовательской группировка традиционные методы количественного факторного анализа многомерной статистики и приводящие в данном случае к декомпозиции квадратичного разброса данных по элементам решения, что впервые позволило оценить вкладн отдельных (количественных в качественных) признаков в полученные классы, а также вкладн самих классов в "дисперсию" данных как по отдельности, так и в целом, что существенно облегчает интерпретацию.

■ '4. Исходя вз разработанных моделей в методов с помощью моделирования основных приемов логического группирования (типологизация, разделение по существенным признакам, и ер ар-

хическая систематизация) в терминах локально-оптимальных алгоритмов разработаны алгоритмы матрично-аппроксимацион-ной группировки, следующие основным схемам кластер-анализа, но более эффективные в теоретическом, прикладном и вычислительном отношениях.

5. В целом указанные в пл. 2-4 результаты привели к существенному системообразующему и унифицирующему эффекту: многие подходы, критерии и алгоритмы кластер-анализа, рассматривавшиеся ранее как независимые, оказались реализациями матрично-аппроксимационных моделей, при определенных условиях. эквивалентными друг другу.

Это не только дало отмеченные преимущества, но и позволило предложить решения некоторых впервые сформулированных задач исследовательской группировки:

- для целей представляющей группировки - методы качественного факторного анализа для разнотипных данных (включая метода построения аддитивных кластеров) и порядковой классификации ,

- для целей структурной группировки - метода выявления структуры основных связей,

- для целей относительной группировки - метода сценки связей в системе разнотипных признаков, выявления "окон" в матрицах связей и формирования иерархических группировок.

6. Разработаны методические вопросы использования предложенных методов представляющей группировки в типологическом анализе статистических таблиц (метод главных кластеров), исследовании образа жизни населения (порядковая классификация), анализе структуры знаний (аддитивные кластеры).

7. Разработаны методические вопросы использования структурных группировок для задач анализа организационных структур и молекулярно-генетических систем управления. В частности, найдена интерпретация модели структурной группировки в терминах организационного проектирования.

8. Разработаны методические вопросы использования отно-

си тельных группировок для автоматизации анализа данных комплексных социально-экономических исследований (с учетом наличия "крупных блоков" слабо связанных между собой качественных признаков, необходимости представления результатов в табличном виде), а также разнотипных дяииит матричной формы (на примере задачи формирования агрегированных потребностей в технологических измерениях).

Основные результаты диссертационной работы изложены в следующих публикациях:

Монографии

1. Миркин Б.Г. Проблема группового выбора. - М.: Наука, 1374.

Имеется английский перевод: ¿aya

M;.rk;.n ftÄ. Ärou.p Oho¿ce .-Л/.У. : Wüttj ,/,Э7Э-

2. Миркин Б.Г. Анализ качественных признаков. - М.: Наука, 1976.

3. Миркин Б.Г., Родин С.Н. 1£афн и гены. - М.: Наука, 1977.

4. Миркин Б.Г. Анализ качественных признаков г структур. -М.: Статистика, 1980.

5. MirWün Rodin S.A/. era.phi cend Genes,-HeUeP&er CPRQ)íSf>rC.nae.p Ver-ÍGL^, 4Э84. *

6. Миркин Б.Г. Группировки в С сциальн 6-экономических исследованиях. - М.: Финансы к статистика,-1985.

Обзоры

7. Миркин Б.Г. Дискретные задача классификации взаимосвязанных объектов / Вопросы анализа сложных систем. - Новосибирск: Наука, 1974, с. 66-77.

8. Ыиркин Б.Г. Модели- классификации и упорядочения в анализе дискретных данных / Проблемы анализа дискретной информации. - Новосибирск! Наука, 1975, с. 3-9. .

9. Шркин Б.Г. Модели эмпирического агрегирования социально-экономической информации / Модели агрегирования социально-экономической информации. - Новосибирск: ИЭиОПП СО АН СССР, IST78, с. 3-16.

- я*-

10. Мандель И.Д., Маркин Б.Г. Кластер-анализ и смежные вопросы (краткий обзор основных направлений) / Автоматика. 1987, » 2, с. 72-82.

11. Миркин Б.Г. Иерархический кластер-анализ: основные дополнительные результаты / Жамбю М. Иерархический кластер-анализ з соответствия. - М.: финансы и статистика, 1988, с. 318-340.

Статьи

12. Миркин Б.Г. Об одном подходе к обработке нечисловых данных / Математические методы моделирования и решения экономических задач. - Новосибирск: ИЭиОПП СО АН СССР, 1969, с. I4I-I50.

13. Миркин Б.Г., Черный Л.Б. Об измерении близости между различными разбиениями конечного множества объектов / Автоматика и телемеханика, 19 , Л 5, с. 120-127.

14. Миркин Б.Г. Задачи аппроксимации в пространстве отношений и анализ нечисловых признаков / Автоматика в телемеханика, 1974, й 9, с. 53-61.

15. MirlCn B.Q. On tUe. pre>£tem R«conci.6c»iq. FUrtckon*/

tortile. Soc.i*eo32MX : Ас<Ы**пСс fi£as/f3?5", 44-t-Wo,

IS. MCrWCjiBÄ. Сж>пы.(Л1опь Crt'tbe of

CU^UiCM «brW Qu.aMtLbg , 317-32.2.

Г7. Куперштох В.Л., Миркин Б.Г., Трофимов В.А. Сумма внутренних связей как критерий качества классификации / Автоматика п телемеханика, 1976, ïi 3, с. 91-100.

18. B.Ç, О* а. Criterion of Cta*Si$UxäiO* oj-S-bt-i-tciux~a /of FormaQz^tcbùси^ ¿у, St>c*a€ Sc^z*tcej ,—

19. Миркин Б.Г. Моделирование многомерной социально-экономической информации / Математическое моделирование в социологии. - Новосибирск: Наука, 1977, с. 210-224.

20. Миркин Б.Г., Высоцкая H .В. и др. Шкалы упорядочения / Моделирование в экономических исследованиях. - Новоси-бзрск: Наука, 1977, с. II2-I30.

21. Миркин Б.Г. Аксиоматическая характеристика расстояния в совокупном пространстве номинальных и ранговых признаков / Моделирование в экономических исследованиях. -Новоси&фск: Наука, 1978, с. 95-Ш.

22. Миркин Б.Г., Ростовцев П.С. Ыетод выделения связанных групп признаков / Модели агрегирования социально-эконо мическай информации. - Новосибирск: ИЭиОПП СО АН СССР, 1978, с. 107-112.

23. Миркив Б.Г., Куперштох В.Л., Трофимов В.А. 0 моделях агрегирования дискретной информации / Математические модели и методы в экономических исследованиях. - Новосибирск: Наука, 1979, с. 158-214..

24. Миркин Б.Г. Мерките на врьзката между номиналните признали като мерки за.качеството на прогнозата / Социално управление. - София, 1980, Л 2, с. 69-77.

25. Миркин Б. Аппроксимационен подход към разкриването на структурата на основните врьзки / Социално управление.-София, 1980, Л 3, с. 49-59.

26. Миркин Б.Г. Об учете признаков разных типов шкал в линейных моделях анализа данных / Математические вопросы анализа данных. - Новосибирск: ВЦ СО АН СССР, 1980, с. 20-31. . . .

27. Миркин Б.Г. Меры связи номинальных признаков как меры качества прогноза / Меи еды анализа многомерной экономической информации. - Новосибирск: Наука, 1981, с. 84-97.

28. Миркин Б.Г., Мучник И.Б. Геометрическая интерпретация показателей качества классификации / Методы анализа многомерной экономической информации. - Новосибирск: Наука, 1981, с. 3-12. "

29. Миркин Б.Г., Валь тух К .К., Павлов В Л., Трофимов В .А.

О применении методов качественного даализа данных к исследованию динамики народного хозяйства / Укрупненные 'и упрощенные модели народного хозяйства. - Новосибирск: Наука, 1981, с. 5-Г7.

30. Маркин Б.Г. 0 математических методах группировки в современных социально-экономических исследованиях / Анализ нечисловой информации в социологаческих исследованиях. - М.: Наука, 1985, с. I6I-I79.

31.Фрумкина P.M., Миркин Б.Г. Семантика "конкретной" лексики: психолингвистический подход / Изв. АН СССР. Серия литературы и языка, 1986, * I, с. 12-22.

32. Абрамович Н.С., Миркин Б.Г. Алгоритмическое обеспечение многомерной классификации / Программное обеспечение ЭШ: Ийблиотека прикладных программ ШМ-М. Вып. 2. - Шнек: ИМ АН БССР, 1986, с. 7-24. "

33. Mlrlec« в .G». AcUcbcve. СЧи^Ьегхм^. and Qu^cboLbCviz. &к.Ьог Analyse* Methods for Mccbtctes/ 4o«.rrvj.e «+ CCcmi-iLcafeC-o^ , 49*? > 7-31.

34. Миркин Б.Г. Линейные ¡.юдоли агрегирования данных и метод последовательного исчерпание / Ш Всесоюз. школа-семинар "Програшно-алгоритмическое обеспечение прикладного многомерного статистического анализа. Ч. I. - U.: ЦЭДО АН СССР, 1987, с. 143-150.

35. Миркин Б.Г. Метод главннт кластеров / Автоматика п телемеханика, 1987, » 10, с. I3IrI43.