Алгебраические методы исследования задач информационного поиска тема автореферата и диссертации по математике, 01.01.10 ВАК РФ

Решетников, Валерий Николаевич АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1983 ГОД ЗАЩИТЫ
   
01.01.10 КОД ВАК РФ
Диссертация по математике на тему «Алгебраические методы исследования задач информационного поиска»
 
 
Содержание диссертации автор исследовательской работы: доктора физико-математических наук, Решетников, Валерий Николаевич

ВВЕДЕНИЕ.

ГЛАВА I

§ I. Основные определения.

§ 2. Алгебраическая модель информационной системы

ГЛАВА П

§ I. Алгебраические свойства релевантных векторов

§ 2. Алгебраическая Ж - структура.

§ 3. Свойства структуры.

§ 4. Продолжение Ж. - структуры.

§ 5. Переход к новому дескрипторному словарю.

§ 6. Метод Кодца сокращения размерности при решении поисковых уравнений (Модели поиска в библиотеке проблемно ~ ориентированных архивов)

§ 7. Преобразования архива и линейные операторы

§ 8. Псевдорелевантные векторы.

ГЛАВА Ш

§ I. Алгебраические модели поиска в системах с нетривиальными коэффициентами.

§ 2. Построение псевдорелевантных подмножеств

§ 8. Расширение множества запросов для систем с нетривиальными коэффициентами. . •

§ 4. Геометрическое описание поисковых функций в системах с непрерывными коэффициентами.

§ 5. Информационный поиск на многопроцессорных вычислительных средах

ЗАКЛШЕНИЕ.

 
Введение диссертация по математике, на тему "Алгебраические методы исследования задач информационного поиска"

Информация является важным фактором, необходимым для деятельности любой системы - научной, технической, экономической, социальной и т.д. Совокупность информационных потоков, средств сбора, обработки и управления данными составляет информационную систему. Если эта система базируется на электронной технике, то мы получим автоматизированную информационно-поисковую систему (АИПС). Так как темпы роста объема информации во всех областях человеческой деятельности значительно' опережают темпы повышения производительности труда персонала, занятого обработкой данных, то решение информационных проблем может осуществляться за счет использования мощной высокопроизводительной вычислительной техники, в том числе и многопроцессорных ЭВМ, новых средств и систем сбора, передачи и обработки информации. При разработке больших МПС на одно из первых мест выдвигается задача минимизации времени реакции системы на запрос пользователя. Так поиск в архиве, содержащем 1(Р документов, со скоростью 1,8-10 сек. на просмотр одного документа методом последовательного просмотра всех записей массива продолжается 5 часов. Увеличение скорости поиска невозможно только за счет увеличения быстродействия ЭВМ, необходимо искать новые методы обработки информации, ее поиска и хранения. С другой стороны, учитывая высокую стоимость труда создателей математического обеспечения и т.необходимо научиться разрабатывать достаточно простые по структуре методы обработки, уметь сравнивать между собой различные методы поиска, на основе которых можно было бы принимать обоснованные решения о выборе архитектуры вычислительной среды и методов обработки информации при проектировании конкретных АИПС.

Информационный поиск по запросу пользователя есть задача определения релевантного запросу подмножества документов в архиве АИПС. Каждое сравнение признаков, заданных в запросе, с признаками в описании документов, требует доступа к массиву, скорость обмена с массивом больших систем мала по сравнению со скоростью обработки. Таким образом при оценке эффективности поиска необходимо учитывать и время обмена данными между внешними запоминающими устройствами и центральным процессором.

Для общения пользователя с АИПС необходим язык максимально полно описывающий данные архива, достаточно простой для пользователя и воспринимаемый ЭВМ, такой язык называется информационно-поисковым языком (ИПЯ). Каздому элементу словаря информационной системы естественно поставить в соответствие некоторый шифр, который назовем поисковым образом данного элемента словаря. Процесс сопоставления элементов словаря соответствующему шифру называется индексацией. Используя процесс индексации можно построить индексный язык - поисковый образ ИПЯ, индекс документа - поисковый образ документа (ПОД). Принято отождествлять понятия "индекс" и "поисковый образ".

Мы сознательно сузили понятие поискового образа только на числовые множества. Исторически термин "поисковый образ ИПЯ" возник в библиотечных ИПС и означал утвержденный словарь с малым количеством слов - дескрипторов для описания краткого содержания документов архива. С появлением ИПС на базе ЭВМ и записью документов на магнитные носители естественно перенесли понятие "поисковый образ" на числовые множества. Таким образом элементом информации, хранящейся в архиве АИПС, является код (шифр) дескриптора. Элементы ИПЯ называются дескрипторами, множество дескрипторов с соответствующим синтаксисом называется дескрипторным словарем; индекс дескриптора будем называть значением дескриптора.

Далее будем предполагать, что запрос формулируется на языке описания документов - ИПЯ. Это условие можно ослабить, допустив существование взаимнооднозначного транслятора с языка запросов на язык описания документов.

Существующие АИПС имеют, как правило, два массива информации: массив данных - архив системы, назовем его поисковый образ архива (ПОА), где проводится поиск релевантного подмножества, и массив дескрипторного словаря, с помощью которого ведется дешифровка и анализ информации. Большинство современных больших АИПС имеют массив данных, состоящий из двух подмножеств, размещенных в ЗУ:

1) Поисковый образ архива (ПОА) - записи на ИПЯ самих документов.

2) Поисковый образ записей архива (ПОЗА).

Суть такого двойного архива заключается в следующем: если в архиве запись некоторого документа представляет набор шифров дескрипторов и их связей, то в ПОЗА запись, соответствующая этому документу, представляет собой вектор из нулей и единиц, построенный по следующему правилу. Упорядочим элементы дескрипторного словаря и отождествим номер дескриптора с номером координаты вектора - поискового образа записи документа (ПОЗД). Соответствующая координата вектора равна нулю, если данный дескриптор отсутствует в описании документа, и единице, если он присутствует. ПОЗА обладает рядом преимуществ:

1) для его хранения в ЗУ требуется память меньшего объема, т.к., например, векторы можно хранить в упакованном виде;

2) алгоритмы поиска в П0ВА более просты и работают с большей скоростью. Информационный поиск сначала ведется в ПОЗА, где отбираются ПОЗД, содержащие дескрипторы, указанные в запросе, далее на множестве отобранных записей, происходит сравнение критериев запроса с ПОД, т.е. построение релевантного множества. Построение ПОЗА увеличивает общий объем занимаемой памяти» но, как правило, дает возможность сократить время поиска релевантных документов.

Исследования задач и методов информационного поиска привели к построению различных моделей ИПС ([б] , [б}, [4б] , [54] , [55}). Необходимо отметить теоретико-множественную модель Сэлтона ([45] ), теоретико-множественную основу имеют многие последующие модели, так Сибли Э. и Хардгрейв Т. ([43], [571) считают, что "теория множеств оказывается наиболее верным кандидатом в качестве технологии выражений моделей данных". Основным недостатком теоретико-множественных моделей является либо их абстрактность, либо их громоздкость.

Наибольшее распространение получила реляционная модель Кодда ([541» [55]). В этой модели между отдельными элементами информации, как элементами множества различных данных в архиве, строится алгебра отношений. Знание образующих и операций в этой алгебре позволяет получать релевантные документы или интересующие части этих документов ([7] - [Ю], [l3], [47], [5б] ). Показано, что всякий запрос в терминах реляционной модели полиномиально вычислим ([23| ). Концепция реляционной модели Кодда предполагает существование однозначных отношений между отдельными частями ПОД и возможность при помощи этих отношений получить искомую информацию. Громоздкость программного обеспечения является одним из недостатков реляционной модели. Последнее время для совершенстваования моделей АИПС привлекают теорию нечетких множеств ([43], [бб]).

Построение математической модели, которая дает возможность сравнивать мезду собой различные архитектуры массива данных и связанных с ними стратегий поиска, строить новые методы поиска информации, является вахной задачей теории информационного поиска.

Решая задачу сокращения времени поиска, разработчики обратили внимание на изменение времени поиска одной и той хе информации при изменении структуры множества ПОЛ или ПОЗА. За образец была выбрана прямая структура архива и поиск последовательным перебором всех записей. Построение новых архитектур и методов поиска ставит задачу улучшить количественные характеристики, оптимизировать методы хранения и поиска информации для больших массивов. Так появились инвертированные массивы, многосписковые структуры, кластерные архитектуры и т.д. ([441). Наибольший интерес, с нашей точки зрения представляет кластерная архитектура ([44J , |4б|, ), которая относится к классу многоуровневых архитектур. Основная идея заключается в следующем: множество Т - поисковый образ архива или ПОЗА разбивается на несколько подмножеств, векторы каждого из подмножеств рассматриваются как векторы одного вещественного линейного пространства и строятся множества Т-, , нормированных векторов (переход от вектора t к вектору )• Каждому подмножеству Т*„ ставится в соответствие вектор c-v- C^tfcui» где С'ь является центром тяжести множества Tv (если-.,"t^ ^ , л I 1, то С-- х х; )• По запросу строится вектор запроса <\ и среди * J'4- о векторов (-1 ищутся те, которые наименее отклоняются от с^ , т.е.

С с \ решается задача минимизации аъссоьпо всем ^ = . Поиск релевантных векторов проводится только в тех подмножествах Tv , центроидальные векторы - которых являются решениями задачи минимизации. Поиск внутри отобранных множеств 'ТЧ , как правило, ведется прямым перебором. Недостатком кластерной организации массива данных являются потери релевантных векторов. Данные, полученные при эксплуатации АИПС SMART([4б\, [бЗ]), показывают, что потери релевантных документов достигают 5С$, что не может считаться удовлетворительным•

Эксплуатация АИПС, особенно библиотечных, показала, что оценка полноты множества веданных документов наталкивается на несоответствие потребностей пользователя сформулированному запросу. Это может происходить или из-за недостаточного опыта общения с АИПС, или нечетких собственных критериев (например, в библиотеке часто встречаются утверждения типа ". автор, кажется, Иванов"). Отсюда возникла задача: не меняя запроса пользователя расширить предлагаемое ему релевантное множество, т.е. найти не только документы, релевантные запросу, но и похожие на них. Одним из подходов к решению такой задачи является "поиск с обратной связью" ([44]). Пользователь, после просмотра предложенного ему релевантного запросу множества, отмечает документы, если они присутствуют, действительно, удовлетворяющие его информационным потребностям, и на основании анализа этих документов строится подправленный запрос, который вводится в систему и т.д. Другой подход заключается в том, что фиксируется некоторая мера подобия f и выбирают такие "t векторы ПОА, а чаще всего векторы ПОЗА, которые минимизируют 9 где с^ вектор зацроса. Для поиска бинарных векторов в П06А использовали меры, так нацример: Мера Танимото ([65] ) гл. л %

J , Q ,

Мера Евклвда - Сэлтона (1441, £бз1): V f vw ' i g: 7

Мера Мэрона рСЦ) = ™—^ t,M t-l l=.t Г где Д^-Д») у Л») бинарные векторы, причем • Однако использование этих мер не дало существенного расширения релевантного множества, а поиск с их применением происходит медленно, в основном методом перебора всего архива. Очевидно, что без построения соответствующей математической модели информационного поиска в широком смысле и привлечения современного математического аппарата невозможно найти решение задачи построения эффективных мер подобия и соответствующих алгоритмов поиска векторов, похожих на релевантные.

Выше были рассмотрены пути повышения эффективности информационного поиска за счет разработки новых методов хранения и обработки информации* Другой путь связан с созданием многопроцессорных ЭВМ. Многопроцессорные вычислительные среды позволяют сократить время поиска, обработки информации и снизить затраты на поиск. Для успешного применения такой электронной техники необходимо создать свои методы и алгоритмы, позволяющие полностью использовать преимущества параллельных вычислений. Формальное распараллеливание существующих алгоритмов, как правило, не дает линейного ускорения по числу процессоров среды и не обеспечивает полной загрузки процессоров при проведении информационного поиска. Разработка соответствующего математического обеспечения для АИПС на базе многопроцессорных ЭВМ является одной из важнейших проблем в настоящее время.

Таким образом решение задачи повышения эффективности информационного поиска базируется на сочетании двух подходов: I) разработке соответствующих математических моделей информационного поиска, привлечение к их анализу современного математического аппарата и на этой основе получении обоснованных рекомендаций по организации поиска, построении новых методов хранения и обработки информации, 2) использовании многопроцессорных ЭВМ для работы АИПС, создание методов организации и поиска, ориентированных на такую вычислительную среду.

В настоящей диссертации предлагается математическая модель информационного поиска, которая сводит задачу организации и поиска данных к поиску решений системы линейных алгебраических уравнений на конечном множестве конечномерного линейного пространства. Система линейных алгебраических уравнений строится по входному запросу, размерность линейного пространства совпадает с числом элементов дескрипторного словаря. Показано), что между известными архитектурами поискового образа архива и различными методами поиска, с одной стороны, и, с другой стороны, методами решения системы линейных алгебраических уравнений на конечном множестве существует взаимнооднозначное соответствие. Для решения поисковой системы линейных алгебраических уравнений на конечном множестве предлагается метод Ж - структуры» Для случая поиска в ПОЗА, когда поисковая задача решается в линейном пространстве над полем Ж & (далее мы его назовем - системы с тривиальными коэффициентами), подробно исследованы свойства 2 - структуры, условия её оптимальности, как по числу элементов разбиения, так и различных способов разбиения на фиксированное число подмножеств. Предложены модель и алгоритм сокращения размерности при проведении поиска, когда отдельные группы данных имеют собственную проблемную ориентацию и могут обрабатываться как в совокупности, так и раздельно. Использование алгебраических свойств векторов позволило определить псевдорелевантные векторы через псевдорешения поисковой системы, тем самым найти решение задачи поиска документов, "похожих" на релевантные, предложен алгоритм поиска псевдорелевантных векторов. При моделировании поиска в ПОА векторы - поисковые образы документов принадлежат линейному пространству либо над конечным полем t либо с вещественными коэффициентами, этот случай мы далее будем называть "системы с нетривиальными коэффициентами" • На системы с нетривиальными коэффициентами перенесен метод Z -структуры, а для вещественного случая построена геометрическая интерпретация информационного поиска, в которой задача поиска релевантных векторов сводится к проверке на совместность поисковой системы линейных алгебраических уравнений и неравенств. Для АИПС на базе многопроцессорных ЭШ предложены: метод физической организации - структуры в памяти ЭВМ и стратегия поиска, позволяющие при обработке любого запроса добиться полной загруженности всех процессоров системы и линейного, по числу процессоров, ускорения информационного поиска.

Основные положения диссертации

В работе построена алгебраическая модель информационного поиска, которая сводит задачу организации и поиска к задаче решения поисковой системы линейных алгебраических уравнений на конечном множестве; предложен метод решения таких систем - метод Ж -структуры, который позволяет строить релевантные и псевдорелевантные множества и который эффективен при организации информационного поиска на многопроцес -сорных ЭВМ.

Методы, предложенные в диссертации, были использованы:

1. При разработке автоматизированной информационной системы "Подготовительное отделение", которая работает в МГУ с 1975 г. ;

2. При разработке автоматизированной системы регистрации землетрясений, внедренной на геологическом факультете МГУ в 1979 г. ;

3. При создании автоматизированной системы "Олимпийский арбитр-80", разработанной по заказу Оргкомитета "Олим-пиада-80" ;

4. При создании информационного обеспечения для автоматизации планирования производства и раскроя трикотажного полотна на МПТО "Красная заря".

Результаты, изложенные в диссертации, являются основой курса лекций "Алгебраические модели информационного поиска", читаемого на факультете вычислительной математики и кибер -нетики МГУ с 1978 г.

По теме диссертации опубликовано 17 работ.

 
Заключение диссертации по теме "Математическое обеспечение вычислительных машин и систем"

ЗАКЛЮЧЕНИЕ

Предложенная в диссертации модель сводит задачу информационного поиска к поиску решений системы линейных алгебраических уравнений на конечном множестве конечномерного линейного пространства. Матрица левой части и вектор правой части поисковой системы строятся по запросу и полностью им определяются. Каждый способ решения поисковой системы линейных уравнений на конечном множестве определяет соответствующий метод хранения и стратегию поиска релевантных векторов. Для решения поисковых систем предложен метод Ж -структуры. Для случая линейного пространства над полем 2 (что соответствует поиску во множестве поисковых образов записей архива) проведено исследование свойств Ж -структуры и условий ее оптимальности. Метод - структуры относится к классу методов, позволяющих бороться с мощностью поискового множества.

Показано, что реляционный метод Кодда есть такой метод решения поискового уравнения, который на каждом отдельном этапе поиска дает возможность решать уравнения с меньшим числом переменных. Дана геометрическая интерпретация операций реляционной алгебры. Построены алгоритмы поиска релевантных векторов на множестве поисковых образов записей библиотеки проблемно-ориентированных архивов.

Таким образом методы решения поисковых уравнений естественным образом распадаются на три класса:

1) простые переборные методы (им соответствуют прямой и инверсный поиск);

2) методы борьбы с размерностью (реляционный, сетевой поиск и т.д.);

3) методы борьбы с мощностью поискового множества (представителем этого класса является метод Ж -структуры)• Существуют методы решения поисковых уравнений, которые являются комбинациями методов разных классов, например, в методе Ж - структуры в каздой зоне можно использовать инверсный поиск.

Псевдорелевантные векторы, определенные через псевдорешения поисковой системы линейных уравнений, являются векторами близкими к релевантным, и могут быть использованы для расширения релевантного множества при неточно сформулированном запросе. Построен алгоритм поиска псевдорелевантных векторов с использованием 2, «структуры, Метод J/L - структуры может быть применен при поиске решений поисковой системы линейных уравнений на множестве в линейном пространстве над конечным полем 2 р , 2 .

Показано), что метод Z - структуры может эффективно использоваться для организации поиска в АИПС на базе параллельных многопроцессорных ЭВМ.

Для АИПС, где поисковые образы документов являются векторами вещественного линейного пространства, построена модель, в которой задача поиска сводится к проверке на совместность в единичном кубе специальной системы линейных уравнений и неравенств.

 
Список источников диссертации и автореферата по математике, доктора физико-математических наук, Решетников, Валерий Николаевич, Москва

1. Арнаудов Д.Д. Вопросы теории и программной реализации ИПС ОИЯИ. Автореферат диссертации на соискание ученой степени доктора технических наук, ОИЯИ, Дубна, 1976.

2. Арнаудов Д.Д., Янев Н.И. Алгоритмы формирования основных массивов ИПС ОИЯИ. Сообщение ОИЯИ, Р 10-8901, Дубна, 1975.

3. Белобродский А.В. Информационно-поисковая система широкого применения. Управляющие системы и машины, 1978, № 5, с. 3539.

4. Белобродский А.В., Решетников В.Н. Об одном способе поиска релевантных векторов. Вопросы оптимизации и управления, М., Изд.МГУ, 1979, с.59-63.

5. Белоногов Г.Г., Богатырев В.И. Автоматизированные информационные системы. М., Сов.радио, 1973, с.328.

6. Белоногов Г.Г., Новоселов А.П. Автоматизация процессов накопления, поиска и обобщения информации. М., Наука, 1979,с.256.

7. Вениаминов Е.М. Алгебраическая структура реляционных моделей баз данных. Науч.техн.информ. Сб.ВИНИТИ, 1980, сер.2, № 9, с.23-25.

8. Виноградов М.М., Когаловский М.Р. Реляционный процессор с входным языком Системы управления базами данных с многоуровневой архитектурой, М., 1980, с.36-53.

9. Глушков В.М., Бакаев А.А., Крамаренко Р.П., Коструба Т.В. Многоуровневая реляционная модель данных в СУБД "ПАЛЬМА". -Кибернетика, 1980, № 6, с.32-36.

10. Дейт К. Введение в системы баз данных. М., Наука, 1980, с.464.

11. Джадц Д.Р. Работа с файлами.- М*', Мир, 1975, с.144.

12. Дриянский В.М. Модели поиска в интерактивных документаль -ных информационных системах. Аналитический обзор. Кибернетика, 1981, $2, с.102-118.

13. Задыхайло И.Б., Соловьев В.В. Вопросы создания специализированного процессора для реляционных баз данных. Препринт ИПМ АН СССР,Н87, М.,1979.

14. Информационные системы общего назначения. М., Статистика, 1975, с.471.

15. Кнут Д. Искусство программирования. Сортировка и поиск . -М., Мир, 1978, с.846.

16. Китов А.И. Программирование информационно-логических задач. -М., Сов. радио, 1967, с.327.

17. Криницкий Н.А., Миронов Г.А., Фролов Г.Д. Автоматизирован -ные информационные системы. М., Наука, 1982, с.384.

18. Королев JE.H. Структуры ЭВМ и их математическое обеспечение.-М., Наука, 1978, с.352.

19. Копейкин М.В., Осмоловский Л.Г., Петухов О.А. Обобщенная модель базы данных. Пробл. системотехн. и АСУ, Л.,1980 ,с. 38-56.

20. Коконен Т. Ассоциативная память. -М., МирД980, с.239.

21. Лавров С.С., Гончарова Л.И. Автоматическая обработка данных. Хранение информации в памяти ЭВМ.- М., Наука, 1971, с. 160.

22. Ланкастер Ф. Информационно-поисковые системы. М., Мир , 1968, с.308.

23. Ливчак А.Б. Реляционные модели баз данных и полиномиальная вычислимость.- Научно-техн.информ. Сб. ВИНИТИ, 1981,сер. 2, №6, с.28-29.- по

24. Ложе И. Информационные системы. Методы и средства.- М., Мир, 1979, с.632.

25. Мамиконов А.Г., Пискунов А.Н., Цвиркун А.Д. Модели и методы проектирования информационного обеспечения АСУ. М., Статистика, 1978, с.221.

26. МидоуЧ. Анализ информационных систем.- М., Прогресс, 1977, с.400.

27. Модели данных и системы баз данных.- М., Наука, 1979,с.222.

28. Пальмова И.Е., Решетников Б.Н. Об одном способе решения систем линейных неравенств, моделирующих поиск в АИПС.• Воцросы оптимизации и управления. М., изд.МГУ, 1979, с.72-77.

29. Петрова М.Л., Решетников В.Н. Моделирование и организация поиска в библиотеке архивов.-Воцросы оптимизации и управления. М., изд.МГУ, 1980, с.55-61.

30. Решетников В.Н. Алгебраическая теория информационного поиска.- Программирование, 1979, ЖЗ, с.68-73.

31. Решетников В.Н. Моделирование информационного поиска в информационно-поисковых системах. Кибернетика, 1979, № 5 , с.129-132.

32. Решетников В.Н. Геометрическая теория поисковых функций в ИПС.- Тезисы докладов 3 Всесоюзной конференции по исследованию операций и теории игр. Горький, 1978, с.322-324.

33. Решетников В.Н. Методы линейной алгебры в ИПС.- Труды XII Всесоюзной школы по автоматизации научных исследований . Тбилиси, 1978, с.19-20.

34. Решетников В.Н. Информационный поиск и линейная алгебра над конечными полями . Воцросы оптимизации и управления. М., изд.МГУ, 1979, с.52-58.

35. Решетников B.H. Моделирование поиска в АИПС с нетривиальными коэффициентами. Вопросы оптимизации и управления . М., изд.МГУ, 1980, с.45-54.

36. Решетников В.Н. Алгебраические модели информационного поиска. Математические методы в исследовании операций . М., изд.МГУ, 1981, с.186-192.

37. Решетников В.Н. Информационный поиск и 2 -структура.- Математические вопросы задач оптимизации и управления. М., изд.МГУ, 1981, с.90-94.

38. Решетников В.Н., Соколихин В.Н. Подсистема "Подготовительное отделение". Вестник высшей школы, 1978, №1, с.28-30.

39. Решетников В.Н., Сотников А.Н., Карманов В.Г. Построение поисковой функции в ЙПС. Вопросы оптимизации и управле -нин. м., изд.МГУ, 1978, с.18-22.

40. Решетников В.Н., Сотников А.Н. Алгебраические свойства- структуры и псевдорелевантные векторы.-Вестник МГУ, сер.Вычислительная математика и кибернетика, 1982, № I , с.72-76. •

41. Решетников В.Н., Шемякина Т.Н. Алгебраическая модель пе -рехода к новому дескрипторному словарю. Вопросы оптимизации и управления. М., изд.МГУ, 1980, с.62-66.

42. Сибли Э.Дардгрейв Т. Теория моделей данных и цроцессиро -вание позиционных множеств. Модели данных и системы баз данных. М., Наука, 1979, с.31-90.

43. Солтон Дд. Динамические библиотечно-информационные системы.-М., Мир, 1979, с.557.

44. Сцепинский Ю.Е. Программные средства и организация данных в информационных системах. М., Наука, 1977, с.231.

45. Сэлтон Г. Автоматическая обработка,хранение и поиск информации.- М.,Сов.радио, 1973, с.560.

46. Фостер Да. Обработка списков. М., Мир, 1974, с.72.

47. Хенли Дж. Автоматизированные библиотеки и информационные системы.- М.,Мир, 1974, с.119.

48. Хисамутдинов В.Р., Авраменко B.C., Легоныеов В.И. Автома -авизированная система информационного обеспечения разрабо -ток. М., Наука, 1980, с.208.

49. Цаленко М.Ш. Реляционные модели баз данных.- Алгоритмы и организация решения экономических задач. М., Статистика , 1977, вып.9, с.18-36.

50. Черный А.Н. Интегральные информационные системы. М., ВИНИТИ, 1971.

51. Bookstein A. Fuzzy requests : an approach to weighted boolean searches. J.Amer.Soc.Inform.Sci., 1980, 31, 4, p. 240-274.

52. Buell D., Kraft D. A model for a weighted retrieval sistera.- J.Amer.Soc.Inform.Sci., 1980, 32, 3, p. 2II-2I6.

53. Codd E. A relation model of data for large shared data hanks.

54. CACM, 1970, 13, p. 377-387.

55. Codd E. Relational completeness of data base sublanguages.- Data base sistem, Courant Computer Scince Sumposia series. Englewood Cliffs, Prentice-Hall, 1972, 6.

56. Grawford R. The relational model in information retrieval.-J.Amer.Soc.Jnform.Sci.,1991, 32, I, p.51-64.

57. Hardgrave W., Sibley E. Data base research, some comments on future directions,- SlGTtoD FDT, 1975, 7, p.3-4.

58. Le Charlier В., Hainaut J. Modeles, langages et systeme pour la conception et 1' exploitation des bases de donnes.

59. Teor. et teelm.inform. Act.congr. AFCET, Gif-sur-Yvette, p. 179-189.

60. Maron M., Kuhns J. On relevance, probabilistic indexing and information retrieval. J.ACM, I960, 7, 3, p.216-244.

61. Badecki T. Metodology for determining the similarity of boolean search patterns of queries. New Trends Dok. and Int.Proc. 39 FH> Congr., Edinbourgh, 1978, London, 1980, p. 92 102.

62. Salton G. Search strategy and the optimization of retrieval effectiveness. FID/lFIP Congress on mechanized documentation, Rome, 1967.

63. Salton G. Associative document retrieval techniques using bibliographic information.J.ACM., 1963, 10, 4.

64. Salton G.'The SMART Sistem experiments in automatic document processing. Englewood Cliffs N.J., Prentice-Hall, 1971, ch. 10-13.

65. Sendowa E. On same classification properties of the sistems with incomplate information.Pr. IPI PAN, 1980, 401, p.l6-l8.

66. Tanimoto Т. An elementary mathematical theory of classification and prediction. IBMRept., november, 1958.

67. Willett P. Document* clustering using an iversted file approachJ.Inf.Sci., 1980, 2, 5, p.223-232.

68. Willians P. The use of microelectronics to assiste on line information retrieval.-Online Rev., 1980, 4, 4, p.393-399.