Представление знаний и семантическое программирование тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Малых, Антон Александрович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Иркутск МЕСТО ЗАЩИТЫ
2005 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Диссертация по математике на тему «Представление знаний и семантическое программирование»
 
Автореферат диссертации на тему "Представление знаний и семантическое программирование"

На правах рукописи

Малых Антон Александрович

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ И СЕМАНТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

01.01.09 - Дискретная математика и математическая кибернетика

Автореферат диссертации на соискание учёной степени кандидата физико-математических наук

Иркутск — 2005

Работа выполнена в Иркутском государственном университете

Научный руководитель доктор физико-математических наук,

профессор Манцивода Андрей Валерьевич

Официальные оппоненты доктор физико-математических наук,

Пальчунов Дмитрий Евгеньевич

кандидат технических наук, Черкашин Евгений Александрович

Ведущая организация Институт систем информатики

им. А П Ершова СО РАН

Защита состоится 16 декабря 2005 г. в 11 часов 30 минут на заседании диссертационного совета Д 212 074 01 при Иркутском государственном университете по адресу 664003, г Иркутск, ул. К Маркса, 1, Институт математики, экономики и информатики.

С диссертацией можно ознакомиться в библиотеке Иркутского государственного университета (г Иркутск, бульвар Гагарина, 24)

Автореферат разослан 4 4 ноября 2005

Учёный секретарь диссертационного совета канд физ-мат.наук Аргучинцева М А.

¿W 90235"

3

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. В настоящее время ведется большое количество разработок, связанных с представлением и манипулированием информацией в Интернете. Хотя чаще такие разработки имеют сугубо практический характер, разработчиками наиболее серьезных проектов была признана важность использования строгих логических средств для обработки web-информации. Наиболее ярким примером является группа, разрабатывающая концепцию Semantic Web, которая, начав с тяжелого (с логической точки зрения) языка RDF, за счет привлечения профессиональных логиков, разработала ряд корректных средств, в частности язык описания онтологий OWL. Версия DL этого языка базируется на разрешимой версии дескриптивной логики и позволяет делать с одной стороны весьма богатые, а с другой стороны, разрешимые логически описания предметных областей. Была построена строгая теоретико-модельная семантика языка. К сожалению, последние исследования по применению дескриптивных логик для решения задач практической сложности показывают, что дескриптивные логики в их нынешнем состоянии не могут эффективно работать в больших предметных областях, включающих миллионы соотношений между объектами (таких, как, например, большие онтологии в области медицины).

Следует также упомянуть классическое направление исследований — автоматическое доказательство теорем. В настоящее время существует ряд мощных систем, базирующихся на методе резолюций, которые способны решать сложные и объемные задачи. Однако, напрямую методы автоматического доказательства не приспособлены к специфике распределенных сред — необходима устойчивость к некорректной информации, работа с иерархическими данными и работа в распределенных средах. Кроме того, резолюционные методы излишне мощные, что приводит к проблемам неразрешимости.

Цели и задачи исследования. Диссертационная работа посвящена развитию автоматизированных методов работы со знаниями в глобальном информационном пространстве. Цель работы — создание на основе диалекта семантического программирования логической системы представления и обработки знаний, ориентированной на работу в распределенных информационных средах.

Для достижения этой цели решались задачи:

• разработка концептуальных основ системы обработки знаний в распределенных информационных средах на базе семантического программирования ;

• разработка логического формализма (теории информационных ресурсов), удовлетворяющего концептуальным положениям и условиям работы в глобальной информационной среде;

• исследование применимости теории к представлению и автоматизированной обработке иерархических систем данных и знаний;

• апробация в приложении к практическим задачам реальной сложности.

Методы исследования. Основные методы, на которые опирается данная работа, принадлежат теории доказательств, теории вычислимости и теории моделей. Как и в семантическом программировании, основной конструкцией в теории информационных ресурсов является надстройка над многосортной моделью. Особенность здесь заключается в том, что в качестве конструктора элементов надстройки используются не множества (как в теории допустимых множеств), не списки (как в базовом варианте семантического программирования), а термы специального вида. Для построения системы логического вывода как системы в ограничениях используется общий подход параллельного программирования в ограничениях (concurrent constraint programming), разработанный В.Сарасватом. Особенность предлагаемого подхода заключается в специфике ограничений (ограничений именования), на которых основана система.

Научная новизна. В работе впервые исследованы возможности применения концептуальных положений семантического программирования к обработке больших массивов знаний и данных в распределенных информационных системах и сети Интернет. Разработан логический формализм, реализующий данный подход. Построены логические модели базовых понятий, включая понятие информационного ресурса, имени информационного ресурса, онтологии как системы описания предметных областей, в терминологических рамках семантического программирования Исследованы возможности практического использования разработанной логической системы.

Основные результаты, выносимые на защиту:

1. Разработка концептуального подхода к представлению знаний в глобальной информационной среде на основе семантического программирования.

2. Логическая теория информационных ресурсов.

3. «Мета-2» — программная система, реализующая базовые механизмы представления знаний в формате онтологий в соответствии с теорией информационных ресурсов.

Научная и практическая значимость работы. Работа ориентирована на решение актуальных проблем, возникающих сегодня в Интернете. В связи с бурным и неконтролируемым развитием мировая информационная среда постепенно превращается в собрание разрозненной и неупорядоченной информации. Данная ситуация, которая только усугубляется, не позволяет эффективно использовать информационные богатства глобальной сети. Подход, на котором основана диссертация, состоит в том, чтобы интеллектуализировать работу компьютера в Интернете, передать ему ряд задач, которые сегодня приходится решать человеку, включая поиск информации, анализ найденной информации, выполнение ряда практических задач по взаимодействию с Интернет-сервисами и т.д. Существенную роль в этой работе играет использование гибкого и логически чистого подхода семантического программирования. На его основе построена теория информационных ресурсов, служащая базовым формализмом для разработки различных проектов, ориентированных на интеллектуализацию работы компьютеров в Интернете. С другой стороны, теория информационных ресурсов является определенным вкладом в развитие самого семантического программирования. Подходы, развиваемые в данной работе, апробировались на большом количестве практически значимых задач в области дистанционного образования, разработки электронных библиотек, систем управления кадрами, сложными задачами web-пpoгpaммиpoвaния.

Результаты диссертации являются составной частью исследований, выполняемых в Иркутском государственном университете в рамках:

• тематического плана НИР Рособразования «Изучение логических методов обработки текстовой информации» (2003-2007 гг. № ГР 01200307073);

• договора «Универсальный конвертор форматов учебных электронных изданий» с Российским государственным институтом открытого образования (Москва) в рамках ФЦП РЕОИС (2003 г.);

• договора «Разработка конвертора по переводу ресурсов из формата LaTeX в форматы, основанные на XML» с Всероссийским институтом научной и технической информации (2005 г.).

Личный вклад автора состоит: 1) в совместной с научным руководителем разработке концептуального подхода к представлению знаний на основе семантического программирования и создании логической теории информационных ресурсов; 2) в самостоятельной разработке системы «Мета-2». апробировании подхода с помощью системы «Мета-2» на ряде практических задач.

Апробация работы. Основные результаты работы представлялись на всероссийской научно-практической конференции «Телематика» (Санкт-Петербург, 2003, 2004, 2005): международном форуме «Новые ин-фокоммуникационные технологии: достижения, проблемы, перспективы» (Новосибирск. 2003); молодежной научно-методической конференции «Современные информационные технологии в науке и образовании» (Иркутск, 2004); всероссийской научной конференции «Научный сервис в сети Интернет» (Москва. 2004); школе-семинаре «Математическое моделирование и информационные технологии» (Иркутск, 2005).

Публикации. По теме диссертации опубликовано 9 работ [1]-[9]. Структура и объём работы. Диссертация состоит из введения, трех глав, заключения и списка использованной литературы Общий объем диссертации составляет 144 страницы. Список литературы содержит 78 наименований.

Основное содержание работы

Во введении диссертации дается краткий анализ работы, ее значимость и актуальность. Приводится обзор и описание структуры работы

В первой главе проводится анализ текущего состояния и векторов развития глобальной информационной среды, излагаются базовые принципы использования логических формализмов для построения моделей знаний в больших распределенных информационных системах.

В параграфе 1.1 рассматривается концепция семантического Интернета. предложенная Т. Бернерсом-Ли. Причиной появления понятия «<;е-

мантический Интернет» стали недостатки текущего состояния современных информационных систем, которые, в первую очередь, настроены на хранение и распространение информации, ориентированной на понимание человеком, но никак не самими компьютерами. Роль компьютеров в таких системах сводится, как правило, к функциями транспортировки данных и их визуализации. Семантический Интернет - это вйдение будущего мировой информационной среды, свободной от многих проблем сегодняшнего Интернета.

В параграфе 1.2 представлено понятие ресурса, проанализирована его ключевая роль в рамках сложных систем. На концептуальном уровне ресурс определяется как некоторая сущность, имеющая уникальное Шя. Благодаря уникальному имени, ресурс приобретает определенные качества. В рамках семантического Интернета уникальным именем ресурса может выступать так называемый идентификатор ресурса (resource identifier, UEI).

Параграф 1.3 посвящен понятию метаданных и той роли, которую метаданные могут сыграть в развитии Интернета. Как правило, метаданные ресурса представляют собой набор полей (атрибутов), в которых находится информация, специфицирующая свойства описываемого ресурса. Ключевую роль для эффективной работы с метаданными играет правильная организация областей значений, из которых берется информация для заполнения полей метаданных.

В параграфе 1.4 анализируются способы представления данных и знаний, и проблемы, которые в связи с этим возникают. За данными, которые присваиваются элементам метаописаний, всегда стоит некоторая предметная область. Для обработки данных при помощи информационных систем необходимо выполнение определенных условий, которые рассматриваются в данном параграфе.

В параграфе 1.5 анализируется роль систем логического вывода в работе с метаданными. Ключевым механизмом работы с метаданными должна стать система вывода нужной информации из имеющихся знаний. Именно на базе этой системы вывода может быть построен интеллектуальный поиск по информационной среде, сформированы продвинутые сервисы, манипулирующие Интернет-ресурсами.

Параграф 1.6 представляет механизмы описания предметных областей, особое внимание уделяется онтологиям. Идея состоит в формализации знаний о самых разнообразных предметных областях, причем в таком формате, чтобы этим могли воспользоваться автоматические сервисы-

агенты, работающие в Интернете по указке человека. Ключевым понятием здесь является понятие онтологии Другой важнейшей задачей при построении глобальной системы формализованных знаний является правильный выбор логической схемы, которая, с одной стороны, должна быть достаточно выразительной, а с другой — понятной людям.

Во второй главе рассматривается диалект семантического программирования - теория информационных ресурсов — ориентированный на обработку данных и знаний в распределенных информационных сетях.

В параграфе 2 1 задаются базовые конструкции предлагаемой теории, основанной на парадигме семантического программирования. Пусть D — некоторая предметная область. Построение начинается с введения базовой модели типов данных 3? = (М\____, М3; П). на основе которой строятся

остальные конструкции. Чтобы иметь возможность работать с типами данных базовой модели = (Mi,.... Мя; fl), для них заводятся специальные имена: DT = {dti,..., dt„}, символизирующие основные множества 3? , то есть /r>(dtt) = Мг, где /д — интерпретация.

Описание предметной области D начинается с построения иерархии классов. Классы определяются как подмножества предметной области и обозначаются константами сп,, т.е. Id(сп,) С D, где /д(сп,) - множество объектов класса с именем спг. Во всех практически значимых случаях достаточно иметь конечное множество классов, которое обозначается CN = {cni,... ,сПр}, р < и. На иерархии классов определяется бинарное отношение наследования, которое представляет собой частичный порядок, заданный на CN: то, что спг наследует класс сп; (является его подклассом) обозначается как сп, У о спг Если характеризовать классы с информационной точки зрения, то об элементах наследующего (под)класса есть больше (более строго: не меньше) информации, чем об элементах наследуемого (над)класса. Это означает, что спг уд сп, влечет 1р{спг) С /д(сп;), то есть, чем больше информации о классе, тем меньше сам класс. В дальнейшем считается, что CN содержит константу object, которая интерпретируется как класс всех объектов. Это означает, что для любой предметной области D любая корректная интерпретация констант из CN должна сохранять свойство сп >-£> object для любого сп / object.

Следущим шагом является введение атрибутов предметной области, которые ответственны за описание свойств объектов D. Атрибуты имеют привязку к классам с одной стороны, а с другой стороны — жестко типизированное значение. Выражениерг<£)(сп,т), гдесп € CN и m £ CNuDT,

означает, что в предметной области D атрибут с именем р, характеризует элементы класса сп. а значениями атрибута, в зависимости от ситуации, могут быть элементы класса или основного множества т. Множество всех атрибутов обозначается Attr = {р2,... ,pjt}.

Наконец, в соответствии с концепцией ресурсов, задается возможность именовать объекты предметной области. Множество имен, ориентированных на предметную область D, обозначается через ID = {idb...,idj.

Таким образом, общая понятийная структура предметной области D определяется набором (DT, CN, Attr. ID, >-d> <b)-

Определение 2.1.1 Пусть D — предметная область, a CN, ID и Attr

— конечные множества имен классов, объектов и атрибутов, определенных для описания предметной области D Пусть также Уа ~ частичный порядок, определенный на множестве СN, а отношение <d такое, что для каждого р € Attr оно выполняется ровно на одной парс Pi (en, m), где cn € CN и m E CN U DT. Тогда онтологической формой (онтоформой) предметной области D называется набор

К D = <DT,CN, Attr, ID, >-£,,<*>).

Далее дается строгое определение интерпретации которая отображает конструкции онтоформы К о на область D.

Определение 2.1.2 Пусть D - предметная область, вКр - онтофор-ма. Интерпретацией Id : Кр D называется отображение, определяемое следующим образом:

1. Для каждого'id е ID, /o(id) € D. Все /^(id,),г = 1 ...q, попарно различны.

2. Для каждого dtt е DT, 7u(dt,) = Мг.

3. Для каждого cn £ CN, /г>(сп) С D и если спг У-р сп; то /о(спг) С Ь{сП])- Id{object) = D.

4. Для каждого рг € Attr, если р, <и (сп, т), то рг) С /¿>(сп) х Id{т) и для каждого d £ D, множество {m\{d, т) е /о(р)} конечно (ограничение на конечность ранга).

В параграфе 2.2 определяется понятие термальной настройки над базовой моделью типов данных. Для начала определяется язык термов L,

включающий константы, одноместные и двуместные функциональные символы. Оговаривается, что все элементы модели Ï? = {М\,____Ms; П) являются выделенными. Множество всех констант, соответствующих элементам 3? , обозначается через M = М\ U ... U Ms Вводятся составляющие языка L:

1. Множество констант M.

2. Константа Т.

3. Счетное множество констант ID = {idi,id,2, ■..}, которые будут использоваться как имена объектов/ресурсов.

4. Счетное множество одноместных функциональных символов Attr — {р\,рг—}, которые называются атрибутами объектов.

5. Счетное множество двуместных функциональных символов CN — {сп\, спг,...}, которые ответственны за формирование описаний объектов как представителей соответствующих классов.

6. Конструктор конечных множеств {...}. Терм пустого множества обозначается константой 0 (с крышкой - чтобы не путать с самим пустым множеством 0). Чтобы подчеркнуть синтаксическую природу этих объектов, они называются термальными множествами.

Язык L бесконечен и может использоваться для описания предметных областей в соответствии с самыми разнообразными онтоформами, каждая из которых, по определению, обладает конечной структурой. В дальнейшем конечное подмножество L, соответствующее онтоформе Ко, обозначается через LD. Далее строится наследственно-конечная надстройка над моделью Ш с использованием атрибутов. Она названа термальной, поскольку элементами этой надстройки являются термы языка L — но не любые термы, а специальным образом сконструированные. Пусть Т некоторое множество термов языка L. Через Lin(T) обозначим совокупность всевозможных термальных множеств языка L вида {ij,..., i/J. i, g Т (то есть построенных на основании ri.6 определения L). Ьгпф) = {0}. Обозначим Attr(T) — {p(t) | р е Attr Л t £ Т}. CN1 обозначает множество функциональных символов en S CN, входящих в терм t. Термальная надстройка определяется как наименьшая неподвижная точка некоторого монотонного оператора на множествах термов языка L.

Определение 2.2.1 Термальная надстройка над dt относительно набора атрибутов Attr (обозначается

1- = 0

2. Пусть Setn = Lin(Attr(M U/DU T^J). Тогда

T£n+i = Tln U {cn(c. o)|cn € CN \ C№, с e Lin(T^n), а € Sei«}

тя = Un Ts,n u {T}

Таким образом, состоит из термов вида сп(с, а), где с = {¿1,..., tq), t, € а а - множество термов вида p(f), где либо t € Т^г, • либо t £ М. Условие сп € CN \ С№ во втором пункте определения озна-

чает, что каждый функциональный символ сп € CN может входить в терм не более одного раза. Кроме того, в отдельно входит константа Т.

Подтермы определяются стандартным образом. То, что f2 является подтермом t\, обозначается ii [¿2] - Как пример, описание двух объектов:

idnempoe ■'■ студентп({ человекф,

{фамилия("Петров"), cynpyr(zdnempoe(l)})}, _ {учится (университет^, 0))}) idnempoea человек({обпектф, 0)}, {фамилия("Петрова"), cynpyr(irfnempoe)})

содержит информацию о двух супругах один из которых учится в университете (неизвестно в каком). Через id :: t обозначено отношение «именования», которое присваивает объекту с описанием t имя id. Здесь функциональные символы

студент, человек, университет, объект € CN, фамилия, супруг, учится € Attr, idnemp0e, idnempoea € ID, "Петрова", ''Петров" € М.

Из примера видно, что подтермы элементов Тщ играют разную роль. Если подтерм является аргументом некоторого атрибута р, то он описывает не текущий объект, а другой объект, который относится к данному объекту через атрибут некоторой смысловой связью - как idnempoaa в атрибуте

супруг{Ыпетрова) и подтерм университет^, 0). Эти описания относятся не к самому объекту, а другим объектам, которые связываются с данным через атрибут. Таким образом, подтермы данного терма можно разбить на уровни в зависимости от того, какое количество атрибутов является их надтермами. Только непосредственные подтермы содержат информацию, напрямую относящуюся к данному объекту.

Определение 2.2.2 Подтерм ^ терма Ь называется непосредственным подтермом если не существует атрибута из £ вида такого что <1 является подтермом ¿2.

Таким образом, для непосредственных подтермов невозможна ситуация «!...)]•

В параграфе 2.3 рассматриваются механизмы наследования, термальная настройка (при соответствующей интерпретации) корректно реализует концептуальную схему, описанную в начале работы, это касается и механизма наследования Элементы надстройки Т^ над моделью 3? интерпретируются как описания объектов. Двуместные функциональные символы сп 6 СМ объединяют разрозненную информацию об объекте в рамках одного терма. В дальнейшем терм сп(с. а) € интерпретируется как описание некоторого объекта, принадлежащего классу с именем сп. При этом первый аргумент сп определяет данный элемент как наследника элементов более общих классов с соответствующими атрибутами. Второй аргумент содержит множество атрибутов объекта, присущих текущему классу сп. Описание может быть неполным (в терме присутствуют не все атрибуты, присущие классам), и, кроме того, некоторые элементы могут более полно описывать объекты, чем другие. Модель 5? определяет базовые типы данных, на основе которых строятся описания объектов.

Далее вводятся два бинарных отношения — отношение наследования ¿1 >- ¿2! определенное на элементах Т^, и отношение принадлежности атрибута элементу р{Ьг) <3 £г-

Определение 2.3.1 Пусть ^,¿2 6 Т^. Будем говорить, что элемент ¿1 = сп(с, а) является прямым наследником, элемента ¿2 (обозначается <гЛ если ¿2 £ с (то есть подтерм с имеет вид {... Л^-, ■ ■ ■})■ Элемент является наследником <2 (обозначается у если либо ¿х ¿2, либо имеется ¿з € с (т.е. У* такой, что ¿з >- ¿2-

Если ¿1 >- ¿2, то ¿2 является непосредственным подтермом первого аргумента

Определение 2.3.2 Пусть ^ = сп(с, а) Будем говорить, что атрибут р(£2) прямо принадлежит элементу (обозначается р(£2) <* Ь), если р(£2) € а- Будем говорить, что атрибут р(£2) принадлежит элементу £г = сп(с,а) (обозначается р(^) <1 если р(<г) <1* суще-

ствует £3 такой, что и р(£2) £з-

Предложение 2.3.1 Еслир{?)<1£, тор(?) является непосредственным подтермом £.

С экстенсиональной точки зрения атрибут принадлежит объекту не как представителю класса, а как отдельному индивидууму. Такое понимание служит основой для экстенсиональной интерпретации информации, заложенной в элементы множества термов которое реализуется через следующее определение.

Определение 2.3.3 Пусть £ 6 . Обозначим через е:г£(£) множество всех атрибутов рг(£г) <£, то есть ег£(£) = (рг^ЛрД^) <£}• Множество ех£(£) назовем экстенсионалом элемента t.

Существенной особенностью предложенной схемы (отличающей ее от аксиоматического подхода, реализованного, например, в языке пролог) является определение свойств объектов не с помощью одноместных предикатов, а с помощью термов. Описание объекта формируется в одном терме, а не распределяется по предикатам, что близко к объектно-ориентированной парадигме.

Далее вводится понятие эквивалентности термов. Определение 2.3.4

1. Элементы ЮиМи{Т} эквивалентны только самим себе, то есть £ = г тогда и только тогда, когда £ = г (графическое совпадение).

2. Термальные множества и вг эквивалентны тогда и только тогда, когда для каждого £1 € существует £2 € 82, что £1 = £2 .и для каждого £2 £ л2 существует £1 € что £1 = £2.

3. р\{Ь 1) = Рг{Ь) тогда и только тогда, когда р\ = Р2 и £1 = £2.

4. Термы сп\(с\,а\) и спг^.а-х) эквивалентны тогда и только тогда, когда сп\ ~ спг, с\ = иа\ = аг-

Предложение 2.3.2 Если £ = г, то ехШ) = ех£(г).

Обратное верно далеко не всегда.

В параграфе 2.4 определяются понятия аппроксимации и объединения информации.

Отношение аппроксимации на элементах термальной надстройки (обозначается £0 С позволяет сравнивать объем информации, хранящийся в термах. Отношение ¿о Е ¿1 истинно, если в элементе ¿о хранится меньше (точнее, не больше) информации, чем в

Определение 2.4.1

1. Для любых ¿(¿ь гдь'х £ Ю, ге^ Е тогда и только тогда, когда

= гд.^.

2. Для любых т.1, гпг £ М, т^ С гпг тогда и только тогда, когда ГП\ = тп2.

3. е С Т для любого е£Т£иМиЮ.

4- сп(с,а) С t тогда и только тогда, когда существует сп(с1,а,1) У Ь, такой что

(a) Для каждого Ь' £ с существует £" £ с\ такой, что € С Ь";

(b) Для каждого р{И) £ а существует р(£") £ а 1 такой, что I' С Г.

Элемент Т трактуется как наибольший (противоречивый, переопределенный) элемент.

Предложение 2.4.1 (I) Отношение аппроксимации рефлексивно и транзитивно на элементах (и) Пусть ^.¿г £ Тогда если ¿1 С ¿2

и ¿2 Е Ь, то Ь =

Таким образом, пара С) образует частичный порядок. Через £ С ¿о обозначается строгая аппроксимируемость: £ С ¿о тогда и только тогда, когда £ Е ¿о и I ф и .

Далее определяется операция взятия наименьшей верхней грани элементов ¿1 и ¿2-

Определение 2.4.2 Пусть £, <1, ¿2 6 . Элемент £ назовем наименьшей верхней гранью (объединением) элементов (обозначается £ = и если £1 С ¿2 Е ^ и для любого элемента Ц истинность ¿1 Е ¿о Л ¿2 Е ¿о влечет £ С ¿о-

Пусть О - некоторая предметная область, а Кд - ее онтоформа. Если р(У) < t, то говориться, что р входит в í на уровне спг Е СМ, если £ содержит непосредственный подтерм вида сп,(...,{.. -р(£').. •}). в котором р(Ь') входит в термальное множество из второго аргумента. Вхождение атрибута на уровне спг € СЫ является синтаксическим аналогом того, что описываемый объект принадлежит классу с именем сп^ а атрибут р является характеристикой объектов класса сп,.

Определение 2.4.3 Элемент £ назовем согласованным с онгпофор-мой К о если:

1. Для любых подтермов £ вида = спх(...) и £2 = спг(...) (включая сам терм £/ выполняется £] у £г тогда и только тогда, когда сп1 Ур сп2.

2. Все термальные множества вида {сп'(...),..., сп"(...)}, входящие в £, содержат только элементы с попарно различными функциональными символами сп',..., сп".

3. Если р{т) то € М, и р входит в £ на уровне сп, то р<о (сп, сИ;), где сп € С1Ч, Л £ БТ, и т € Ь(<И).

4■ Если р{гй) < 1,1(1 £ Ю, то р <1 о (сп,сп') для некоторого сп' е СК

5. Если р(сп'(...)) <1 то сп'(...) должен быть согласованным с Кд, и если р входит в £ на уровне сп, то должно выполняться р <р (сп,сп*), такое что сп* и сп' сравнимы относительно частичного порядка У о есть сп' У и сп* V сп* У в сп' V сп* = сп').

Первый пункт определения обеспечивает в согласованных термах корректность наследования классов относительно онтоформы Кд. Второй пункт запрещает случаи, когда с помощью двух различных подтермов описывается принадлежность одному и тому же классу. Третий пункт обеспечивает типизацию для значений атрибутов (когда эти значения являются элементами основной модели 3?). Четвертый пункт говорит о том, что идентификаторы из Ю именуют только объекты предметной области. Пятый пункт регулирует случай, когда значением атрибута является другой элемент термальной надстройки.

Определение 2.4.4 Подмножество с назовем согласованным с онтоформой Кд, если оно состоит из всех согласованных с Ко элементов и Т. и только них.

Понятие согласованности выделяет в термальной надстройке те элементы, формат которых корректно отражает иерархию классов предметной области, описанием которой мы занимаемся. Только элементы из пригодны для описания объектов £> с иерархией К д. Проверка согласованности элемента с порядком является разрешимой задачей, имеющей линейные алгоритмы относительно сложности терма.

Теорема 2.4.1 Пусть - согласованное множество онтоформы Кд. Тогда для любых £ Т^ существует единственный с точностью до эквивалентности элемент £ 6 такой, что С £2 Е Ь и для любого элемента £о> выполняется С Ц Л ¿2 Е £о Э £ С ¿0.

Таким образом, в рамках (то есть, как только фиксируется предметная область и иерархия классов в ней) любые два элемента ¿1 и ¿2 имеют наименьшую верхнюю грань и ¿2.

Предложение 2.4.2 Для любых ^,¿2 € если ехЩ\) — , то

= <2-

Таким образом, в рамках обеспечивается взаимосвязь между интенсиональным и экстенсиональным определением.

Затем определяется денотационная семантика элементов Т£ как описаний предметной области Б.

Определение 2.4.5 Терм £ является описанием элемента й предметной области О (обозначается £ = (I), если для любого непосредственного подтерма сп(с, а) терма £ выполняется д, € /ц(сп) и, кроме того, если р(е) <* сп(с, а), то

1. Если е £ Ю и р (сп, сп') для некоторого сп', то /д(е) £ 1р(сп') и (<1,1в(е)) £ 1В{р).

2. Если е £ /д(<И;),(к е БТ, то (й,е) £ /Р(р).

3. Если е £ и р <о (сп, сп'), то существует ё! £ /р(сп') такой что е = й' и {(1,д!) £ /о(р)-

Это определение интерпретирует терм сп(с,а) как описание элемента, принадлежащего классу 1и(сп) и фиксирует семантику атрибутов. В пункте 3 не любой элемент ё!. такой что е = в!, может, в общем случае, служить значением для атрибута р. Например, в терме

человек(0, {супруг(объект(ф,ф))}), который говорит о том, что кто-то женат, любой объект предметной области описывается с помощью терма объект(ф,Щ. Но супругом может быть только один из объектов.

Предложение 2.4.3 Если £ = <1 и £1 С £, то £х = й. В частности, для каждого <1 £ Б, объект(Ф, 0) = Л.

Предложение 2.4.4 Если ¿1 = в, и £г = то £х и ¿2 = <1.

На практике часто важно уметь определять, что терм t £ уникальным образом описывает один объект, т.е. существует единственный Л £ Б такой, что £ = й. Для этого вводится понятие множества ключей.

Определение 2.4.6 Множество ключей Т^ С есть множество таких элементов, что если £ £ Т^ , то существует единственный (1 £ Б такой, что £ = й.

Параграф 2.5 посвящен определению классов.

Определение 2.5.1 Элемент £ € назовем полным относительно предметной области Б, если существует объект <1 £ Б такой что Ь = <1 и для любого элемента £0 £ такого, что £ С £о, не существует (Но, что £о = <¿0-

Таким образом, полные элементы содержат всю возможную в рамках онтоформы Кд информацию и не могут быть расширены.

Следующее утверждение дает существенную характеристику множества

Предложение 2.5.1 Пусть — интерпретация. Тогда для любого £ £ такого что £ = й для некоторого й £ Б, существует полный терм £ £ Т§ такой, что £ С £, и любая строго возрастающая последовательность £ С 41 С ... С Ьк С I конечна.

Данное предложение не гарантирует £ = й. Язык Ь° и множество описывает предметную область с определенной точностью. Описание = предметной области Б различает объект й £ Б, если существует полный элемент £ £ такой, что £ = ¿, и не существует других д.' £ Б, для которых £ = в!. Описание может не различать объект по двум причинам. Во-первых, несколько объектов могут иметь одно и то же описание. Во-вторых. некоторые элементы предметной области могут не иметь полных

описаний вообще. Очевидно, что какое-то описание имеет любой объект (в худшем случае это может быть объектф, 0), описывающий любой объект, или, например, сп(0,0), выделяющий элементы класса сп)). Отсюда появляется понятие точного описания, когда любой объект предметной области различим.

Через обозначается множество всех полных элементов, входящих в Т^, а через Т£г множество всех термов t таких, что спг(0,0) С t.

Предложений 2.5.2 Пусть I - полный элемент и1 = й. Тогда для любого £ такого, что Ь = д, выполняется < С £.

Далее определяются основные понятия данного параграфа.

Определение 2.5.2 Аппроксимацией класса 1ц{сп) назовем множество ^ = I ^ ^ Зй е /г>(сп) : Ь = (!}. Описанием класса /п(сп) назовем множество Щ = Т$гП

Параграф 2.6 посвящен определению понятия ресурса. Механизм именования позволяет определять работу с ресурсами в соответствии с их концептуальным определением.

Определение 2.6.1 Именованием ресурса назовем формулу О,:: I, где :: - бинарный предикатный символ, - имя ресурса, а 4 € . Именование назовем корректным относительно интерпретации ¡о, если Ь = 1оШ).

Определение позволяет интерпретировать id как имена ресурсов, описываемых элементами иерархии а элементы I € (не обязательно полные) - как информацию, описывающую ресурс с именем id.

Для работы с анонимными объектами используется обозначение _1_:: Ь, что может интерпретироваться как «в предметной области существует некоторый объект, соответствующий описанию В случае именованных объектов одновременное наличие двух описаний гd :: ц id :: t2 означает два описания одного и того же ресурса, в то время как одновременное присутствие анонимных описаний ±:: и ¿2 совершенно не гарантирует того, что это описан один и тот же объект.

В параграфе 2.7 рассматривается понятие онтологии в рамках формальной теории. Начинается построение с введения языка онтологий, который строится как расширение языка Ь. Онтология строится как конкретная реализация абстрактной онтологической формы, поэтому язык конкретной онтологии появляется, как только фиксируется онтоформа

ко — (DT, CN, Attr, ID. Уц. <]д). Тогда составляющими языка онтоло-гий являются:

1. Для именования классов используются константы CN = {cni,. . . ,СПр}.

2. Чтобы иметь возможность работать с типами данных базовой модели

3? = (Mi,----М„\ Q) будем использовать в языке множество констант

DT = {dti, — dts}, символизирующих основные множества базовой модели .

3. Включим в язык онтологий предикат аппроксимации С, предикат именования ресурса ::, а также отношение принадлежности элемента классу е.

4. Добавим счетное множество переменных X = (хь х2,. ■.}, принимающих значения на множестве U М.

Получившуюся сигнатуру обозначим

= Ld U CN U DT U X U {€,::, Q}

Сформулируем теперь понятие онтологии. Зафиксируем некоторый язык (класс формул) Е сигнатуры Lßnt, а также некоторое его подмножество Ее (в общем определении онтологии структура языка Е не уточняется, хотя очень подходящим для этих целей с нашей точки зрения является язык До-формул). Выражение F(xi,...,x„) означает, что все свободные переменные формулы Fe Е находятся среди ц,..., хп.

Определение 2.7.1 Пусть CN = {cni,.... спр}. Назовем описанием классов набор правил

х б cni[cnj,..., cn-Lj ^ Fi(x) х е cn2[cnf.....спу ;=i F2(x)

х е cnp[cn?,..., cn£j ^ Fp(x) где F,(х) € Ес.

Выражение вида х £ enjen^,... Ft(x) называется прави-

лом, определяющим класс с именем сп, как непосредственного наследника

классов сп*!,..., сп^. Это определение должно быть согласовано с онто-формой Ко в следующем смысле: если описание С содержит правило вида х 6 спг[... сп_,...] ^ то сп, У и сп_,, причем сп, - непосредственный наследник сп;, то есть не существует сп такого, что сп, у и сп уа спг

Определение 2.7.2 Онтологией назовем тройку (Е,С, Ь), где Е - язык сигнатуры ЬС - описание классов, а I— финитное отношение выводимости, действующее на формулах языка £, ЬС Гт(Е) х Е.

В общем случае отношение выводимости I- зависит от предметной области, описываемой онтологией (Е, С, Ь). Финитность I- является существенным его качеством, позволяя реализовать концепцию «слабого, но эффективного» вывода, действующего на множестве ресурсов, которая обсуждалась в первой главе работы. Для I- существует набор аксиом, выполняющихся в любой онтологии. Этот набор описывает работу с именами ресурсов и с правилами из С. Далее приводятся некоторые из аксиом (£[£'] означает, что является подтермом £):

(А1) Г, Е(Ы)М:-Л\~ Р(Ь) (А2) Г, :: £ь :: £2 Ь гв.:: ^ и £2 (АЗ) ГЛ :-Льк2 уЛ2 I- кх :: и

если к\, к2 € ±}. где Ы е Ю и 3£ € Т^ , что £ С £х, £ С £2 (А4) Г, ¿¿1:: £ь ¿с^ :: £21- ¿<¿1 :: Т,

если ¿¿1 ^ «<¿2 иЗ«€ Т®еу, что £ Е ¿ь £ С £2 (А5) Г,пт :: £[р(£')] Ь пто :: £[р(£') и сп(0,0)], если р <£) (сп*, сп) € Ко и пт € Ю и {±}.

Кроме общезначимых аксиом, конкретная онтология может включать аксиомы, соответствующие описываемой предметной области. Например, можно указать транзитивность и симметричность некоторого свойства из множества АНг:

Г. родственник^) <3 £2, родственник(£2) < ¿з родственник^) <] £3 Г, супруг^) < ¿2 ь супруг(£2) < ¿1

Отношение <1 не входит в язык Ьно выражение р{Ц) С £2 можно понимать как сокращение сп(0, {р(£])}) С £2, если р<о (сп, СЩ) для некоторых сп, сп] е С1Ч.

Параграф 2.8 содержит вариант языка описания классов — одно из возможных уточнений абстрактного языка из определения онтологии, данного в предыдущем параграфе. Сформированный таким образом язык позволяет определить иерархии классов с помощью задания специфичных структурных характеристик элементов, принадлежащих тому или иному классу. Этот язык достаточно простой и не очень выразительный, но его пример позволяет выявить ряд общих моментов, связанных с построением онтологических систем.

В третьей главе анализируется практический потенциал разработанных методов, рассматриваются возможности их применения в различных областях. Также описываются программные системы, реализующие базовые механизмы разработанной теории.

В параграфе 3.1 рассматриваются некоторые из возможных приложений. Предлагаемый формализм может служить базой для построения разнообразных информационных систем. Конкретные задачи в рамках общего подхода решаются через определение специальных логик, работающих на элементах термальной надстройки. Конструкцией, объединяющей разрозненную информацию о предметной области, является онтология, которая в силу своей универсальности может служить основой для самых разнообразных приложений.

В параграфе 3.2 делается обзор системы «Мета». При разработке системы «Мета», ориентированной на решение практических задач в сфере образования, был приобретен ценный опыт, сыгравший существенную роль в разработке теории. Кроме того, был приобретен опыт в области автоматического построения интерфейсов на основе описания структуры данных.

В параграфе 3.3 рассматривается развитие системы «Мета» — система «Мета-2». «Мета-2» — это работа с онтологиями как способом представления знаний. Подход, поддерживаемый системой «Мета-2», является прямой реализацией базовых конструкций теории информационных ресурсов.

В параграфе 3.4 описано использование системы «Мета-2» для решения реальных практических задач. С использованием системы «Мета-2» методы, развитые в рамках настоящей работы, апробировались при решении нескольких практических задач онтологии, описывающие предметную область web-программирования (структуру web-ресурса); онтологии по человеческим ресурсам: онтологии библиографических ссылок.

Заключение

В диссертации представлены методы работы с данными и знаниями в глобальных информационных системах, основанные на принципах семантического программирования. Логическим базисом для этих методов служит разработанная теория информационных ресурсов. Существует ряд направлений исследований, которые планируется осуществить в дальнейшем:

1. С теоретической точки зрения требуется развитие и уточнение логических структур, лежащих в основе представления информации с помощью наследственно-конечных надстроек над базовой моделью типов данных. Возможно, требуют развития и базовые понятия теории. Считаем, что полезными являются подходы, связанные с представлением логических конструкций в формате пространств Ю.Л. Ершова, информационных систем Д. Скотта, сс-программирования (concurrent constraint programming). Интересной задачей является применение различных финитных систем вывода из определения онтологии, в первую очередь, основанных на дескриптивных логиках.

2. Прикладные аспекты. Универсальность и в то же время естественность рассматриваемых конструкций позволяет надеяться на возможность использования данного диалекта семантического программирования в самых разных сферах обработки информации. В первую очередь - это подходы, связанные с обработкой документов, представленных в XML и HTML форматах. Следует также упомянуть о системах метаописаний ресурсов в Интернете, близко к этому стоит вопрос описания предметных областей в формате онтологий. Также очень интересной представляется задача построения объектных языков логического программирования нового поколения, которые могут быть реализованы в рамках развития функционально-логического языка Флэнг.

Можно говорить о методологических и других аспектах использования семантического программирования в глобальной информационной среде. Все это — предмет дальнейших исследований.

Публикации по теме диссертации

1. Манцивода A.B., Малых A.A. Представление и обработка знаний в Интернете // Серия: Информационные системы и логика. Вып. 2 -Иркутск: Изд-во Иркутского ун-та, 2005. 111 с.

2. Малых A.A., Манцивода A.B. Универсальная модель описания образовательных ресурсов // В кн.: «Открытое образование: стандартизация описания информационных ресурсов» / С.Л. Лобачев, A.A. Малых, A.B. Манцивода и др. - М.: РИЦ «Альфа» МГОПУ им. М.А.Шолохова, 2003. - С.103-159.

3. Малых А.А , Манцивода А В. МЕТА: разработка метаописаний образовательных ресурсов // Труды всероссийской конф. «Телемати-ка'2003». - С.-Пб., 2003. - С.169-170.

4. Манцивода A.B., Малых A.A. Метаописания и логическая структура электронных образовательных ресурсов // Труды межд. конф. «Новые инфокоммуникационные технологии- достижения, проблемы, перспективы». - Новосибирск, 2003. - С.73-77.

5. Малых A.A., Манцивода A.B. МЕТА: метаописания и образовательные пакеты // Труды всероссийской конф. «Телематика'2004». - С.-Пб., 2004. - С.552-553.

6. Малых A.A., Манцивода A.B. Система МЕТА и открытые модели знаний // Труды всероссийской конф. «Научный сервис в сети Ин-тернет-2004». - М.: Изд-во МГУ, 2004. - С.173-175.

7. Малых A.A. МЕТА-2' система метаописаний как основа построения информационных систем // Труды молодеж. научно-метод, конф. «Современные информационные технологии в науке и образовании». - Иркутск: Изд-во БГУЭП, 2004. - С.21.

8. Малых A.A., Манцивода A.B. МЕТА-2: поддержка онтологий и образовательные системы // Труды всероссийской конф. «Телемати-ка'2005». - С.-Пб., 2005. - С.232-233.

9. Малых A.A. Дескриптивные термы и именующие ограничения // Материалы VII школы-семинара «Математическое моделирование и информационные технологии». - Иркутск: Изд-во ИДСТУ, 2005. - С.23-24.

*2226в

РНБ Русский фонд

2006-4 17956

Редакционно-издательский отдел Иркутского государственного университета. 664000, г.Иркутск, бульвар Гагарина, 36.

Подписано в печать 11.11.2005. Формат бумаги 60x84 1/16. Бумага офсетная. Печать трафаретная. Уч. печ. л. 1,4. Уч.-изд. л. 1,2. Тираж 200 экз. Заказ №119.

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Малых, Антон Александрович

Введение

1 Концептуальные основы теории информационных ресурсов

1.1 Семантический Интернет.

1.2 Ресурсы и их идентификация.

1.3 Метаописания ресурсов.

1.4 Представление знаний в Интернете.

1.5 Интернет и логический вывод.

1.6 Онтологии.

2 Теория информационных ресурсов

2.1 Онтологии и семантическое программирование.

2.2 Термальная надстройка над моделью: описание объектов

2.3 Иерархия и наследование информации.

2.4 Аппроксимация и объединение информации

2.5 Классы

2.6 Ресурсы.

2.7 Онтологии.

2.8 Пример языка описания классов.

3 Апробация методов

 
Введение диссертация по математике, на тему "Представление знаний и семантическое программирование"

Цели и задачи исследования

Диссертационная работа посвящена развитию автоматизированных методов работы со знаниями в глобальном информационном пространстве. Цель работы — создание на основе диалекта семантического программирования [68][69] логической системы представления и обработки знаний, ориентированной на работу в распределенных информационных средах. Данная система должна совмещать использование продвинутых логических методов с возможностью эффективной реализации и устойчивостью к агрессивным условиям глобальной сети. С содержательной точки зрения система должна быть ориентирована на решение ключевых задач, накопившихся на сегодняшний день в Интернете, включая моделирование понятия информационного ресурса, имени ресурса, механизмов метаописаний ресурсов.

Для достижении этой цели решались задачи:

• разработка концептуальных основ системы обработки знаний в распределенных информационных средах на базе семантического программирования;

• разработка логического формализма (теории информационных ресурсов, ТИР), удовлетворяющего концептуальным положениям и условиям работы в глобальной информационной среде;

• исследование применимости ТИР к представлению и автоматизированной обработке иерархических систем данных и знаний;

• апробация ТИР в приложении к практическим задачам реальной сложности.

Научная новизна

В работе впервые исследованы возможности применения концептуальных положений семантического программирования к обработке больших массивов знаний и данных в распределенных информационных системах и Интернете [19]. Разработан логический формализм, реализующий данный подход. Построены логические модели базовых понятий, включая понятие информационного ресурса, имени информационного ресурса, онтологии как системы описания предметных областей, в терминологических рамках семантического программирования. Исследованы возможности практического использования разработанной логической системы.

Научная и практическая значимость работы

Работа ориентирована на решение актуальных проблем, возникающих сегодня в Интернете. В связи с бурным и неконтролируемым наполнением разнообразными информационными ресурсами мировая информационная среда постепенно превращается в необозримое собрание разрозненной и неупорядоченной информации. Данная ситуация, которая с течением времени только усугубляется, не позволяет эффективно использовать информационные богатства глобальной сети. Подход, на котором основана диссертационная работа, состоит в том, чтобы интеллектуализи-ровать работу компьютера в Интернете, передать ему ряд задач, которые сегодня приходится решать человеку, включая поиск информации, анализ найденной информации, выполнение ряда практических задач по взаимодействию с Интернет-сервисами и т.д. Существенную роль в нашей работе играет использование гибкого и логически чистого подхода семантического программирования. На его основе построена теория информационных ресурсов, служащая базовым формализмом для разработки различных проектов, ориентированных на интеллектуализацию работы компьютеров в Интернете. С другой стороны, теория информационных ресурсов является определенным вкладом в развитие самого семантического программирования. Подходы, развиваемые в данной работе, апробировались на большом количестве практически значимых задач в области дистанционного образования, разработки электронных библиотек, систем управления кадрами, продвинутыми задачами web-пpoгpaммиpoвaния. Полученные в рамках апробации результаты вселяют надежды на хорошие перспективы применения разработанных методов в самых разнообразных сферах представления данных и знаний в распределенных информационных системах.

На защиту выносятся

1. Разработка концептуального подхода к представлению знаний в глобальной информационной среде на основе семантического программирования.

2. Логическая теория информационных ресурсов.

3. «Мета-2» — программная система, реализующая базовые механизмы представления знаний в формате онтологий в соответствии с теорией информационных ресурсов.

Структура и объём диссертации

Диссертация состоит из введения, трех глав, заключения и списка использованной литературы.

 
Заключение диссертации по теме "Дискретная математика и математическая кибернетика"

Заключение

В диссертации представлены методы работы с данными и знаниями в глобальных информационных сетях, основанные на принципах семантического программирования. Логическим базисом для этих методов служит разработанная нами теория информационных ресурсов. Как с теоретической, так и с практической точки зрения существует ряд направлений исследований, которые мы планируем осуществить в дальнейшем. Отметим лишь некоторые направления работ:

1. С теоретической точки зрения требуется развитие и уточнение логических структур, лежащих в основе представления информации с помощью наследственно-конечных надстроек над базовой моделью типов данных. Возможно, требуют развития и базовые понятия, определенные выше. Уже сейчас видно, что полезными являются подходы, связанные с представлением логических конструкций в формате пространств Ю.Л. Ершова, информационных систем Д. Скотта [77j, а также как системы сс-программирования (concurrent constraint programming [76]). Этот подход связан с общей проблемой построения логических исчислений в рамках ТИР, причем исчислений, интересных с практической точки зрения, позволяющих реализовывать практические задачи поиска и обработки информации в виртуальных информационных средах. Отсюда возникает вопрос о построении эффективных стратегий поиска вывода в данных логических исчислениях, а также построении соответствующих систем автоматического доказательства. Интересной задачей является применение различных финитных систем вывода из определения онтологии, в первую очередь, основанных на дескриптивных логиках. Ограничим перечисление этими задачами, хотя имеется и ряд других теоретических проблем, подлежащих решению.

2. Прикладные аспекты. С нашей точки зрения, универсальность и в то же время естественность рассматриваемых конструкций позволяет надеяться на возможность использования данного диалекта семантического программирования в самых разных сферах обработки информации. В первую очередь следует упомянуть о новых подходах, связанных с обработкой документов, представленных в наиболее распространенных в сегодняшнем Интернете форматах — XML и HTML. Следует также упомянуть о системах метаописаний ресурсов в Интернете — идее, на которой основан проект Semantic Web. Близко к этому стоит вопрос описания предметных областей в формате онтологий, что позволяет описывать знания в виде, удобном для использования Интернет-сервисами, в частности, теми же системами метаописаний. Отдельно стоит задача построения систем вывода новых знаний из описаний ресурсов и метаданных, а также использования этих знаний для практической работы с информационными ресурсами. По нашему представлению, здесь есть очень интересные возможности вплоть до развития принципиально новых подходов к структуре операционных систем и работы с файлами как ресурсами (эти приложения ориентированы на самый широкий круг пользователей компьютеров). Любопытно исследовать возможности ТИР для новых способов работы с ресурсами на локальных компьютерах, что можно охарактеризовать как объектный подход к построению операционных систем. И конечно, очень интересной представляется задача построения языков логического программирования нового поколения, что мы пытаемся реализовать в рамках развития функционально-логического языка Флэнг.

Можно говорить о методологических и других аспектах использования семантического программирования в глобальной информационной среде. Все это — предмет дальнейших исследований.

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Малых, Антон Александрович, Иркутск

1. Подход к стандартизации в информационно-образовательной среде открытого образования / Е.И. Горбунова, С.Л. Лобачев, A.A. Малых, A.B. Манцивода // Труды всероссийской конф. «Телематика'2003». -С.-Пб., 2003. С.423-425.

2. Система МЕТА: документация, дистрибутив ранней версии. 2004. -http://teacode.com/meta.

3. Система «ONTOGRID» для построения онтологий / В.Д. Гусев, А.В Завертайлов, Н.Г. Загоруйко, С.П. Ковалёв, A.M. Налётов, Н.В.Саломатина. http://www.dialog-21.ru/Archive/2005/Zagoruiko%20Gusev%20Zavertailov/ZagoruykoNG.htrn.

4. Флэнг-проект: web-страница. 2002-2004. - http://teacode.com/flang.

5. ГОСТ 7.1-2003. Библиографическая запись. Библиографическое описание. Межгосударственный стандарт.

6. QTI-плейер: онлайновый сервис поддержки тестирования /A.B. Манцивода, A.A. Малых, O.A. Романова, Н.О. Стукушин. // Труды всероссийской конф. «Телематика'2004». С.-Пб., 2004.

7. Липовченко В.А., Манцивода A.B. Трансляция математических формул из документов MS WORD в стандартный формат // Труды всероссийской конф. «Телематика'2004». С.-Пб., 2004.

8. Малых A.A., Манцивода A.B. МЕТА: разработка метаописаний образовательных ресурсов // Труды всероссийской конф. «Телематика'2003». С.-Пб., 2003. - С.169-170.

9. Малых A.A., Манцивода A.B. МЕТА: метаописания и образовательные пакеты // Труды всероссийской конф. «Телематика'2004». С.-Пб., 2004. - С.552-553.

10. Малых A.A., Манцивода A.B. Система МЕТА и открытые модели знаний // Труды всероссийской конф. «Научный сервис в сети Интер-нет-2004». М.: Изд-во МГУ, 2004. - С.173-175.

11. Малых A.A. МЕТА-2: система метаописаний как основа построения информационных систем // Труды молодеж. научно-метод. конф. «Современные информационные технологии в науке и образовании». Иркутск: Изд-во БГУЭП, 2004. - С.21.

12. Малых A.A., Мандивода A.B. МЕТА-2: поддержка онтологий и образовательные системы // Труды всероссийской конф. «Телематика'2005».- С.-Пб., 2005. С.232-233.

13. Малых A.A. Дескриптивные термы и именующие ограничения // Материалы VII школы-семинара «Математическое моделирование и информационные технологии». Иркутск: Изд-во ИДСТУ, 2005. - С.23-24.

14. Манцивода A.B., Куроптев A.C. Изображение математических формул в формате MathML // Труды всероссийской конф. «Телематика'2004».- С.-Пб., 2004.

15. Манцивода A.B., Малых A.A. Метаописания и логическая структура электронных образовательных ресурсов// Труды межд. конф. «Новые инфокоммуникационные технологии: достижения, проблемы, перспективы». Новосибирск, 2003. - С.73-77.

16. Манцивода A.B., Ульянов B.C. Онтологические системы и задачи управления контентом // Труды всероссийской конф. «Телематика'2005». С.-Пб., 2005.

17. Манцивода A.B., Малых A.A. Представление и обработка знаний в Интернете. // Серия: Информационные системы и логика. Вып. 2. -Иркутск: Изд-во Иркутского ун-та, 2005. 111 с.

18. Манцивода A.B., Петухин В.А. Порталы, обработка структурированной информации и языки искусственного интеллекта // Труды всероссийской конф. «Телематика'2003». С.-Пб., 2003. - С. 168-169.

19. Манцивода А.В., Малых А.А., Петухин В.А. Электронные учебные материалы: стандарты и решения // Труды всероссийской конф. «Теле-матика'2002». С-Пб., 2002. - С.85-86.

20. Манцивода А.В. Язык Флэнг и обработка XML-документов // Труды всероссийской конф. «Научный сервис в сети Интернет-2004 г.» М.: Изд. МГУ, 2004. - С.236-239.

21. Манцивода А.В., Петухин В.А., Шивторов М.И. RTF, LaTeX и логическая разметка документов // Труды всероссийской конф. «Телемати-ка'2004». С.-Пб., 2004.

22. Романова О.А., Нартов Д.С., Стукушин Н.О. Онлайновая консультация по математике // Труды всероссийской конф. «Телематика'2003». С.-Пб., 2003. - С.203-205.

23. About Google Desktop Search: (поисковая система на локальном компьютере). http://desktop.google.corn/about.html.

24. About the Unicode Standard: (спецификация Unicode). -http: / / www.unicode.org/standard / standard.html.

25. DCMI Metadata Terms. http://dublincore.org/documents/dcmi-terms/.

26. The Description Logic Handbook: Theory, Implementation, and Applications / Franz Baader, Diego Calvanese, Deborah L. McGuinness,

27. Daniele Nardi, Peter F. Patel-Schneider (Eds.). Cambridge University Press, 2003. - ISBN 0-521-78176-0.

28. The DLP Experimental Description Logic System and Propositional Modal Logic Satisfiability Checker. http://www.bell-labs.com/user/pfps/dlp/.

29. Dublin Core Metadata Initiative: (дублинское ядро, инициативная группа по метаописаниям). http://dublincore.org/.

30. Dublin Core: Projects. http://dublincore.org/projects/.

31. Guidelines for implementing Dublin Core in XML. -http://dublincore.org/documents/dc-xml-guidelines/.

32. Human resources consortium. http://www.hr-xml.org/.

33. IMS Content Packaging vl.1.4: Final specification. -http://www.imsglobal.org/ content/packaging/.

34. IMS Global Learning Consortium: (консорциум IMS). -http: / / www.imsglobal.org/.

35. IMS Learning Resource Meta-Data Information Model Version 1.2.1: Final Specification (спецификация IMS «Метаданные учебных объектов. Информационная модель». -http://www.imsglobal.org/metadata/imsmdvlp2pl/imsmdinfovlp2pl.html.

36. Learning object metadata: IEEE Learning Technology Standards Committee. http://ltsc.ieee.org/.

37. Mathematical Markup Language (MathML) Version 2.0: W3C

38. Recommendation. http://www.w3.org/TR/2003/REC-MathML2-20031021/.

39. Namespaces in XML. http://www.w3.org/TR/REC-xml-names.

40. OWL Web Ontology Language: Overview. -http://www.w3.org/TR/2004/REC-owl-features-20040210/.

41. Protégé: open source ontology editor and knowledge-base framework. -http://protege.stanford.edu/.

42. RDF: Resource Description Framework. http://www.w3.org/RDF/.

43. RDFCore: Resource Description Framework (RDF) Schema Specification 1.0.

44. Semantic Web activity. http://www.w3.org/2001/sw/.

45. The Description Logic Handbook. Theory, Implementation and Applications / edited by Franz Baader, Diego Calvanese, Deborah McGuinness, Daniele Nardi, Peter Patel-Schneider. Cambridge, 2003. -574p.

46. TeaCode UDC: проект. http://teacode.com/online/udc/.

47. Uniform Resource Identifiers (URI): Generic Syntax. 1998. -http: / / www.ietf.org/rfc / rfc2396.txt.

48. Universal Decimal Classification Consortium. http://www.udcc.org.

49. W3C: About the World Wide Web Consortium. http://www.w3.org/Consortium/.

50. What's a blog: (система электронных дневников, блоггинг). -http://www.blogger.com/tour-start.g.

51. Web Ontology Working Group. http://www.w3.org/2001/sw/WebOnt/.

52. XML: Extensible Markup Language 1.0 // W3C Recommendation. 04 February 2004. - http://www.w3.org/TR/2004/REC-xml-20040204.

53. XML Schema Part 2: Datatypes, W3C Recommendation // World Wide Web Consortium. 2 May 2001. - http://www.w3.org/TR/2001/REC-xmlschema-2-20010502/.

54. Baader F., Sattler U. Number restrictions on complex roles in description logics //In Proceedings of KR-96. 1996. - 328-339pp.

55. Baker T. A Grammar of Dublin Core. // D-Lib Magazin. 2000. - N10. -http://www.dlib.org/dlib/october00/baker/10baker.html.

56. Berners-Lee T., Hendler J., Lassila О. The Semantic Web // Scientific American. May, 2001.

57. Brickley D., Guha R.V. Resource Description Framework (RDF) Schema Specification: W3C proposed recommendation. Mar. 1999. -http://www.w3.org/TR/1999/PR-rdf-schema-19990303.

58. Champin P.-A. RDF Tutorial. 2001. - http://www710.univ-lyon 1 .fr/ ~ champin / rdf-tutorial /.

59. Haarslev V., Moller R. RACE System Description. University of Hamburg, Computer Science Department. - http://www.sts.tu-harburg.de/~r.f.moeller/racer/papers/1999/HaMo99c.pdf.

60. Hillrnann D. Using Dublin Core: Dublin Core Metadata Initiative. -http://dublincore.org/documents/2003/08/26/usageguide.

61. Horrocks I., Patel-Schneider P., Van Harmelen F. From SHIQ and RDF to OWL: The making of a Web Ontology Language. -www.cs.man.ac.uk/~horrocks/Publications/download/2003/HoPH03a.pdf.

62. Lagoze K. Keeping Dublin Core Simple. Cross-Domain. Discovery or Resource Description // In D-Lib Magazin. 2001. - N1. -http: / / www.dlib.org/dlib/january01 /lagoze/Ollagoze.html.

63. Lassila O., Swick R.R. Resource Description Framework (RDF) Model and Syntax Specification: W3C recommendation. Feb.1999. -http://www.w3.org/TR/1999/REC-rdf-syntax-19990222.

64. Laurent S. St. XML: A Primer. M & T Books, Foster City, CA, 1999.

65. Goncharov S.S., Ershov Yu.L., Sviridenko D.I. Semantic foundations of programming // Lecture Notes in Computer Science. v.278, 1987. - 116-122pp.

66. Goncharov S.S., Ershov Yu.L., Sviridenko D.I. Semantic programming // Information processing, Proc. IFIP 10-th World Comput. Congress. -Dublin, v.10, 1986. 1093-1100pp.

67. Mantsivoda A. Flang: A Functional-Logic Language // Lecture Notes in Computer Science. 567. - 257-270pp.

68. Mantsivoda A., Petukhin V., Weimann A. Memory Management of Constraints in Flang // Proc. of 10th Int. Conf on Logic Programming. MIT Press, 1993. - 633-646pp.

69. Pal'chunov D.E. Logical Methods of Ontology Generation with the Help of GABEK //IV International GABEK Symposium. Innsbruck, Austria, 2002. - p.17.

70. Pal'chunov D.E. Logical Definition of Object Domain Ontology // Abstracts of the 9th Asian Logic Conference. Novosibirsk, 2005. - 138-139pp.

71. Pal'chunov D.E. GABEK for Ontology Hierarchy Generation // V International GABEK Symposium. Innsbruck, Austria, 2004. - 5-6pp.

72. Organization, Bd. II). Wien: LIT-publishing Company, 2005, forthcoming. - 21 p.

73. Saraswat V.A. Constraint Logic Programming. MIT Press, 1993.

74. Scott D. Domains for Denotational Semantics // Lecture Notes In Computer Science Proceedings of the 9th Colloquium on Automata, Languages and Programming table of contents. 1982. - 577-613pp.

75. Sowa J.F. Ontology, Metadata, and Semiotics. -http: / / users.bestweb.net/~sowa/ peirce/ontometa.htm.