Физические принципы организации нейроподобной голографической сети для обработки массивов аналоговой информации тема автореферата и диссертации по физике, 01.04.05 ВАК РФ

Денисов, Игорь Викторович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Владивосток МЕСТО ЗАЩИТЫ
1999 ГОД ЗАЩИТЫ
   
01.04.05 КОД ВАК РФ
Диссертация по физике на тему «Физические принципы организации нейроподобной голографической сети для обработки массивов аналоговой информации»
 
 
Текст научной работы диссертации и автореферата по физике, кандидата физико-математических наук, Денисов, Игорь Викторович, Владивосток

МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ДАЛЬНЕВОСТОЧНЫЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ

УНИВЕРСИТЕТ

на правах рукописи

Денисов Игорь Викторович

ФИЗИЧЕСКИЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ НЕЙРОПОДОБНОЙ ГОЛОГРАФИЧЕСКОЙ СЕТИ ДЛЯ ОБРАБОТКИ МАССИВОВ АНАЛОГОВОЙ ИНФОРМАЦИИ

Специальность 01.04.05 - оптика

диссертация на соискание ученой степени кандидата физико-математических наук

Автор : /¡/ф^/ Научный руководитель доктор

физико-математических наук, профессор Ю. Н. Кульчин

Владивосток - 1999 г.

СОДЕРЖАНИЕ

Лист

ВВЕДЕНИЕ............................................................ 4

1. ЭКСПЕРИМЕНТАЛЬНЫЕ МЕТОДИКИ....................... 38

1.1. Универсальная экспериментальная установка для

исследования принципов создания информационно-измерительных систем на основе голографической нейроподобной вычислительной сети дискового типа..... 40

1.1.1. Блок формирования опорных пучков и ввода оптического излучения в волоконно-оптические измерительные линии.............................................. 45

1.1.2. Система моделирования физических воздействий на ВС распределённой волоконно-оптической измерительной сети...................................................................... 48

1.2 Процесс записи оптической информации на тонких

голограммах........................................................... 50

1.3. Процесс обработки массивов аналоговой информации волоконно-оптической измерительной сети с применением голографической запоминающей среды.................................................................... 54

2. ОПТИЧЕСКАЯ НЕЙРОННАЯ СЕТЬ НА ОСНОВЕ ДВУХСЛОЙНОГО ГОЛОГРАФИЧЕСКОГО ВЕКТОР-МАТРИЧНОГО УМНОЖИТЕЛЯ................................. 57

2.1. Вектор-матричный умножитель оптической нейронной

сети типа двухслойный персептрон............................ 59

2.1.1. Алгоритм работы двухслойного вектор-матричного

умножителя............................................................ 59

2.1.2. Принципы обучения нейронной сети на основе вектор-

матричного умножителя........................................... 68

2.2. Голографический аналог двухслойной нейронной сети... 72

2.3. Процесс восстановления информации от волоконно-оптической измерительной сети посредством оптической нейронной сети....................................... 77

3. СИСТЕМА РАСПОЗНАВАНИЯ ОБРАЗОВ НА ОСНОВЕ ВОЛОКОННО-ОПТИЧЕСКОЙ ИЗМЕРИТЕЛЬНОЙ СЕТИ И МОДЕЛИ ОПТИЧЕСКОЙ НЕЙРОННОЙ ВЫЧИСЛИТЕЛЬНОЙ СЕТИ...................................... 82

3.1. Распределённая волоконно-оптическая измерительная сеть...................................................................... 83

3.1.1. Принцип действия распределённой волоконно-оптической измерительной линии.............................. 84

3.1.2. Применение волоконно-оптических измерительных сетей для исследования физических полей................... 89

3.2. Компьютерная модель нейронной сети........................ 94

3.3. Волоконно-оптическая система восстановления функции распределения деформационного поля............ 104

3.4. Принцип работы нейроподобного вычислительного

комплекса.............................................................. 115

ЗАКЛЮЧЕНИЕ....................................................... 123

СПИСОК ЛИТЕРАТУРЫ.......................................... 130

ВВЕДЕНИЕ

В настоящее время большое внимание привлечено к созданию новых систем обработки информации, способных управлять сложными многопараметрическими процессами в высокотехнологичных производствах различных отраслей промышленности, при мониторинге изменений в атмосфере и океане, в процедурах неразрушающего контроля, в гидроакустике, геофизике, для разработки охранных систем объектов и так далее [1]. Такой интерес объясняется значительным повышением требований, предъявляемых к разработке быстродействующих информационно-измерительных систем, что связано с постоянным увеличением объёма и сложности обрабатываемых данных, которые в большинстве случаев являются многомерными. В свою очередь, подобная тенденция стимулирует исследовательские работы по совершенствованию существующих и созданию новых устройств записи, хранения и обработки информации, имеющих большую ёмкость и быстродействие, на основе новых алгоритмов.

Создание мощных ЭВМ, направленных на решение описанной проблемы, наталкивается на предел в скорости обмена и обработки информации, ограничение ёмкости их оперативной памяти и другие проблемы, вызванные последовательным принципом работы таких вычислительных устройств [2]. Поэтому большой интерес представляют оптические методы обработки информации, что связано с огромными

потенциальными возможностями параллельной обработки больших массивов информации, высокой плотностью хранения этой информации на оптических носителях, распространением её со световой скоростью и т. д. [3]. Кроме того, с помощью оптических устройств реализуются очень важные интегральные преобразования над сигналами, такие как, нахождение свёртки, корреляции, а также преобразования Фурье, Гильберта, Лапласа, Френеля, Меллина и другие [4]. Все эти особенности позволяют производить вычисления с использованием оптического излучения практически в реальном времени, что является наиболее привлекательным на пути создания высокоскоростных вычислительных устройств и систем [5].

Указанные преимущества реализуются в специализированных оптических процессорах, которые представляют собой совокупность оптических и оптоэлектронных элементов, выполняющих, в соответствии с заданной функцией, оптическую обработку информации [6]. В зависимости от используемых элементов и их характеристик определяется алгоритм этой оптической обработки [7]. Несмотря на то, что цифровые оптические процессоры к настоящему времени хорошо развиты, алгоритм обработки информации у них подобен алгоритму обработки, используемому в универсальных ЭВМ. Поэтому важным вопросом на пути создания высокоэффективных вычислительных устройств является развитие аналоговых оптических процессоров с параллельным принципом действия.

Наибольшие трудности перед разработчиками оптических процессоров встают при выборе и практическом изготовлении оптической запоминающей

среды. Запись информации в ней основана на изменении параметров этой среды при воздействии на неё оптического излучения [8, 9]. Среди оптических запоминающих сред выделяются среды, в которых запись информации осуществляется голографическим способом [10, 11]. Практически с первых работ в этом направлении было показано, что голографические запоминающие среды обладают высокой помехоустойчивостью, обеспечивают возможность высокой плотности хранения информации [12, 13], а также позволяют реализовывать в устройствах на их основе ассоциативный поиск [14], логические, арифметические операции [15], функциональные цифровые преобразования [16] и интегральные преобразования, указанные выше.

В соответствии с физическими и химическими способами записи информации выделяют несколько классов голографических регистрирующих материалов, из которых основными являются фотографические и фотохромные среды, фоторезисты, фотопластики, фотополимеры, бихромированная желатина и другие [17].

Каждый из перечисленных материалов обладает определёнными преимуществами и недостатками по сравнению с другими. Поэтому выбор той или иной запоминающей среды в качестве носителя информации оптического процессора определяется задачей, на выполнение которой он направлен.

Наибольшее признание в голографической записи по сравнению с другими материалами получили фотографические эмульсии по причине

простоты их эксплуатации. Они характеризуются очень высокой экспозиционной чувствительностью (1-1(Г8 - МО'4 Дж/см2 в красной области спектра регистрирующих волн) и разрешающей способностью (от 300 до свыше 3000 мм"1 в той же области длин волн), а также широким диапазоном спектральной чувствительности [17]. Кроме того, фоторегистрирующие эмульсии легко обрабатываются, и их можно применять для получения как плоских, так и объёмных голограмм с амплитудной или фазовой записью.

Однако все специализированные оптические процессоры на фоне общего развития вычислительной техники и повышения сложности задач, решаемых информационно-измерительными системами, имеют довольно узкую направленность, что ограничивает их практическое применение. Именно по причине этого неудобства оптические процессоры не получили широкого распространения. Тем не менее, существует широкий класс задач, где применение оптики является намного перспективней традиционных электронных вычислительных устройств, снимая описанные выше ограничения их работы.

Одной из наиболее важных и актуальных, с практической точки зрения, проблем, решаемых оптическими вычислительными устройствами, является задача оперативной обработки больших объёмов динамически меняющихся оптических сигналов. Поэтому остро встаёт вопрос о необходимости создания быстродействующих вычислительных устройств, способных адаптироваться под решение конкретной задачи [18]. Таким

требованиям могут удовлетворять системы, работа которых подобна работе биологических нейронных клеток, являющихся основными элементами мозга любых живых существ, а сама структура мозга является самой сложной из известных на данный момент структур.

Системы, в которых предпринимаются попытки имитации поведения живого мозга, в том числе и человеческого, называются нейроподобными. Они имеют множество достоинств: параллельный механизм обработки данных, способность прогнозировать изменения входной информации, сохранение работоспособности при частичном выходе из строя элементов и связей, самообучаемость, гибкость, ассоциативность, абсолютная и быстрая сходимость к одному из устойчивых состояний под действием входного сигнала, попадающего в область притяжения этого состояния.

Недостаток нейроподобных систем заключается в том, что они не являются универсальными [19]. Программа аналоговой машины определена её строением. Чтобы перепрограммировать такую систему на решение новой задачи, необходимо фактически заново создать её внутреннюю архитектуру.

Однако подобное сужение специализации этих устройств компенсируется способностью к обучению - основному преимуществу нейроподобных вычислительных сетей. При соответствующем обучении нейросеть приобретает способность выполнять практически любые преобразования данных, даже в том случае, если они не могут быть описаны определённой функциональной зависимостью. Кроме того, нейронная сеть может оперировать с аналоговыми сигналами без применения аналого-

цифровых преобразователей, что существенно повышает скорость обработки данных. Для воспроизведения тех или других особенностей нейросистем создаются их модели с заданным набором свойств.

Первым, кто успешно сымитировал одну из важнейших процедур мозга - распознавание образов, был Розенблатт [20], в начале шестидесятых годов. Несмотря на некоторые успехи, основные выводы, сделанные на том же этапе, были пессимистичными. Результатом явилось то, что основное внимание сместилось к альтернативным методам в области искусственного интеллекта, что было более обещающим. Однако позже, из-за увеличения компьютерных мощностей и того, что проблема искусственного интеллекта действительно была хорошо проработана, былой интерес вновь вернулся к искусственным нейронным сетям, результатом чего явилось огромное число интересных работ по дальнейшему изучению нейронных сетей и созданию новых перспективных архитектур.

К настоящему времени сделано множество попыток смоделировать интеллектуальные способности мозга, такие как размышление, память, решение сложных многопараметрических задач, и обучение. Подобное стремление не случайно, так как перечисленные выше достоинства нейроподобных систем являются характерными особенностями работы человеческого мозга.

Основой такой вычислительной системы базирующейся на представлениях о строении мозга и о процессах обучения является нейроподобный процессор, который упрощённо можно представить как

устройство, которое получает вектор входных данных и выполняет над ним некоторые преобразования, зависящие от набора настраиваемых параметров. Полученные значения хранятся в особом устройстве памяти с быстрым доступом. При этом применение таких процессоров и специальных устройств памяти ориентировано на выполнение операций, адекватных структуре нейросети.

Нейронная сеть представляет собой совокупность простых процессорных элементов, называемых нейронами, обладающих локальным функционированием и объединённых направленными связями [19]. Нейроны и межнейронные связи могут задаваться несколькими способами, наиболее важными из которых являются имитационные программы на обычных компьютерах, специальные приставки к ним, либо самостоятельные нейрокомпьютеры на электронной или оптической элементной базе. Функционирование нейрона в нейрокомпьютере или нейропрограмме сродни работе биологического нейрона.

Бионейрон - это клетка, содержащая ядро и цитоплазму, заключённую в оболочку [21]. Он имеет длинные отростки, связанные с другими нейронами с помощью синапсов, число которых колеблется от сотни до тысяч, передающих электрический импульс от одного нейрона к другому. Отростки подразделяются на ветвящиеся - дендриты, передающие сигналы к данному нейрону, и аксоны, нервные волокна или осевые отростки, передающие сигнал от данного нейрона. Аксоны имеют боковые отростки -коллатерали, заканчивающиеся на других клетках. Нейроны живых

организмов многообразны, но их можно разбить на три группы: мотонейроны, чувствительные и ассоциативные нейроны.

Функционирование же формального нейрона начинается с того, что в определённый момент времени он получает по дендритам входные сигналы от других нейронов. Сигнал с каждого входа умножается на весовой коэффициент этого входа и складывается с другими сигналами, также умноженными на весовые коэффициенты соответствующих входов. В зависимости от полученного значения формируется выходной сигнал, передающийся другим нейронам по аксону. Таким образом, нейронная сеть способна после прохода по нейронам входного сигнала выдавать на выходе определённый ответ, который зависит от весовых коэффициентов всех нейронов. При этом, установление соответствия выходного сигнала входному сигналу, посредством настраивания весовых коэффициентов, и есть не что иное, как обучение нейронной сети [22, 23].

В настоящее время доминирует представление о структуре и функционировании мозга, согласно которому вся сложность и важнейшие качества мозга определяются связями между нейронами [24]. Соответствующее направление получило название коннекционизма (главное - связи, а не свойства элементов). При этом индивидуальные биохимические свойства клеток, закладываемые на стадии их роста, вообще не рассматриваются [25].

Искусственная нейронная сеть является упрощённой моделью биологической сети.

Модель искусственного нейрона

1 - синапсы; 2 - сумматор; 3 - нелинейный оператор; 4 - точка ветвления.

Рис. 1.

Модель слабосвязной нейронной Модель полносвязной нейронной

сети.

сети.

Рис. 2.

Рис. 3.

Согласно специальной схемотехники, выработанной в нейроинформатике, для создания нейронных процессоров в упрощённом представлении необходимо объединение следующих основных элементарных устройств (рис.1) [26].

1) Синапсы - 1 определяют связи между нейронами и выполняют умножение X; компонент передаваемого входного сигнала Х = (х15х2,...,хп) на соответствующие а; веса синапсов - вектор настраиваемых параметров а = (а,,а2,...,ап).

2) Сумматор - 2 имеет векторный вход и складывает сигналы, приходящие по синапсам к данному нейрону:

п

Х-ат =(х1,х2,...,хп)-(а1,а2,...,ап)т = Хх1а1'

¡=1

где значок Т у вектора а означает операцию транспонирования.

3) Нелинейный оператор - 3 действием характеристической функции ср

п

переводит входной скалярный сигнал , поступающий с выхода

¡=1

сумматора, в выходной у = ср

С п Л V 1=1 У

, от явного вида которого зависит тип

нейрона. Сам нейрон получается последовательным соединением первых трёх элементов.

При этом сеть называется гомогенной или гетерогенной, что определяется числом параметров характеристической функции.

Модель циклической нейронной сети.

Рис. 4.

Модель многослойной нейронной сети.

Входные

сигналы

Выходные

сигналы —►

Слой 1

Слой 2

Слой п

4) Для рассылки выходного сигнала от одного нейрона, снимаемого с нелинейного преобразователя, по входам нейронов следующего слоя служит точка ветвления - 4.

Помимо представленных стандартных элементов существуют различные их вариации, такие, как паде-нейрон, квадратичный адаптивный сумматор, неоднородный адаптивный сумматор и другие [27, 28].

По структурным особенностям связей нейронов между собой различают следующие типы нейронных сетей [29]:

1) слабосвязные (рис. 2), где каждый нейрон в узле решётки (например Хч) связан только с ближайшими нейронами;

2) полносвязные (рис. 3), при которых каждый нейрон (например Хк) связан со всеми другими нейрона�