Разработка и исследование оптико-электронных корреляционных систем с использованием элементов нейронных сетей для распознавания изображений тема автореферата и диссертации по физике, 01.04.05 ВАК РФ
Козик, Виктор Иванович
АВТОР
|
||||
кандидата технических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Новосибирск
МЕСТО ЗАЩИТЫ
|
||||
1997
ГОД ЗАЩИТЫ
|
|
01.04.05
КОД ВАК РФ
|
||
|
,На правах рукописи &
% "
КОЗПК ВИКТОР ИВАНОВИЧ
РАЗРАБОТКА И ИССЛЕДОВАНИЕ ОПТИКО-ЭЛЕКТРОННЫХ КОРРЕЛЯЦИОННЫХ СИСТЕМ С ИСПОЛЬЗОВАНИЕМ ЭЛЕМЕНТОВ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИИ
01 04. 05 - " Оптика "
А В Г О I» Е (I) Е Р А Т
диссертации на соискание ученой степени
кандидата технических наук
Новосибирск- 1497
Работа выполнена в Институте автоматики и электрометрии Сибирского отделения РАН.
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
доктор технических наук, Потатуркин О. И.
доктор физико-математических Борыняк Л. А.
доктор технических наук, Чугуй Ю. В.
НИИРО (НИИ радиооптики, г.Москва)
Л
Г,
Защита диссертации состоится "
Л Ъо г—
/Л [
1997 г.
час. на заседании диссертационного совета К 003.06.01 при
Институте автоматики и электрометрии СО РАН.
Адрес: 630090, г. Новосибирск, пр. акад. Коптюга, 1.
С диссертацией можно ознакомиться в библиотеке ИАиЭ СО РАН.
Автореферат разослан'
1997 г.
Ученый секретарь диссертационного совета к.ф.-м. н.
Л. В. Ильичев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы.
Задана распознавания малоразмерных изображений - порядка 16x16 - 32x32 элемента является актуальной при решении проблем опознавания и координатной привязки удаленных целен, обработки аэрофотоснимков и т.п. К настоящему времени в общем виде она не решена, хотя в конкретных прикладных задачах может быть использован ряд известных параметрических и непараметрических алгоритмов. Ввиду необходимости обработки больших массивов данных в реальном времени эти задачи не всегда могут быть решены с использованием электронных средств, и в данном случае может быть более эффективным применение параллельных или параллельно-последовательных оптических методов, реализуемых средствами когерентной или некогерентной оптики. Некогерентные оптические системы характеризуются большей помехоустойчивостью, однако обладают более низкой пропускной способностью и имеют возможность решать узкий класс задач, поскольку ограничены оперированием только с действительными неотрицательными функциями. Когерентная оптика обеспечивает возможность обработки комплексных функций с высокой производительностью, однако при этом возникает проблема когерентных шумов. Кроме того в обоих случаях предъявляются довольно высокие требования к качеству и точности юстировки оптических элементов. Особый интерес представляют оптические системы, работающие в частично когерентном свете, поскольку сочетают высокую пропускную способность с низким требованием к точности юстировки оптических элементов.
С точки зрения компромисса между достоверностью распознавания, временем обработки и другими характеристиками, значительное внимание
в исследовательских работах уделяется высокопроизводительным процессорам на основе аналоговых оптических корреляторов. Предложены различные алгоритмы распознавания изображений на базе корреляционного анализа для решения ряда прикладных задач. Разработано большое количество оптических корреляторов, использующих как когерентные или некогерентные, так и частично когерентные источники света.
Однако при уменьшении размерности изображений распознаваемых объектов до указанных выше значений корреляционные методы, основанные на использовании только величины пиков авто- и кросскорреляцион-ных функций, становятся недостаточно эффективны с точки зрения достоверности. Поэтому актуальным является повышение эффективности распознавания малоразмерных изображений за счет проведения дополнительной цифровой обработки корреляционных функций.
Целью работы является разработка и исследование оптико-электронных корреляционных систем распознавания малоразмерных изображений с повышенными дискриминантными свойствами и инвариантностью к различным искажениям входной информации за счет дополнительного применения структурного анализа и использования принципов нейронных сетей.
Для достижения указанной цели необходимо решить следующие задачи:
1. Разработать и исследовать оптико-электронные методы распознавания изображений с обработкой корреляционных функций на основе применения структурного анализа и использования элементов нейронных сетей.
2. Исследовать базовые оптические элементы для реализации разработанных методов - голографические корреляционные системы, использующие квазимонохроматические источники света с различной степенью монохроматичности.
.1. Исследовать эффективность устройств оперативного ввода распознаваемых и эталонных изображений в ОЭС, работающие в частично ког ерентном свете.
4. Разработать и создать оптико-электронные системы распознавания изображении для решения конкретных прикладных задач.
Научная новизна
- разработан параллельно-последовательный метод распознавания изображений, сочетающий элементы корреляционного и структурного анализа. Показано, что по сравнению с методом, основанным на вычислении двумерной корреляционной функции, предложенный обеспечивает повышение дискриминантных свойств и устойчивости к шумам распознаваемых изображений. Получено улучшение отношения авто- и кросскор-реляционных отсчетов до 1,7 раз;
- предложен параллельный оптнко-элекфонный метод распознавания изображении на основе обработки корреляционных функций с использованием элементов нейронных сетей, обеспечивающий повышение дискриминантных свойств корреляционных систем и вместе с тем инвариантность к условиям освещения распознаваемых объектов и в значительной степени к ракурсным преобразованиям. Получена инвариантность к ракурсным преобразованиям для изображений объектов размерности «20x20 элементов в пределах +24° для угла места 6°, тогда как для аналогичных
изображений по результатам корреляционной обработки эта величина не превышала ±10°;
- получено аналитическое выражение для числа элементов разрешения в выходной плоскости голографических корреляционных систем, использующих квазимонохроматические источники излучения. Показано, что пропускная способность имеет максимум как функция частоты голо-графического фильтра и обладает обратноквадратичной зависимостью от ширины линии излучения. Впервые теоретически и экспериментально показана возможность оперативного изменения в пределах до трех раз взаимных масштабов коррелируемых изображений в голографических системах, использующих квазимонохроматические источники излучения;
- предложен способ пьезоэлектрического проявления скрытого изображения, обеспечивающий увеличение числа циклов перезаписи до 104, при этом время записи определяется временем реакции пьезоэлектрического кристалла;
- разработаны метод интерактивной предварительной обработки изображений и оптико-электронная система на основе применения матрицы светодиодных излучателей, обеспечивающая предварительную обработку в темпе ввода изображений в коррелятор. Выигрыш по производительности в такой системе возрастает с увеличением размера ядра, который может достигать 20x20 элементов для размера обрабатываемого изображения 512x512 элементов, что при работе в телевизионном темпе обес-
9
печивает производительность ~2,5*10 . Это позволяет не только выполнять предобработку малоразмерными оконтуривающими операторами, но и проводить текстурный анализ или устранение искажений типа смаза, дефокусировки и т.п. методами десвертки.
Практическое значение диссертации.
- разработано и создано устройство регистрации голограмм на фототермопластических носителях для оперативного ввода обрабатываемых изображений в оптические системы;
- разработаны и созданы экспериментальные образцы оптико-электронных корреляционных систем с эквивалентной производитель-
9 10
ностыо 3,5х 10 -г 5,2х 10 операций/сек,, обеспечившие решение задачи опознавания и координатной привязки малоразмерных (~20х20 элементов) изображений объектов.
В н едрен и е полученных результат о в.
- результаты теоретических и экспериментальных исследований го-лографических корреляционных систем, работающих в квазимонохроматическом свете с различной степенью монохроматичности, использованы при создании оптико-электронных систем, внедренных в Сибирском НИИ оптических систем (г. Новосибирск), МГТУ им. Н. Э. Баумана (г. Москва);
- результаты исследований фототермопластических регистрирующих сред вошли в следующие отчеты по научно-исследовательским работам "Процессор", № гос. per. Е28828; "Икар", НГУ, Новосибирск, инв №506; "Оврпдика", № гос. per. E26I87.
Основные положения, выносимые на защиту.
- сочетание корреляционного и структурного анализов повышает дискриминантные свойства и устойчивость к шумам распознаваемых изображений, а обработка корреляционных функций с использованием элементов нейронных сетей дополнительно обеспечивает инвариантность к условиям освещения распознаваемых объектов и в значительной степени к ракурсным преобразованиям;
- в голографических системах с квазимонохроматическими источниками излучения существует возможность оперативного изменения взаимных масштабов коррелируемых изображений, а пропускная способность таких систем имеет максимум как функция частоты голографического фильтра и обладает обратноквадратичной зависимостью от ширины линии излучения;
- пьезоэлектрический способ проявления скрытого изображения обеспечивает увеличение числа циклов перезаписи до 104, при этом время записи определяется временем реакции пьезоэлектрического кристалла;
- созданные на основе проведенных исследований экспериментальные образцы оптико-электронных систем при обработке корреляционных функций предложенными методами обеспечивают решение задачи опознавания и координатной привязки малоразмерных объектов с инвариантностью к условиям освещения объектов и в значительной степени к ракурсным преобразованиям.
Апробация работы.
Результаты диссертации докладывались на следующих конференциях и семинарах: V Всесоюзная конференция по голографии, Рига, 1985; I Всесоюзная конференция по оптической обработке информации, Ленинград, 1988; Международная конференция "Optical Memory & Neural Networks", Москва, 1994; II Всероссийская с участием стран СНГ конференция "Распознавание образов и анализ изображений: новые информационные технологии", Ульяновск, 1995; the SPIE's International Symposium on Optical, Engineering, and Instrumentation, USA, Denver, 1996; the Second international conference on optical information processing, St.Petersburg, 1996; III Всероссийская конференция "Нейрокомпьютеры и их применение",
Москва, 1997; V Всероссийский семинар "Нейроинформатика и ее приложения", Красноярск, 1997. Публикации.
Материалы диссертации опубликованы в 23 работах, получено 2 авторских свидетельства на изобретения. Структура и объем диссертации.
Диссертация состоит из введения, трех глав, заключения, списка цитируемой литературы (18 наименований), изложена на 143 страницах, включает 53 рисунка и 13 таблиц.
СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность темы исследовании, сформулированы цель и задачи работы, приведены основные результаты, выносимые на защиту, и структура диссертации,
В первой главе предложены два новых метода распознавания изображений и приведены результаты численного моделирования их работы
Первый метод предназначен для распознавания изображений, поступающих в виде последовательности строк. Предлагается проводить обработку в два этапа. На первом этапе оптическими средствами вычисляется функция корреляции каждой строки входного изображения с двумерным массивом, содержащим эталоны, а па втором этапе проводится дополнительная обработка полученных плоскостей признаков локальными и нелинейными операторами.
В качестве входных изображений при моделировании были использованы изображения реальных объектов трех классов, полученные в условиях различной освещенности. Вычислялись функции корреляции после- 9 -
довательности строк входного изображения с обобщенными эталонами всех трех классов. Проводилось как простое суммирование плоскостей признаков, так и их обработка локальными и пороговыми операторами. Показано, что в результате применения обработки плоскостей признаков произошло увеличение отношения авто- и кросскорреляционных отсчетов в 1,5 - 1,7 раз.
Второй метод ориентирован на распознавание изображений, вводимых в виде двумерных массивов. Предлагается совместная обработка в итерационном процессе исходной корреляционной #„(г) и модифицированной (г) систем признаков, где г - двумерные пространственные координаты, сопряженные с координатами входного поля наблюдения, п -номер итерации, ¿5, (г) - результат обработки функции gn(r) с помощью локальных дифференциальных операторов. Такой нейроподобный подход обеспечивает одновременно учет значений корреляционных функций распознаваемых (РИ) и эталонных (ЭИ) изображений и их высокочастотных составляющих. При этом на каждой итерации пространство признаков является двумерным - {('"),&('')}, а область, соответствующая определенному классу РИ, формируется в процессе обучения нейронной сети.
В качестве одной из эффективных процедур предложена итерационная обработка вида
Я„+|(г)=а„Ы'')-А.£„(/■)] £„ (/•), (1)
где а„ и Р„ - регулируемые на данной итерации коэффициенты. Процесс ^бучения сводится к определению оптимальной последовательности коэффициентов {а„,(Зп\. Конкретные значения коэффициентов а„ и р„ определяют область в пространстве {#„,#„}, где происходит усиление т.е.
Ее граница находится из соотношения „)#„=#„ и имеет
вид
£„= а,л Хп7 К'«» -1) (2)
Соответственно в остальной области пространства признаков происходит
подавление
Рис I
Вид функции £„(}!„) представлен на рис. 1. Прямые Цп~\1а„ и ХгГрпХп являются асимптотами этой функции, а ее минимум располагается в точке (2/а„,4(]п/ап). С увеличением а„ функция (2) приближается к асимптотам, а ее минимум - к началу координат вдоль прямой .
Блок-схема оптико-электронной системы, реализующей предложенный метод, приведена на рис. 2. Она состоит из двух слоев. В первом осуществляется корреляционная обработка для определения исходной си- 11 -
стемы признаков, а во втором, с элементами нейронной сети, многократно выполняется итерационная процедура (1) с коэффициентами, полученными в результате обучения. В качестве первого слоя, где процесс обработки ведется со скоростью поступления входной информации, целесообразно использовать высокопроизводительные оптико-электронные корреляторы на принципах дифракционной оптики в частично-когерентном свете. Второй же слой, где выполняются локальная дифференциальная и поточечная нелинейная обработка, более адекватно реализуется цифровыми электронными средствами.
Рис. 2.
Исследование эффективности предложенного адаптивного метода распознавания проведено путем цифрового моделирования, включая процедуру обучения (определение последовательности коэффициентов а„, /?„), в режиме обработки малоразмерных изображений реальных объектов трех классов. При этом РИ вводились в компьютер сканирующей камерой на базе фотодиодной линейки при различных условиях освещения, а для одного класса также при различных ракурсах и для частично затененных объ-
ектов. Угол места был выбран «6°, а дискретность изменения азимутального угла «12°. Количество элементов разрешения на один объект составляло «20x20 элементов.
Для формирования ЭИ использовались четыре изображения каждого класса, зарегистрированные при различных условиях освещения. Как РИ, так п ЭИ окоптуривались модифицированным оператором Гобела с последующей бинаризацией.
Первоначально определялась корреляционная мера близости РИ всех классов с каждым из трех ЭИ. Этого оказалось достаточным, чтобы распознать изображения первого класса. Однако ни исходная, ни модифицированная системы признаков по отдельности не позволили однозначно распознать все РИ даже одного ракурса и без затенения. В результате обработки предложенным методом получена инвариантность к условиям освещения объектов, ракурсным преобразованиям в пределах ±24° по азимуту (тогда как по результатам корреляционной обработки угол не превышал ±12°), а также обеспечено уверенное распознавание при затененности до половины объекта.
При вводе изображений в виде последовательности строк данный метод может использоваться совместно с предыдущим для дальнейшего увеличения его дискримпнантных свойств.
Во второй главе представлены результаты исследования голографи-ческих корреляторов, использующих квазимонохроматическое излучение.
Показано, что в голографических корреляторах с квазимонохроматическим излучением существует возможность оперативного изменения до трех раз взаимных масштабов изображений за счет смещения обрабатываемого изображения и голографического фильтра соответственно из не-
редней и задней фокальных плоскостей объектива Фурье. Изменение масштабного коэффициента обрабатываемого изображения определяется из выражения m(/,t/)= где lud - смещения обрабатываемого изображения и голографического фильтра соответственно из передней и задней фокальных плоскостей объектива преобразования Фурье, а/- его фокусное расстояние. Проведена экспериментальная проверка полученного результата. Точность согласования масштабов составила 1 - 1,5%.
Показано, что пропускная способность голографических корреляционных систем, использующих квазимонохроматические источники излучения, обладает обратноквадратичной зависимостью от ширины линии излучения и имеет максимум как функция частоты голографического фильтра при оптимальной пространственной частоте
V» =((А vxfn/(a vxf'+2m))mIX. Здесь Л - длина волны излучения, а vx определяется выражением:
\>х =(Дг+Д1<1т)! ¿/ДЛ+2,44Л/ДЛД где Ах - ширина вертикальной линий во входной плоскости ГКИ; АF - ширина соответствующей линии ЭИ; т - масштабный коэффициент коррелятора; d - расстояние от источника излучения до голографического фильтра; ДЯ - ширина полосы излучения источника; 1) - диаметр голографического фильтра.
Максимальное число элементов разрешения в выходной плоскости по горизонтальной и вертикальной координатам составляет, соответственно:
Nxm = 2snA/AÄ( 3(Яис)М +2М), Nym = \,2Ы/Ш(Хух)т .
Для конкретных параметров коррелятора с квазимонохроматической ЭЛТ при АД=2,7нм получено максимальное число отсчетов в выходной плоскости системы 222*600 для квадратной области задания ОИ.
В третьей главе приведены результаты исследований фототермопласт ическпх регистрирующих сред для оперативной смены топографических фильтров, представлен разработанный метод и оптико-электронная система для оперативной интерактивной предварительной обработки изображений и рассмотрены экспериментальные образцы высокопроизводительных оптико-электронных корреляционных систем для опознавания и координатной привязки малоразмерных целей.
Проведены исследования различных режимов регистрации гологра-фических фильтров на фототермопластических средах, определен режим, обеспечивающий максимальную дифракционную эффективность. Показано, что передаточные характеристики фототермопластическпх сред зависят от температуры их проявления и могут быть оптимизированы под конкретные требования решаемой задачи, что позволяет значительно более эффективно использовать информационную емкость материала. Отношение сигнал/шум при регистрации голографичсских фильтров составляло приблизительно 100. Предложен способ регистрации информации на термопластических средах с пьезоэлектрическим проявлением, при котором более чем на два порядка увеличивается число циклов перезаписи информации.
Показано, что при вводе изображений с фотоснимков через телевизионный канал появляется возможность совмещения операций ввода и предобработки. Для этого предложено заменить систему проецирования фотоснимка оптическим коррелятором с управляемой от ЭВМ светодпод-
ной матрицей. Такая система может использоваться как составная часть ОЭС, а также иметь самостоятельное значение при работе в интерактивном режиме. Созданный экспериментальный образец такой системы состоял из трех подсистем: оптический коррелятор, блок управления коррелятором, видеопроцессор. При экспериментальных исследованиях системы осуществлялась обработка тестовых изображений и реальных изображений местности с помощью линейных и нелинейных операторов.
На основе проведенных исследований были созданы экспериментальные образцы оптико-электронных корреляционных систем, состоящие из голографического коррелятора с квазимонохроматической ЭЛТ и сопряженного с ним по входу и выходу управляемого от ЭВМ универсального видеопроцессора. При реализации процесса распознавания в качестве РИ использовались изображения реальных объектов, снятых с углом места 6° и произвольной ориентацией. Согласование масштабов РИ и ЭИ обеспечивалось за счет перемещения голографических фильтров вдоль оптической оси. Достигнутая точность определения координат изображений составила один элемент разрешения ТВ-камеры в направлении, параллельном голографической решетке, и три элемента по перпендикулярной ей координате.
В заключении сформулированы основные результаты диссертации:
1. Разработан параллельно-последовательный метод распознавания изображений, сочетающий элементы корреляционного и структурного анализа. Путем моделирования на изображениях реальных объектов, в том числе зашумленных, показано, что по сравнению с методом, основанным на вычислении двумерной корреляционной функции, предложенный обеспечивает повышение дискриминантных свойств и устойчивости к шумам
распознаваемых изображений. Получено улучшение отношения авто- и кросскорреляционных отсчетов до 1,7 раз.
2. Предложен параллельный оптико-электронный метод распознавания изображений на основе обработки корреляционных функций с использованием элементов нейронных сетей, обеспечивающий повышение дпскриминантных свойств корреляционных систем и вместе с тем инвариантность к условиям освещения распознаваемых объектов и, в значительной степени, к ракурсным преобразованиям. Получена инвариантность к ракурсным преобразованиям для изображений объектов размерности ~20*20 элементов в пределах ±24° для угла места 6°.
3. Впервые теоретически и экспериментально показана возможность оперативного изменения в пределах до трех раз взаимных масштабов коррелируемых изображений в голографических системах с пространственно некогерентными источниками излучения.
4. Теоретически и экспериментально исследовано влияние параметров оптической системы с квазимонохроматической ЭЛТ на пропускную способность голографического коррелятора Показано, что число элементов разрешения в выходной плоскости такой системы имеет максимум как функция частоты голографического фильтра и обладает обратноквад-ратичной зависимостью от ширины линии излучения. Для ширины линии 2,7нм число элементов разрешения однолинзового коррелятора составляет - 105. Для реальных задач и реальных параметров голографического коррелятора с квазимонохроматической ЭЛТ без специальных схемотехнических ухищрений несложно обеспечить обработку параллельно по 12 - 18 каналам, чего в большинстве случаев достаточно для обработки, инвари-
антной к ракурсным преобразованиям малоразмерных (не более 32x32 элемента) изображений.
5. Исследованы различные режимы регистрации информации на фототермопластических носителях для оперативного ввода коррелируемых изображений, определены оптимальные с точки зрения информационной емкости и дифракционной эффективности параметры (временная диаграмма зарядки, экспонирования и проявления, напряжение коронатора, экспозиция и температура проявления). Показано, что передаточные характеристики голографических фильтров зависят от температуры проявления фототермопластических регистрирующих сред и могут быть оптимизированы под конкретную решаемую задачу. Разработано и создано устройство для регистрации голографических фильтров на фототермопластических носителях. Предложен способ пьезоэлектрического проявления скрытого изображения, обеспечивающий увеличение числа циклов перезаписи до 104.
6. Разработан метод интерактивной предварительной обработки изображений и оптико-электронная система на основе применения управляемой от ЭВМ матрицы светодиодных излучателей, обеспечивающая предварительную обработку в темпе ввода изображений в коррелятор. Экспериментально определена эффективность традиционных и оригинальных локальных операторов высокочастотной фильтрации изображений. Выигрыш по производительности в такой системе возрастает с увеличением размера ядра, который может достигать 20x20 элементов для размера обрабатываемого изображения 512x512 элементов, что при работе в теле-
9
визионном темпе обеспечивает производительность ~2,5*10 . Это позволяет не только выполнять предобработку малоразмерными оконтури-
вающими операторами, но и проводить текстурный анализ или устранение искажений типа смаза, дефокусировки и т.п. методами десвертки.
7. На базе проведенных исследований созданы экспериментальные образцы оптико-электронных корреляционных систем обеспечившие опознавание и координатную привязку малоразмерных (~20*20 элементов) изображений объектов с инвариантностью к ракурсным преобразованиям при изменении угла наблюдения в диапазоне ±7,5 -ь ±15° в зависимости от ориентации объекта для угла места 6°. Размерность входного поля составила 222x600 элементов, размерность поля эталонов - 32x200 элементов,
9
эквивалентная производительность ~2,5х|0 операций/сек
ЛИТЕРАТУРА
1. Козик В.И, Литвинцев В.И., Нежевенко Е.С., Хоцкин В.И. Оптико-электронный процессор для распознавания изображений // Кн.: Оптическая обработка информации. Л.: ЛИЯФ, 1979, стр. 48-54.
2. Гофман М А., Козик В.И , Потагуркин О.П., Фельдбуш В.И. Распознавание изображений в гибридной оптико-электронной системе с оперативным вводом И Кн.: Оптико-электронные методы обработки изображений. Л : Паука, 1982, стр. 56-70.
3. Гофман М.А., Козик В.П., Потатуркин О.И., Фельдбуш В.И. Оптико-электронная система для распознавания изображений с голографиче-ским фильтром на фототермопласте Н Сб трудов lV-й Всесоюзной конференции но голографии, Ереван: В11ИИРИ, 1982, т.2, стр. 169-173.
4. A.C. СССР N1101893. Способ записи изображений на пластический носитель / В.И Козик, В И Спектор, О П Спиридонов, В.Ф Трухин, В И Фельдбуш - Заявл 29.03.83; Опубл. 1984, Kkwi.N25
5. Козик В.И., Нежевенко Е С., Попов Ю.А., Потатуркин О.И., Сутя-гин В.Г. Обработка изображений с использованием видеопроцессора и светодиодного коррелятора// Автомеггрия, 1985, N3, стр. 53-58.
6. Козик В Н., Опарин А.Н., Потатуркин О.И. Многоканальный оптико-электронный процессор с обработкой корреляционной функции // Автометрия, 1985, N6, стр. 80-84.
7. Козик В.И., Опарин А.Н., Потатуркин О.И. Оперативное распознавание изображений в многоканальной оптико-электронной системе // Тез. докл. V-й Всесоюз. конф. по голографии, Рига: ИФ Латв. ССР, 1985, стр. 71.
8. Козик В.И., Потатуркин О.И. Изменение масштаба пространственных спектров при сдвиге голографического фильтра в линейных по интенсивности корреляторах изображений // Тез. докл. V-й Всесоюз. конф. по голографии, Рига: ИФ Латв. ССР, 1985, стр. 72.
9. Козик В.И., Потатуркин О.И. Исследование влияния продольных сдвигов голографического фильтра на взаимный масштаб коррелируемых изображений // Автометрия, 1987, N2, стр. 3-8.
10. А С. СССР N250635. / В.И. Козик, Е.И. Коржов, А Н. Опарин и др. - Заявл.4.04.86; Опубл. 1987.
11. Козик В.И., Опарин А Н. Исследование характеристик голографического коррелятора с квазимонохроматической ЭЛТ // Тез. докл. 1-й Всесоюз. конф. по оптической обработке информации, Л: ЛИАП, 1988, ч.1, стр. 93.
12. Козик В.И., Никулин В.И., Опарин А Н., Потатуркин О.И. Распознавание реальных изображений в голографическом корреляторе, сопря-
женном с видеопроцессором // Тез. докл. 1-й Всесоюз. конф. по оптической обработке информации, Л.: ЛИАП, 1988, ч. 1, стр. 94.
13. Козик В.И., Опарин АН., Потатуркин О.И. Исследование характеристик голографического коррелятора, сопряженного с видеопроцессором//Автометрия, 1988, N6, стр 99-107.
14. Козик В.И., Никулин В.И., Опарин А Н., Потатуркин О.И Пропускная способность голографического коррелятора с кпазимонохромати-ческой ОЛТ // Кн.: Оптические процессоры для обработки изображений и сигналов, Ленинград, 1989, стр. 32-39.
15. Козик В.И., Лаврухова Е I I., Михляев С В., Потатуркин О.И. Параллельно-последовательный алгоритм распознавания детерминированных изображений // ОМП, 1991, N4, стр. 79-84.
16. Kozik V.I., and Potaturkin О.I. Image recognition by means of two-layered holographic neural network // Optica! Neural Networks. Proc. of SPIE, 1994, v. 2430, pp. 27-33.
17. Kozik V.l, and Potaturkin О 1 Neural Networks with Postprocessing of correlation functions // Optical Memory and Neural Networks, 1995, v. 4, N4, pp. 341-348.
18 Борзов С М., Козик В.П., Потатуркин О.И Распознавание образов в нейронных сетях с апостериорной обработкой корреляционных функций // Тез. докл. 2-й Всеросс. конф. "Распознавание образов и анализ изображений: новые информационные технологии", УлГТУ, Ульяновск, 1995г., ч.1, стр. 39-41.
19. Борзов С М., Козик В.И., Потатуркин О.И. Адаптивный метод распознавания малоразмерных изображений с итерационной обработкой корреляционных функций// Автометрия, 1996, N1, стр. 12-21.
20. Potaturkin О.!., and Kozik V.I. Two-Layered Holographic Neural Network // Integrated Computer-Aided Engineering, 1996, v. 3, № 2, pp. 15-23.
21. Borzov S. M., Kozik V. 1., and Potaturkin О. I. Optical-electronic adaptive pattern recognition systems with neural network elements // Adaptive Computing: Mathematical and Physical Methods for Complex Environments. Proc. SP1E, 1996, v. 2824, pp. 56-64.
22. Borzov S. M., Kozik V. I., and Potaturkin О. 1. Neural networks with a posteriori processing of correlation functions II Pattern Recognition and Image Analysis, 1996, v. 6, N1, pp. 29-31.
23. Potaturkin О. I., Borzov S. M., and Kozik V. 1. Parallel-consecutive pattern recognition method based on a combination of optical correlation and digital structural analysis // The Second International Conference on Optical Information Processing. Proc. SP1E, 1996, v. 2969, pp. 626-629.
24. Козик В.И., Потатуркин О.И. Двухслойная голографическая нейронная сеть // Тезисы докладов III Всероссийской конференции "Нейрокомпьютеры и их применение", М„ МОП РФ, 1997г, стр. 7.
25. Борзов С М., Козик В.И., Потатуркин О.И. Оптико-электронная нейросетевая система распознавания малоразмерных изображений // Тез. докл. V Всеросс. семинара "Нейроинформатика и ее приложения", КГТУ, Красноярск, 1997г., стр. 23.
РОССИЙСКАЯ АКАДЕМИЯ НАУК
СИБИРСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТ АВТОМАТИКИ И ЭЛЕКТРОМЕТРИИ
На правах рукописи
Козик Виктор Иванович
РАЗРАБОТКА И ИССЛЕДОВАНИЕ ОПТИКО-ЭЛЕКТРОННЫХ КОРРЕЛЯЦИОННЫХ СИСТЕМ С ИСПОЛЬЗОВАНИЕМ ЭЛЕМЕНТОВ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ
01.04. 05-" Оптика"
Диссертация на соискание ученой степени кандидата технических наук
Научный руководитель: доктор технических наук, Потатуркин О. И.
Новосибирск - 1997
СОДЕРЖАНИЕ
стр.
ОГЛАВЛЕНИЕ.................................................................................................................. 2
ВВЕДЕНИЕ....................................................................................................................... 4
ГЛАВА 1. МЕТОДЫ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ...................................... 11
1.1. Параллельно-последовательный метод распознавания на основе корреляционного и структурного анализа.............................................. 11
1.2. Результаты численного моделирования................................................. 14
1.3. Применение моделей нейронных сетей в оптико-электронных системах с апостериорной обработкой корреляционных функций......... 27
1.4. Результаты численного моделирования................................................. 41
1.5. Выводы...................................................................................................... 51
ГЛАВА 2. ИССЛЕДОВАНИЕ ГОЛОГРАФИЧЕСКИХ КОРРЕЛЯЦИОННЫХ
СИСТЕМ В ЧАСТИЧНО КОГЕРЕНТНОМ СВЕТЕ.................................. 52
2.1. Влияние продольных сдвигов элементов коррелятора на взаимный масштаб обрабатываемых изображений................................................ 57
2.2. Исследование влияния параметров элементов голографического коррелятора на его характеристики........................................................ 66
2.3. Выводы....................................................................................................... 81
ГЛАВА 3. ОПЕРАТИВНАЯ РЕГИСТРАЦИЯ, ПРЕДВАРИТЕЛЬНАЯ
ОБРАБОТКА И РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ В ОПТИКО-
ЭЛЕКТРОННЫХ КОРРЕЛЯЦИОННЫХ СИСТЕМАХ............................. 84
3.1. Предварительная обработка входных изображений с использованием светодиодной матрицы....................................................................... 84
3.2. Оперативная регистрация эталонных изображений на фототермо-
пластических носителях......................................................................................................................................................100
3.3. Распознавание изображений в голографических корреляционных системах..........................................................................................................................................................................................................111
3.4. Выводы..............................................................................................................................................................................................................129
ЗАКЛЮЧЕНИЕ..................................................................................................................................................................................................................................131
Литература..................................................................................................................................................................................................................................................133
ВВЕДЕНИЕ
Задача распознавания малоразмерных изображений - порядка 16x16 - 32x32 элемента является актуальной при решении проблем опознавания и координатной привязки удаленных целей, обработки аэрофотоснимков и т.п. К настоящему времени в общем виде она не решена, хотя в конкретных прикладных задачах может быть использован ряд известных параметрических и непараметрических алгоритмов [1,2]. Ввиду необходимости обработки больших массивов данных в реальном времени эти задачи не всегда могут быть решены с использованием электронных средств, и в данном случае может быть более эффективным применение параллельных [3,4] или параллельно-последовательных [5] оптических методов, реализуемых средствами когерентной или некогерентной оптики. Некогерентные оптические системы [6,7] характеризуются большей помехоустойчивостью, однако обладают более низкой пропускной способностью и имеют возможность решать узкий класс задач, поскольку ограничены оперированием только с действительными неотрицательными функциями. Когерентная оптика обеспечивает возможность обработки комплексных функций с высокой производительностью, однако при этом возникает проблема когерентных шумов. Кроме того в обоих случаях предъявляются довольно высокие требования к качеству и точности юстировки оптических элементов. Особый интерес представляют оптические системы, работающие в частично когерентном свете, поскольку сочетают высокую пропускную способность с низким требованием к точности юстировки оптических элементов.
С точки зрения компромисса между достоверностью распознавания, временем обработки и другими характеристиками, значительное внимание в исследовательских работах уделяется высокопроизводительным процессорам на основе аналоговых оптических
корреляторов. Разработано большое количество оптических корреляторов, использующих как когерентные [8,9] или некогерентные [10,11], так и частично когерентные [12,13] источники света.
Однако при уменьшении размерности изображений распознаваемых объектов до указанных выше значений корреляционные методы, основанные на использовании только величины пиков авто- и кросскорреляционных функций, становятся недостаточно эффективны с точки зрения достоверности. Повышение эффективности распознавания может быть обеспечено за счет проведения дополнительной цифровой обработки корреляционных функций [14,15].
Поэтому актуальным является разработка и исследование оптико-электронных корреляционных систем распознавания малоразмерных изображений с повышенными дискриминантными свойствами и инвариантностью к различным искажениям входной информации за счет дополнительного применения структурного анализа и использования принципов нейронных сетей.
Для реализации указанной цели необходимо решить следующие задачи:
1. Разработка и исследование оптико-электронных методов распознавания изображений, с обработкой корреляционных функций на основе применения структурного анализа и использования элементов нейронных сетей.
2. Исследование базовых оптических элементов для реализации разработанных методов - голографических корреляционных систем, использующих квазимонохроматические источники света с различной степенью монохроматичности.
3. Исследование эффективности устройств оперативного ввода распознаваемых и эталонных изображений в ОЭС, работающие в частично когерентном свете.
4. Разработка и создание оптико-электронных систем распознавания изображений, включая предварительную обработку, для решения конкретных прикладных задач.
Работа состоит из трех глав, введения, заключения и списка литературы.
В первой главе предложены два новых метода распознавания изображений и приведены результаты численного моделирования их работы.
Первый метод предназначен для распознавания изображений, поступающих в виде последовательности строк. Предлагается проводить обработку в два этапа. На первом этапе оптическими средствами вычисляется функция корреляции каждой строки входного изображения с двумерным массивом, содержащим эталоны, а на втором этапе проводится дополнительная обработка полученных плоскостей признаков локальными и пороговыми операторами. Показано, что в результате применения обработки плоскостей признаков произошло увеличение отношения авто- и кросскорреляционных отсчетов в 1,5 - 1,7 раз.
Второй метод ориентирован на распознавание изображений, вводимых в виде двумерных массивов. Предлагаемый метод основан на совместном преобразовании корреляционной функции и результата ее обработки локальными операторами в итерационном процессе с использованием элементов нейронных сетей.
Сначала проводится обучение системы по некоторой представительной выборке распознаваемых изображений. При распознавании в первом слое проводится вычисление функции корреляции с набором эталонов параллельными оптическими средствами. После этого во втором слое осуществляется обработка корреляционной функции локальными операторами и совместная поточечная обработка двух полученных функций. С выхода на вход второго слоя введена обратная связь. Данный метод использует такие элементы нейронных сетей, как обучение системы, наличие обратной связи, глобальных связей в первом слое и локальных во втором.
Определенный в процессе обучения набор коэффициентов использовался при распознавании изображений, полученных в условиях различной освещенности и при изменении ракурсов. Показано, что предложенный метод распознавания изображений обеспечивает повышение дискриминанты ых свойств корреляционных систем и вместе с тем инвариантность к условиям освещения распознаваемых объектов и в значительной степени к ракурсным преобразованиям.. Получена инвариантность к ракурсным преобразованиям для изображений объектов размерности ~20х20 элементов в пределах ±24° для угла места 6°, тогда как для аналогичных изображений по результатам корреляционной обработки эта величина не превышала ±10°.
При вводе изображений в виде последовательности строк данный метод может использоваться совместно с предыдущим для дальнейшего увеличения его дискрнминантных свойств.
Во второй главе представлены результаты исследования топографических корреляторов, использующих квазимонохроматическое излучение.
Показано, что в голографических корреляторах с квазимонохроматическим излучением существует возможность оперативного изменения до трех раз взаимных масштабов изображений за счет смещения обрабатываемого изображения и голографического фильтра соответственно из передней и задней фокальных плоскостей объектива Фурье. Точность согласования масштабов составила 1 -ь 1,5%.
Получено аналитическое выражение для числа элементов разрешения в выходной плоскости голографических корреляционных систем, использующих
квазимонохроматические источники излучения. Показано, что пропускная способность имеет максимум как функция частоты голографического фильтра и обладает обратноквадратичной зависимостью от ширины линии излучения.
В третьей главе приведены результаты исследований фототермопластических регистрирующих сред для оперативной смены голографических фильтров, представлен разработанный метод и оптико-электронная система для оперативной интерактивной предварительной обработки изображений и рассмотрены экспериментальные образцы высокопроизводительных оптико-электронных корреляционных систем для опознавания и координатной привязки малоразмерных целей.
Проведены исследования различных режимов регистрации голографических фильтров на фототермопластических средах, определен режим, обеспечивающий максимальную дифракционную эффективность. Показано, что передаточные характеристики фототермопластических сред зависят от температуры их проявления и могут быть оптимизированы под конкретные требования решаемой задачи, что позволяет значительно более эффективно использовать информационную емкость материала. Отношение сигнал/шум при регистрации голографических фильтров составляло приблизительно 100. Предложен способ регистрации информации на термопластических средах с пьезоэлектрическим проявлением, при котором более чем на два порядка увеличивается число циклов перезаписи информации.
Показано, что при вводе изображений с фотоснимков через телевизионный канал появляется возможность совмещения операций ввода и предобработки. Для этого предложено заменить систему проецирования фотоснимка оптическим коррелятором с управляемой от ЭВМ светодиодной матрицей. Такая система может использоваться как составная часть ОЭС, а также иметь самостоятельное значение при работе в интерактивном режиме. Созданный экспериментальный образец такой системы состоял из трех подсистем: оптический коррелятор, блок управления коррелятором, видеопроцессор. При экспериментальных исследованиях системы осуществлялась обработка тестовых
изображений и реальных изображений местности с помощью линейных и нелинейных операторов.
На основе проведенных исследований были созданы экспериментальные образцы оптико-электронных корреляционных систем, состоящие из голограф и ч еского коррелятора с квазимонохроматической ЭЛТ и сопряженного с ним по входу и выходу управляемого от ЭВМ универсального видеопроцессора. При реализации процесса распознавания в качестве РИ использовались изображения реальных объектов, снятых с углом места 6° и произвольной ориентацией. Согласование масштабов РИ и ЭИ обеспечивалось за счет перемещения голографических фильтров вдоль оптической оси. Размерность входного поля
составила 222x600 элементов, размерность поля эталонов - 32*600 элементов, эквивалентная
10
производительность - ~10 операций/сек. Созданные образцы обеспечили опознавание и координатную привязку малоразмерных (-20x20 элементов) объектов с инвариантностью к ракурсным преобразованиям при изменении угла наблюдения в диапазоне ±7,5 + ±15° в зависимости от ориентации объекта. Достигнутая точность определения координат изображений составила один элемент разрешения ТВ-камеры в направлении, параллельном голографи ческой решетке, и три элемента по перпендикулярной ей координате.
На защиту выносятся следующие положения:
Сочетание корреляционного и структурного анализов повышает дискриминантные свойства и устойчивость к шумам распознаваемых изображений, а обработка корреляционных функций с использованием элементов нейронных сетей дополнительно обеспечивает инвариантность к условиям освещения распознаваемых объектов и в значительной степени к ракурсным преобразованиям.
- в голографических системах с квазимонохроматическими источниками излучения существует возможность оперативного изменения взаимных масштабов коррелируемых
изображений, а пропускная способность таких систем имеет максимум как функция частоты голографического фильтра и обладает обратноквадратичной зависимостью от ширины линии излучения;
- пьезоэлектрический способ проявления скрытого изображения обеспечивает увеличение числа циклов перезаписи до 104, при этом время записи определяется временем реакции пьезоэлектрического кристалла;
- созданные на основе проведенных исследований экспериментальные образцы оптико-электронных систем при обработке корреляционных функций предложенными методами обеспечивают решение задачи опознавания и координатной привязки малоразмерных объектов с инвариантностью к условиям освещения объектов и в значительной степени к ракурсным преобразованиям.
ГЛАВА I. МЕТОДЫ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ [ 16-26]
Вычисление функции корреляции как базовой операции используется во многих системах, построенных на принципах нейронных сетей. Эти системы работают по аналогии с традиционными корреляторами, выполняющими сравнение входного изображения с эталонами памяти. От обычных корреляторов они отличаются тем, что в результате обработки вместо вычисления функции корреляции между входным изображением и эталонами памяти производится считывание из памяти полного входного или сопряженного с ним изображения в ответ на неполное или зашумленное. Как и в случае пространственно неинвариантных систем, основанных на вычислении векторного или скалярного произведения векторов [27-29], они в основном строятся с использованием одной [30-33] или двух [33-36] ассоциативных матриц. При этом процесс может быть как много итерационным с введением обратной связи, пороговой или другой нелинейной обработки [30,32,33,35], так и проводиться за одну итерацию [31,33,34,36].
1.1. Параллельно-последовательный метод распознавания на основе корреляционного и структурного анализа.
В большинстве практических задач изображение поступает на вход системы распознавания в параллельно-последовательном виде, т.е. строки поступают последовательно между собой, а каждая из них - параллельно (например, ТВ-сигнал, сигналы со сканирующих линеек, при считывании данных с движущегося конвейера и т.п.). При таком вводе изображений появляется возможность строить распознавание на сочетании корреляционного и структурного подходов. В предлагаемом методе на каждом такте обработки производится
вычисление корреляционной функции очередной входной строки РИ со всеми строками ЭИ. Эту операцию предлагается проводить оптически в аналоговой форме, тогда как дальнейшую (межстрочную) обработку предпочтительно выполнять в цифровом виде.
Для удобства описания введем вдоль строк непрерывную координату у, а в ортогональном направлении - дискретные, I и у соответственно для ЭИ (й(7,>;)) и РИ (/(/,_}/)). В результате обработкиу-й входной строки при размере эталона пхп и длине строки входного изображения т элементов формируется двумерная функция (плоскость признаков), представляющая собой набор п одномерных функций корреляции (размера т+п) входной строки со всеми строками эталонного изображения.
/ \ 00 ф ,у) = I /(лу+У)%У)«У
(1.1)
После обработки к входных строк вычисляется соответственно к плоскостей признаков.
Заключени