Исследование и оптимизация когерентных оптических систем автоматического распознавания образов

Тихомирова, Тамара Анатольевна

Исследование и оптимизация когерентных оптических систем автоматического распознавания образов тема автореферата и диссертации по физике, 01.04.04 ВАК РФ

Тихомирова, Тамара Анатольевна АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Москва МЕСТО ЗАЩИТЫ

1998 ГОД ЗАЩИТЫ

01.04.04 КОД ВАК РФ

Диссертация по физике на тему «Исследование и оптимизация когерентных оптических систем автоматического распознавания образов»

Текст научной работы диссертации и автореферата по физике, кандидата физико-математических наук, Тихомирова, Тамара Анатольевна, Москва

и / ' « / ./ Д. 2

НАУЧНО-ПРОМЗВОдСТШШиЕ ОБЖДШШНИЕ «ГЕОФИЗИКА*

На правах рукописи

Тихомирова Тамара Анатольевна

1 «СЛЕДОВАНИЕ I ОПТИМШЗАВДЯ КОГЕРЕНТНЫХ ОПТИЧЕСКИХ СИСТЕМ АВТОМАТИЧЕСКОГО

РАСПОЗЕШЙЙИН ОБРАЗОВ"

01.04,04 - физическая электроника, в т.ч. квантовая

Диссертация соискание ученом степени кандадата фиэиЕо-ма тема тшче сшж наук.,

Научные руководители

доктор технических наук, профессор Цебулькмн Леонид Мижайлович кандидат технических наук* о.н.с.

Желтов Сергей Юрьевич

Москва - 1990 г

СОДЕРЖАНИЕ,

Введюние........................................................ 4

ГЛАВА I, ПРОБЛЕМЫ И МЕТОДЫ СИНТЕЗА ЕДИНОГО ОБОБЩЕННОГО

ЭТАЛОНА........... ............................ . .. .. ... .9

1.1. Обобщенный годографический коррелятор= ло

1.2. Основные методы синтеза обобщэнных эталонов...............,15

1.3. Метода сжатия данных и сокращения объема вычислений

при синтезе обобщенного эталона.............................зо

1.3.1 Размер тестовой выборки................................... о!

1.3.2 Выбор тестовых изображений........................________ 35

1.3.3 Проблемы вычислений.......................................37

1.3.4 Метода снижения размерности------...........----..........39

1.4. Обсуждение ................................................41

1.5. Вывода....................................................лз

ГЛАВА 2. КОНЦЕПЦИИ МНОГОКАНАЛЬНОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ И

ПРОБЛЕМА СИНТЕЗА БАНКА ЭТАЛОНОВ........................ 45

2Л. Специфика применения ОА и ЭЦ средств при обработке изображений .....................*.=..=..................„........47

2.2 Физические особенности многоканальной оптической

Фильтрации..................................................52

2.3. Концепция постобработки •'1оск-&-гшаЬ1ег"..................54

2.4. Общие проблемы синтеза банка эталонов......................60

2.5 Статистическое и векторное сжатые представления.............62

2.6 Методы кластеризации и выделения признаков..................67

2.6Л Упорядочение признаков. Преобразование кластеризации...... 68

2.6.2 Классификация образов с помощью функции расстояния,.......70

2.6.3 Выявление кластеров.......................................71

-32,6,4. Обсуждение ,,, ,. „ ....с,..»,.,,..,..,,........ 74

2 Л Выводы.......,...........................................•...70

ГЛАВА 3, АЛГОРИТМ СИНТЕЗА БАНКА ЭТАЛОНОВ ДЛЯ ПООТОБРАБОТЕИ

" 1оок~-&- tuinbler "..........................-........... -80

3.1. Построение отдельных эталонов..............................82

3.2, Формирование пакета фильтров...............................89

3,3 Управляющие параметры алгоритма.............................90

Результаты главы 3.............................................,95

ГЛАВА 4, РЕЗУЛЬТАТЫ ЧИСЛЕННОГО МОДЕЛИРОВАНИЯ....................98

4.1 Анализ процедуры построения пакета..........................101

4.2 Результаты обработки входных сцен.......................... 112

4.3 Моделирование мультипакетной обработки.....................112

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.................................. .126

ЗАКЛЮЧЕНИЕ,................................................... .128

ПРИЛОЖЕНИЕ I................................................. 132

ОПИСОК ЛИТЕРАТУРЫ..............................................134

ВВЕДЕНИЕ

Главным фактором, сдерживающим практическое применение оптики-цифровых систем распознавания образов (ОЦС РО). является отсутствие надежных методов оптимизации таких систем для работы в реальном масштабе времени,

В настоящее время имеется богатый опыт решения сложных задач распознавания компьютерными средствами . Известны также метода оптимизации соответствующих алгоритмов по числу элементарных операций , необходимых для получения требуемого качества решения, в том числе с применением нескольких параллельно включенных процессоров. Однако полученные результаты не могут быть непосредственно использованы при оптимизации ОЦС РО реального времени.

Одной из причин является существенное различие оптических аналоговых и электронный цифровых средств по ряду ключевых параметров -- быстродействию, точности. помехозащищенности, структуре носителей базы данных и т.д. Другая причина заключается в том, что прикладные ОЦС РО должны удовлетворять весьма жестким

ограничениям по быстродействию, массо.....габаритам, энергопотреблению

. себестоимости и прочее.

Эта проблема может быть решена путем разработки комплексных методов "сжатия" компьютерных алгоритмов с учетом указанных особенностей оптико-цифровых систем. Однако такой подход требует больших усилий и из-за высокой себестоимости разработки, может быть использован лишь при создании уникальных систем [1-7].

В тоже время очевидно, что при всем многообразии прикладных алгоритмов для задач РО "сжатые" версии будут различаться тем меньше, чем более лимитированы средства реализации. Поэтому

целесообразным представляется другой подход к синтезу и оптимизации 0Ц0 Р0„

Быстродействие 0Ц0 5 не содержащей петель обратной связи (в том числе итерационных вычислительных процедур в цифровом блоке) зависит главным образом от ее архитектуры , в то время как качество решения задачи при заданной архитектуре системы определяется ее "начинкой" - базой данных оптического и электронного каскадов, разрабатываемой для решения конкретной задачи распознавания. Поэтому в случае, когда время обработки строго задано, следует прежде всего установить соответствующие ограничения на архитектуру оптико-цифровой системы, а затем поставить вопрос о разработке и оптимизации базы данных под допустимые варианты архитектуры системы.

Архитектура наиболее "быстрой" системы распознавания, включает одноканальный оптический коррелятор и блок вдФровой постобработки, функция которого состоит в поиске пичка в корреляционной плоскости . Формирование пичка при подаче на вход системы изображения заданного класса объектов осуцрствляет обобщенный эталон. Методы проектирования обобщенных эталонов достаточно хорошо разработаны. Поэтому есть основания полагать, что предельные характеристики простейшей ОЦС РО при решении конкретной задачи могут быть всесторонне оценены ,

Следующим шагом к повышению качества работы ОЦС РО при минимальном снижении быстродействия является использование многоканального коррелятора и соответствующих методов быстрой цифровой обработки множества корреляционных сигналов. Увеличение числа элементарных операций , выполняемых цифровым блоком ОЦС при обработке одного изображения, порождает многовариантность решения задач распознавания. Объективность

опенки каждого варианта при этом будет в значительной мере определяться эффективностью соответствующих алгоритмов синтеза банка обобшэнных эталонов, ориентированного на выбранный метод щфровой постобработки корреляционных сигналов.

Методы постобработки корреляционных сигналов можно условно разделить на две группы; метода анализа индивидуального сигнала и методы свертки множества сигналов в единый сигнал. Следует отметить, что хотя при значительном расширении функций цифрового блока эти методы могут комбинироваться, для жестко лимитированных ОЦС они выступают как альтернативные.

Объективный сравнительный анализ различных методов решения прикладной задачи в рамках ОЦС возможен лишь при условии разработки эффективных алгоритмов синтеза банка обобщенных эталонов , учитывающих специфику конкретного варианта щфровой постобработки, а также ограничения реальной ОЦС.

Систематический подход в данной области пока отсутствует. Одна из причин в том, что синтез каждого обобщенного эталона является сложной многомерной задачей оптимизации , весьма трудоемкой даже для современных вычислительных средств» Переход к синтезу банка эталонов в общем случае увеличивает размерность задачи в несколько раз. и для ее решения требуется разработка эффективных методов ведения затрудненного поиска.

Целью данной работы является разработка эффективного алгоритма синтеза и оптимизации банка эталонов для ОЦС РО с цифровой сверткой множества корреляционных сигналов . В качестве метода, свертки выбран метод "1оск-&-чситЬ1е1-", допускающих простую схемотехническую реализацию.

Для достижения поставленной дели был решен ряд частных задач, последовательность решения которых нашла отражение в пред-

ставленной ниже структуре диссертационной работы.

В Главе I представлено обоснование выбора базовой модели коррелятора для учета аппаратурных ограничений, а также дан анализ известных методов синтеза обобщенных эталонов .

В Главе 2 дан анализ особенностей оптических аналоговых и электронных цифровых средств обработки изображений; определены альтернативные методы цифровой постобработки множества корреляционных сигналов для жестко лимитированных ОЦСРО; рассмотрены методы сжатия информации и особенности их применения при формировании промежуточных представлений изображений • определены требования к представлению исследуемого изображения на выходе многоканального коррелятора для для альтернативных типов цифровой постобработки.

В Главе 3 дано описание разработанного автором алгоритма синтеза и оптимизации банка обобщенных эталонов для ОЦСРО со статистической цифровой постобработкой корреляционных сигналов типа "Рэок-й-шшЫег", да.на характеристика основных управляющих параметров алгоритма,

В Главе 4 представлены результаты численного моделирования с использованием реальных ТПВ-изображений, исследуются перспективы повышения качества распознавания при условии минимального снижения быстродействия оптики-цифровой системы, предложен вариант архитектуры системы и представлены результаты предварительных исследований ее работы .

Комплекс проведенных исследований позволяет вынести на____защиту

следующие положения;

I, Показано, что в жестко лимитированных ОЦСРО альтернативными методами цифровой постобработки множества корреляционных сигналов

# -8-

являются статистический метод "1сск-й--г.итЫйг-" и метод поиска экстремума ("пичка"). Сформулированы требования к банку обобщенных эталонов . оптимизированному для указанных типов постобработки.

2. Предложен метод получения и использования сжатых представлений изображений при синтезе обобщенных эталонов.

3. Разработан алгоритм синтеза банка обобщенных эталонов . оптимизированного для щфровой постобработки типа '' 1 с - ск - 1:. ■шйЫе г''. Алгоритм позволяет учитывать аппаратурные ограничения ОЦСРО и обеспечивает получение решения в сжатом цифровом формате.

4. Продемонстрирована эффективность предложенного алгоритма при решения задачи инвариантного распознавания и точного цэлеуказания класса произвольно выбранных фрагментов реального ТПВ-изображения. о.Предложены варианты блочной постобработки множества корреляционных сигналов» обеспечиваюшэй повышение достоверности распознавания при низком качестве отдельных сигналов.

Основные результаты работы внедрены при разработке блока голографмчеекой памяти в рамках НИР "Темпера-М" (НПО "Орион") и при разработке адаптивного спещшоцесоора для обработки ТВ-- и ТПВ-изображений в рамка.х НИР "Знергмя-О" (НПО "Геофизика").

ГЛАВА I. ПРОБЛЕМЫ И МЕТОДЫ СИНТЕЗА ЕДИНОГО ОБОБЩЕННОГО ЭТАЛОНА.

Основным инструментом оптической аналоговой (ОА) обработки изображений является голографический коррелятор (ГК). Этот прибор обеспечивает вычисление двух интергальных характеристик - кросс-корреляции и свертки - над двумерными массивами данных . Одним из этих массивов является входное (анализируемое) изображение» а другим - эталон. Далее будет рассматриваться только операция корреляции, поскольку все полученные результаты могут быть перенесены на операцию свертки с помощью известного соотношения %(г) ® и (г) = х и *(-г), где ©их- символы операций свертки и корреляции соответственно, * - знак комплексного сопряжения.

Главной задачей при синтезе эталонов для ОЦС реального времени является получение корреляционного сигнала, требующего минимальной щфровой постобработки для принятия решения. Качество корреляционного сигнала при этом будет определяться качеством эталона (разработка, изготовление, размещение) и точностью выполнения операции корреляции.

Разработка эталона является многомерной задачей оптимизации, которая решается с учетом ряда ограничений, определяемых свойствами физических носителей эталонов. От конкретного вида этих ограничений в значительной степени зависит эффективность поиска решения.

Аппаратурные ограничений являются составной частью априорной информации, используемой при синтезе эталона. Их сложность и громоздкость приводят к подавлению главной компоненты априорных данных - информации об объектах , условиях их наблюдения и т.д.

Поэтому в разделе I данной главы представлено обоснование выбора базовой схемы ГК, на основе которой производится фор-

мулировка аппаратурных ограничений.

По своей сути синтез эталона - это: процедура обобщения исходной информации об объекте с учетом специфики поставленной задачи, включая метод цифровой постобработки корреляционных сигналов. Основные подходы к проблеме синтеза единого обобщенного эталона для случая простейшей постобработки - поиск пичка в корреляционной плоскости - рассмотрены в разделе 2. Далее ,в разделе 3 , представлен ряд методов сокращения объема вычислений на этапе синтеза эталона.

На основе анализа изложенного материала в заключительном разделе формулируются требования к алгоритму синтеза отдельного эталона как основному компоненту общей процедуры синтеза банка эталонов.

1.1. ОБОБЩЕННЫЙ ОПТИЧЕСКИЙ КОРРЕЛЯТОР. ВЫБОР БАЗОВОЙ СХЕМЫ ГК.

Для описания работы обобщенного оптического коррелятора разделим оптическую систему на две части: конструкцию корреляционного фильтра и операцию корреляции [8]. Термин "корреляционный фильтр" будет используеться как для согласованного фильтра (ГОФ) , так и для голограммы совместного преобразования (ГСП). Конструкция этих фильтров схематично представлена на рис.1. Функции входного транспаранта Щх,у-Ь) и эталона g(x,y+Ъ) во входной плоскости Р1 освещаются коллимированным когерентным пучком с длиной волны А,. Распределение интенсивности совместного Фурье-спектра в плоскости Р9 имеет вид:

(I) = ¡Я|2+|С|2*Ш?*е~г4таЬ + Н*Ое1А%иЪ

у 1 у2

Рис.1 Конструкция корреляционного фильтра.

у1 у2 уЗ

Рис.2 Обобщенная оптическая схема обработки.

где 2Ь - среднее расстояние межд/ функциями, а и и V - координаты в плоскости пространственных частот. Если установить в плоскости Р9 фотопластину, амплитудное пропускание записанного изображения будет следующим:

(2) * =к( \Е\2+\С\2+ЕгАе-и%г)Ь + Я*СеС4таЬ)

где к - коэффициент пропорциональности. Заметим, что если объект и заменить на точечный источник, (2) запишется в виде:

(3) = Ш2+\0\2+АС*е-и™Ъ + АСеи%иЬ)

что соответствует хорошо известному согласованному фильтру Вандер Люгта.

Очевидно, что СГФ является частным случаем ГСП. Принцип операции корреляции можно увидеть, поместив ОГФ в плоскость оптической системы обработки, показанной на рис.2. Такая схема известна как корреляция Вандер Люгта.

Предположим, что входным объектом 7г является f{x,y) , тогда комплексное распределение света за корреляционным фильтром будет следующим:

(4) = Ш{\Н\2+\0\ 2+Н0*е~14%уЬ + Н*Ое14%уЬ)

сО

Соответственно выходное поле корреляции в Р^ :

(5) и3(х,у) = и0 +

&/(х3,У3)®8*(-х3,у3)®П(х3,у3)®д(х3,у3-2Ъ)+ + Щ ( х3,у 3 )щ (х3, у з )®П* (~х3, у3 ,)®б ( х3, у3+2Ъ )

I о о

где ® - операция свертки , Uq - симметричная относительно оптической оси часть распределения амплитуды, а второе и третье слагаемые рассеяны вокруг (0,2Ъ) и (0,-2Ъ) соответственно.

Заметим, что на этапе построения фильтра мы заменяем h(x,y) на б-функыию ,т.е. пологаем 1\(х9у-Ь}= A Q(x,y-b), и второе слагаемое преобретает вид:

(6) К(х3,у3-2Ъ) = sSf(i,Ue*(l-x3, i-y3-t-2b)dtaz

что является кросскорреляционной функцией между / и g. Очевидно, что эта ВКФ рассеяна вокруг (0,2Ь).

Аналогично, третий член в (5) становится таким:

(7) Щх3,у3+2Ъ) = Hf( i, С )g(x3-l, у3<+2Ъ

и он распределен вокруг (0,-2Ь).

О другой стороны, если объектной функцией f(x,y) на этапе обработки сигнала является б-функция , второй и третий члены таковы:

R(x3,y3-2b) = g*(-х3,у3)фП(х3,у3)®8(х3,у3-2Ъ)

(8)

R(x3,y3+2b) = g(x3,y3)&h*(-x3,y3)®6(x3,y3+2b)

и »следовательно, мы получаем две ВКФ, рассеянью относительно (0,2Ъ) и (0,-2Ь) соответственно. Поскольку входной объект является 5-функцией, как показано на рис.2, корреляционный фильтр освещается коллимированным пучком света. Мы видим, что для такого

■корреляционного фильтра не требуется особой установки. Данный метод известен как совмещенная корреляция (СК). Распределение интенсивности корреляционного фильтра 1(и,и) (I) можно переписать в виде:

(9) 1(и,V) = \Н\2+\0\2+21Я| | <71С08(4%иЪ+[ф-ф])

где Н(и,и) и С(и,и) - Фурье-спектры 1\(х,у) и g(x,y). Тогда контраст интерференционных полос представляется в виде :

2 |ЯЦС| (10) Т = —?-о

Очевидно, что если функции входного объекта и эталона идентичны, то контраст КФ равен единице и освещенность (9) становится синусоидальной решеткой. Дифракционная эффективность решетки пропорциональна контрасту у (0^7<1). Поэтому идеальная интерференционная картина с максимальным контрастом является условием получения хорошего корреляционного выхода, т.е. наиболее яркого пичка . Однако на практике входной объект никогда не совпадает точно с эталоном из-за шумов устройств. Прочие искажения, такие как масштаб и вращение, также скажутся н�