Оценка параметров сдвига фрагментов динамических полей в пространственной и спектральной областях тема автореферата и диссертации по физике, 01.04.03 ВАК РФ

Миляев, Сергей Владимирович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Воронеж МЕСТО ЗАЩИТЫ
2013 ГОД ЗАЩИТЫ
   
01.04.03 КОД ВАК РФ
Диссертация по физике на тему «Оценка параметров сдвига фрагментов динамических полей в пространственной и спектральной областях»
 
Автореферат диссертации на тему "Оценка параметров сдвига фрагментов динамических полей в пространственной и спектральной областях"

На правах рукописи

Миляев Сергей Владимирович

Оценка параметров сдвига фрагментов динамических полей в пространственной и спектральной областях

01.04.03 - Радиофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

17 ОКТ 2013

005534947 7

Воронеж - 2013

005534947

Работа выполнена в Воронежском государственном университете.

Научный руководитель: доктор физико-математических наук,

профессор Радченко Юрий Степанович

Официальные оппоненты: Сирота Александр Анатольевич,

доктор технических наук, профессор, Воронежский государственный университет, заведующий кафедрой технологий обработки и защиты информации

Жуков Андрей Александрович, кандидат физико-математических наук, ЗАО «ИРКОС» (г. Воронеж), начальник отдела разработки программного обеспечения

Ведущая организация: ФГАОУ ВПО «Санкт-Петербургский госу-

дарственный университет аэрокосмического приборостроения»

Защита состоится 7 ноября 2013 г. в 15 часов 20 минут на заседании диссертационного совета Д.212.038.10 при Воронежском государственном университете, расположенном по адресу: 394006, г. Воронеж, Университетская пл., 1, Воронежский государственный университет, физический факультет, ауд. 428.

С диссертацией можно ознакомиться в библиотеке Воронежского государственного университета.

Автореферат разослан « » 2013 г.

Ученый секретарь диссертационного совета

Маршаков Владимир Кириллович

Общая характеристика работы

Актуальность работы. Современные телекоммуникационные системы ориентированы на передачу мультимедийной информации, наиболее емкой частью которой являются видеопоследовательности, представляющие собой двумерные динамические поля. В настоящее время стремительно растет востребованность интеллектуальных систем удаленного видеонаблюдения. Эти системы должны обеспечивать передачу видеоданных в реальном времени в любых условиях, которые часто ограничивают пропускную способность канала передачи, дополнительно повышая требования к степени сжатия передаваемых данных. Кроме того, такие системы должны обладать функцией интеллектуальной обработки видео, которая позволяет обнаруживать и распознавать объекты интереса и события. Эти задачи, решаемые с использованием современных стандартов видеокодирования требуют значительных вычислительных ресурсов. Таким образом, возникает необходимость создания менее вычислительно затратных, но эффективных методов сжатия видеопоследовательностей.

Одним из перспективных направлений повышения эффективности процедур сжатия, восстановления и обработки видео является применение обобщенных спектров в различных базисах. Однако широкое применение таких алгоритмов обработки полей сдерживается недостаточной теоретической и экспериментальной проработкой большого числа вопросов. К. ним относятся: возможность оценки сдвига фрагментов поля, использующей неинвариантность обобщенных спектров к сдвигу подобластей, методы расчета корреляции спектральных коэффициентов разложения поля, позволяющие определить предел информационного сжатия результатов регистрации. Фактором, усложняющим обработку полей, является их существенная неоднородность. Существующие подходы к оценке параметров анизотропии поля не являются удовлетворительными, поскольку базируются на дифференциальных операторах, являющимеся некорректными на границах и контурах фрагментов. Одним из возможных решений этой задачи является спектральный подход.

Целью диссертационной работы является синтез эффективных (по критерию точность - вычислительная сложность) алгоритмов оценки движения фрагментов полей в пространственной и спектральной областях и новых спектральных алгоритмов обработки полей. Для достижения этой цели были поставлены и решены следующие задачи:

1. Анализ методов оценки движения фрагментов полей при наличии аддитивного шума и фона.

2. Синтез алгоритмов оценки сдвига фрагментов поля в спектральной области, обладающих новыми возможностями по сравнению с пространственными алгоритмами, в том числе по надежности оценки, вычислительной эффективности.

3. Корреляционный анализ спектральных коэффициентов подобластей поля при их произвольном сдвиге в различных базисах непрерывных и дискретных ортогональных преобразований.

4. Разработка методики анализа анизотропии полей по спектральным коэффициентам с целью адаптации алгоритмов сжатия, восстановления и обработки к неоднородности этого поля.

5. Разработка принципа видсокодирования, использующего спектральные алгоритмы обнаружения изменений в подобластях изображений, оценки и компенсации движения, сжатия и обработки восстановленных кадров.

Методы проведения исследований. При решении поставленных задач в диссертации используются методы статистической радиофизики, математического анализа, теории вероятностей, математической статистики, случайных процессов, теории статистических решений, вычислительные эксперименты с реальными видеопоследовательностями. При разработке программного обеспечения использовались методы объектно-ориентированного программирования на языке С++, а также процедурное программирование в пакете МАТЬАВ.

Научная новизна выносимых на защиту результатов. На защиту выносятся следующие основные результаты и положения:

1. Алгоритмы оценки сдвига фрагментов поля в спектральной области, обладающие вычислительной эффективностью и повышенной надежностью поиска экстремума функционала сдвига.

2. Методика расчета зависимости корреляционных моментов спектральных коэффициентов подобластей поля с произвольным сдвигом в непрерывном и дискретном базисах, в том числе при неравномерной сетке отсчетов.

3. Подтверждение гипотезы, что дискретное Чебышевское преобразование (СБСТ) обеспечивает меньшую корреляцию спектральных мод как внутри блока, так и между блоками с произвольным сдвигом по сравнению с известными ортогональными преобразованиями.

4. Новый способ определения анизотропии полей, а также новые метрики анизотропии, основанные на анализе обобщенных спектров, подтвержденные экспериментально.

5. Структура и программная реализация видеокодека на основе дискретного косинусного и Чебышевского преобразований, использующий спектральные алгоритмы обнаружения изменений в кадре, оценки движения блоков и обработки восстановленных изображений.

Практическая значимость. Результаты, полученные в диссертации, позволяют обосновать структуру и оценить характеристики нового принципа видеокодирования, основанного на широком применении спектральных алгоритмов для сжатия, восстановления и обработки изображений. Полученные

результаты направлены на повышение эффективности удаленного видеонаблюдения с использованием низкоскоростных, зашумленных каналов, систем передачи мультимедийной информации, систем технического зрения.

Результаты исследований внедрены в ОКР выполненных в ЗАО «Кодо-фон».

Достоверность. Достоверность результатов, полученных в диссертационной работе, подтверждается корректностью использования математического аппарата, совпадением новых результатов в частных случаях с известными, результатами статистического моделирования и экспериментальными исследованиями на реальных изображениях.

Апробация работы. Основные результаты диссертации докладывались и обсуждались на конференциях: Международные научно-технические конференции «Кибернетика и высокие технологии XXI века» (Воронеж, Россия, 2009-2011 гг.), Всероссийская научно-практическая конференция «Современные проблемы создания и эксплуатации радиотехнических систем» (Ульяновск, Россия, 2009 г.), Международные конференции «Цифровая обработка сигналов и ее применение» (Москва, Россия, 2010-2013 гг.), Международная научно-техническая конференция «Радиолокация, навигация, связь» (Воронеж, Воронеж, 2012 г.)

Публикации. Материалы диссертации опубликованы в 15 печатных работах, из них 5 статей в рецензируемых журналах, рекомендованных ВАК для публикации основных результатов диссертации, 9 статей в сборниках трудов конференций.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и библиографии. Общий объем диссертации 167 страниц, включая 57 рисунков и 9 таблиц. Библиография включает 81 наименование на 11 страницах.

Во Введении обоснована актуальность диссертационной работы, сформулирована цель и аргументирована научная новизна исследований, показана практическая значимость полученных результатов, представлены выносимые на защиту научные положения.

В первой главе выполнен синтез алгоритмов оценки движения. Рассмотрены пространственные алгоритмы и алгоритмы, основанные на неинвариантных к сдвигу спектрах фрагментов полей. Оценка параметра сдвига осуществляется с помощью квазиправдоподобных алгоритмов, базирующихся на методе максимизации некоторого функционала. Для построения функционалов использованы как аддитивная смесь сигнала и шума, так и аппли-кативная модель сигнала, фона и аддитивного шума.

Общая модель полезного сигнала, фона и шума. Пусть в области (х, у) 6 Б в моменты времени г = 0,1,... присутствует поле

и^{х,у) = 8^{х,у)+Г«\х,у), (1)

l(t, то) = ||^(а;,г/;то) -s Скт(т) = Xkm{T, To) =

s®(x,y) = u^(x,y)In(x,y), r®(x,y) = u«(a:,y)[l - /n(x,y)], (2) где In(x,y) - индикаторная функция подобласти О С D, занятой подвижным фрагментом (сигналом). В момент i,-+i: s^+1\x,y) = s^(x,y;rо), где т0 = (т()х, Т(),;) - вектор плоско-параллельного сдвига фрагмента. Тогда обрабатываемое поле В момент ¿,+1

е+1(х,у\т0) = 8®(х,у;то) + г<!+1Цх,у;то) + т1(х,у). (3)

Модель (3) названа общей моделью сигнала в(х,у;то), фона г(х,у) и шума

Функционалы сдвига в пространственной и спектральных областях. Для оценки неизвестного сдвига то формируется два вида функционалов (норма L2)

Ld{r, т0) = (£ (ж, у|т0) - s(x, у; r))2dxdy, (4)

JJd „ *—.M(k,m) „

■ ,{х,у;т)\\2 = ^2{,\Х(т,т o)-Cfcm(r))2, 5)

РР *—'fc,m—О

s(x,y;T)ipk(x)pm(y)dxdy, (6)

,, JJn(r)

£(х, у; T0)<£fc(x - tQx)ipm{y - T0y)dxdy, (7)

JJ П(г)

где <Pkm{x,y) = tPk{x)'fim{y) ~ ортогональные факторизуемые базисные функции. В работе исследованы и другие виды функционалов на базе (6), (7), или по норме LI. Функционал (5) может быть вычислен по ограниченному набору из М(к, тп) спектральных коэффициентов. В работе исследованы дискретные варианты разложений (G), (7) по базисам косинусного, целочисленного косинусного и Чебышевского преобразований.

На кадре реальной видеопоследовательности были выделены типичные фрагменты динамического поля, для которых строились функционалы сдвига (4), (5). В качестве фрагмента, для которого необходимо оценивать евдиг брался блок кадра размером 12 х 12, а в качестве области поиска бралась окрестность этого блока размером 24 х 24. В качестве ортогонального преобразования было выбрано дискретное Чебышевское преобразование (GDCT). Исследования показали, что переход в спектральное пространство в целом сохраняет характер метрик схожести, расчитанных в пространстве изображений. Использование ограниченного числа мод при вычислении функционала приводит к тому, что уменьшается общая энергия сигнала и амплитуда экстремума, центральный пик сигнальной функции становится менее острым, изменяется отношение центрального пика к величине побочных экстремумов. В то же время получение ограниченного числа мод с вычислительной точки зрения может быть выполнено при помощи быстрых алгоритмов ортогональных преобразований. Таким образом, функционалы с ограниченным числом мод можно использовать при оценке сдвига.

Применение спектрального подхода к оценке движения на видеопоследовательностях. В качестве примера применения спектрального

Таблица 1. Сравнение алгоритмов оценки векторов движения на тестовых видеопоследовательностях

Алгоритм поиска container foreman coastguard

MSE PSNR MSE PSNR MSE PSNR

Three-step search 9,84 38,20 62,30 30,19 64,56 30,03

Three-step search spectral 1 9,82 38,21 62,27 30,19 66,75 29,89

Three-step search spectral 2 9,85 38,20 62,40 30,18 66,02 29,93

алгоритма оценки вектора сдвига был предложен модифицированный трех-шаговый метод поиска экстремума метрики L1 для спектров в базисе целочисленного дискретного косинусного преобразования. Было использовано 3 версии алгоритма поиска: базовая версия трехшагового поиска с использованием метрики L1 в пространстве изображения на всех шагах поиска и 2 модифицированные версии с использованием на первом шаге метрики L1 для спектров. Вычислении L1 выполнялось с прямоугольным и треугольным усечением спектральной матрицы соответсвенно при максимальном номере оставляемой моды равном 2. Версии спектральных алгоритмов сокращают число операций на первом шаге поиска более чем на 40%-60%. В табл. 1 приведены значения метрик среднеквадратической ошибки (MSE) и пикового отношения сигнал/шум (PSNR) между обрабатываемыми кадрами и реконструированными кадрами по найденным векторам движения и опорным кадрам для различных видеопоследовательностей с различным характером движения («container», «foreman», «costguard»). Предложенные спектральные алгоритмы оценки сдвига практически не уступают по точности обычному трех-шаговому методу поиска, сокращая число операций на 30%.

Во второй главе диссертационной работы решена задача по определению корреляции спектральных коэффициентов двух сдвинутых фрагментов поля. Рассмотрены непрерывные и дискретные базисные функции. Дискретные базисные функции определены на решетке с равномерным и с неравномерным нагом. В зависимости от значения сдвига проанализированы частные случаи внутриблочной, межблочной корреляции спектральных компонент.

Спектральный анализ сигналов в непрерывной области. Пусть имеются две перекрывающиеся подобласти переменной одномерного процесса, в которых определены сигналы

S«(z) = S$\z) + a(i)£{i)(z), г £ П« (8)

где Sq ' - детерминированный сигнал, - среднеквадратическое отклонение S^\z). Процесс цпредставляют собой вырезки из случайного процесса = U(z)I{z,il^), где I(z,Q.W) - индикаторная функция подобласти (блока) fiM, г = 1,11. Случайный процесс считается стационарным в широком смысле с нулевым матожиданием и единичной дисперсией.

Взаимная корреляционная функция случайных процессов в этих блоках Ri,n{zi,z2) = R{z[,z'2), z[ е П{1} = [-1,1], 4 ^ = [—1,1]- Случайные компоненты спектральных коэффициентов при разложении сигналов (8) по

ортогональным функциям <рт(г) для I и II блоков определяются как

и=\ ^(г'Мг'М, 1к=\ (9)

.то

Корреляционный момент между и определяет корреляцию между спектральными коэффициентами I и II блоков произвольных кит мод и с учетом (9) равен

Цкт =< &7т >= (10)

•МЧ Лпс«)

После необходимых преобразований получены следующие расчетные со-шения ,

Икт(то) =

отношения для обшего случая корреляции смещенных блоков

[Д(|7й-т|) + (-1)т+*Я(|7Ъ + т|)] [ ¿т(*)М*+\г\№<1т. (11)

О .1-1

Из (11) можно выделить два частных случая: внутриблочная (то = 0) и межблочная (го = 2) корреляции.

На основе полученных соотношений выполнены расчеты для ряда ортогональных базисов. Установлено, что внутри блока отсутствует корреляция между четными и нечетными компонентами спектра.

Спектральный анализ сигналов в дискретной области. Имеется одномерный случайный процесс, заданный на дискретном множестве отсчетов, сетка которых может быть равномерной или неравномерной:

$ = 5« + а ■ Хь г = 0...ЛГ -\,Х1~ ЛГ(0,1), (Х{ ■ Х}) = 11{з - г), (12) где 5ог - детерминированная величина, а - СКО случайного отсчета, Х{ -случайная величина, распределенная по нормальному закону.

Пусть {<л(г)} - ортогональный векторный базис, определяющий матрицу дискретного ортогонального преобразования. Учитывая, что копия сигнала 5'г'(т(>), взятого со сдвигом го, связана с исходным сигналом выражением ЗЦТо) = спектральные коэффициенты ее разложения будут равны:

СиЫ = ^(г)5Кто) = Мк(т0) + а^(го), (13)

где N - число дискретных отсчетов сигнала в блоке, а

ЕЛГ-1

. п <Рк{г)3(ц+Тв,€к(то)=аЪ. <рк(.г)Х1+То, (14)

г=и ■ ц

- детерминированная и случайная составляющие.

Для конкретизации расчетов выбрана корреляционная функция внутренних отсчетов г м ] блоков, смещенных на величину то, которая применяется для описания гауссовских марковских процессов:

Д(и, то) = ехр(-Ь' - г + т0\5/60) = ¿>1^+4 р = ехр(Д*/<5о), (15) здесь 6, <5о - параметры корреляционной функции, р - коэффициент корреляции соседних отсчетов.

В случае неравномерной сетки отсчетов вид корреляционной матрицы сэмплов определяется законом располжения сэмплов внутри блока. Например, для преобразования ИБСТ корреляционная матрица сэмплов равна

где Ь - размер блока сигнала, N - число сэмплов в блоке.

В предположении о стационарности последовательностей X, в пределах обоих блоков дисперсия случайных составляющих имеет вид:

= = Е^й1 ЕЛ п1 з, ош^мя (17)

г 'г—и < '_7=и

Взаимная корреляционная функция для случайных спектральных компонент ^(0) и £,п(то) смещенных на величину то определяется как

• п Е- п д(м>то(18)

Соответственно нормированный коэффициент корреляции между спектральными коэффициентами блока и его смещенной копии будет равен

Къыь(к, тп, т0) = Кмь(к, тп, т0) / ^Щ^ЩЩ^М). (19)

Используя полученные соотношения, произведен расчет корреляции спектральных коэффициентов между смещенными блоками сигнала для ДКП, целочисленного ДКП и преобразования СБСТ. Построены зависимости нормированного коэффициента корреляции спектральных мод от корреляции соседних отсчетов сигнала р при различных сдвигах между блоками и зависимость нормированного коэффициента корреляции между четными и нечетными модами от величины сдвига при фиксированной корреляции соседних отсчетов сигнала. На рис. 1а и б показаны эти зависимости для ДКП.

Произведен расчет корреляции спектральных коэффициентов для указанных выше преобразований внутри блока сигнала от корреляции соседних отсчетов сигнала. Расчеты показали, что взаимная корреляция между четными и нечетными коэффициентами отсутствует и наблюдается некоторая корреляция только между ближайшими четными или нечетными коэффициентами. Из сравнения графиков зависимостей для ДКП и вЮСТ на рис. 1о и г видно, что СБСТ обеспечивает большую декорреляцию коэффициентов преобразования по сравнению ДКП.

Произведен расчет корреляции спектральных коэффициентов между соседними блоками сигнала от корреляции соседних отсчетов сигнала. На рис. 1д и е представлены графики зависимости коэффициента корреляции между одинаковыми модами от параметра р для преобразований ДКП и СБСТ соответственно. Из графиков видно, что с ростом номера моды коэффициент корреляции быстро убывает и межблочной корреляцией всех коэффициентов, кроме коэффициентов Со на практике можно пренебречь. Сравнивая графики для преобразований ДКП и СБСТ видно, что СБСТ обеспечивает большую декорреляцию нулевых спектральных коэффициентов соседних блоков по сравнению с ДКП.

Полученные расчетные соотношения были экспериментально подтверждены оценкой корреляции спектральных мод на реальном изображении.

В третьей главе предложено определение анизотропии фрагментов полей. Предложена математическая модель определения анизотропии двумер-

Д(р,0ДЛГ/4) r(.p,o,0,n/2) 06 R'(p,0,0,3N/4) R"CpAO,N)

DCT SHIFT

a)

O.lr

Х.Р.0,2) n

ДА 0,4)

R{p..2..4) " 0.1

ЛСр,2,6) . 0.2

DCTINTRA

в) 1

Rip, 0,0) 0.5

R(p, 2,2) 0

DCTINTER 0.5

Л(0.8ДО,г0)

Д(0.8,1,1,г„)

Д(0.8,2,2,г0)

Л(0.8,1Дг0)

Л(0.8,2,4,г„)

Щр, 0,4) Д(/?,2,4) -»■» Л(р.2,б) _02 GDCT INTRA

«AM)

Л(>,2,2)

QDCT INTER

0.4 Об 0.8 1 ""

д) ре) р

Рис. 1. Зависимости нормированного коэффициента корреляции спектральных мод: ДКП нулевого порядка при сдвиге блоков от корреляции соседних отсчетов сигнала при различных сдвигах между блоками (а) и четных и нечетных от величины сдвига при фиксированной корреляции между отсчетами (б), четных внутри блока сигнала от корреляции соседних отсчетов сигнала для ДКП (в) и GDCTfs), одноименных мод соседних блоков от корреляции соседних отсчетов сигнала для ДКП (<?) и GDCT(e).

ного поля по спектральным коэффицинтам ортогональных преобразований. Получены интегральные характеристики анизотропии для изображений. Исследовано применение анализа анизотропии при оконном сглаживании эффекта Гиббса на реальных изображениях.

Спектральный подход к анализу анизотропии. Пусть задано двумерное поле s(x,y), (х,у) 6 D, D - подобласть, занимаемая полем. Свойства поля по координатам хну различные. Количественной мерой, которая определяет характерную протяженность сигнала, является интервал корреляции, или в двумерном случае область корреляции. Двумерная автокорреляционная функция (АКФ) сигнала связана со спектральной плотностью мощности преобразованием Фурье. Спектральная плотность мощности определяется через спектр сигнала S(u>x,ujy) = uv)\2 и в окрестности положения мак-

симума tox = 0, ujy = О

S{wx, и>у) « Soa - 0.5(Sn^ + S+ 2S12ujxUJv), (20)

Sn = -S2S/(5ujx)2, S22 = -S2S/{Scjy)\ S12 = -52S/5ujxStjy. (21) Как видно из (20) спектральная плотность в окрестности максимума представляет собой квадратичную форму (в сечении - эллипс). Поворот осей с помощью преобразования X = и cos в — usin0, ilu = и>х cos в — U)ysiri6, Y = и sin в + v cos 0, f2„ = шх sin0 + uycos9, tg(20) = 2S12/(Sn - 522) приводит квадратичную форму (20) к каноническому виду

S(fiU) П„) = So о - 0.5(Л?П„ + Х2П2,), (5ц - А)(522 - Л) - S2n = 0. (22) Набор параметров (Ai, Л2, в) характеризует неоднородность сигнала s(x, у) по пространственным координатам (х,у). Эти характеристики анизотропии соответствуют характеристикам анизотропии на основе анализа корреляционного тензора градиента. Однако, использование корреляционного тензора градиента проблематично на границах фрагментов, контурах, во всех точках со скачком уровня сигнала. Предложенное определение параметров анизотропии на основе анализа спектров более корректно.

Метрики анизотропии и их статистический анализ. В работе предложены две метрики анизотропии, основанные на анализе квадратичных форм (20), (22) - геометрическая и энергетическая, имеющая вид

fOC ГЫу ГЭС

cLJt

МЕ = Eh/EL =

duly

о

S(u)x,u}y)dwy, (23)

3{шх,и>у)с1шх1

в секторах </з е [7г/4,7г/2] и е [0,7г/4] квадранта 0 < шх < оо, 0 < шу < оо, <р = агсЬ£(шу/и]х). Вычисления показали, что в важных частных случаях интегральные показатели неоднородности геометрический и энергетический совпадают, что говорит об их равноценности для оценки анизотропии в спектральной и пространственной областях.

Если сигнал явялется дискретным 5у, г,] = 0,1,..., УУ — 1 и обладает дискретным спектром Стк, т, к = 0,1,..., N — 1, то аналогом (23) является

ЕЛГ-1 Т—кШ „ ^——1 „

У С2ткУ У С2тк. (24)

т=0 0 тК/ ¿-<к=т т1с у '

С вычислительной ТОЧКИ зрения вместо С21к удобнее использовать \С'тк:\.

Введены метрики ¿н = Е^ЕГо1 Ы и йь = Е^ Ы,

которые являются мерами убывания спектра в горизонтальном и вертикальном направлениях соответственно. По величине М,1 = Ац/Л^ мы можем судить о величине и направлении анизотропии сигнала в блоке. При Л/,/ < 1 анизотропия имеет вертикальное направление, при М^ > 1 - горизонтальное, при « 1 блок является изотропным. Спектральные коэффициенты, расположенные в первой строке и в первом столбце, в наибольшей степени характеризуют убывание спектра в соответствующих направлениях, поэтому их анализа достаточно для определения характеристик анизотропии в блоке и при расчете метрик йц и с1£,.

Рис. 2. Гистограммы метрик аниютроиии н горн юіггаїїмюм (более сінт.іая) <1/ и мгртн-ка.1ыюм (более темпам) <іц иагцмц.и-ииих блока и шбражеиим, а) - с игргнкиыммИ! анизотропией, б) - г горн иліia.ii.noR алнютроііией. о) - с и югроммыми сііоАегиамн.

Для экспериментального исследования подложенного метода анализа анизотропии были кзяты изображения текстур с вертикальными и горизонтальными направлениями анизотропии и изотропные. Было установлено, что для изображений с вертикальной или горизонтальной анизотропией распределения метрик с1ц и <1і достаточно удалены друг от друга, гистограммы которых представлены на рис. 2. При этом распределение метрики (1ц смещено в сторону меньших значений, относительно распределения метрики ^ для изображения і: вертикальной текстурой и наоборот для изображения с горизонтальной текстурой. Для изображения с изотропной текстурой распределения метрик достаточно близки. Таким образом, анализируя эти метрики можно определить интегральную характеристику анизотропии в блоке изображения. и в соответствии с этим выбрать способ его обработки.

Учет анизотропии при подавлении артефактоа сжатия полей. При сжатии изображений и видео коэффициенты ортогонального преобразования СУ„і обычно квантуются, что вызывает отличие восстанавлима-его сигнала от исхнодиого. При этом часто проявляется эффект Гнббса, для подавления которого производят щіеобра зование кшінтованного спектра с помощью оконной функции ¡¡к,,,: С£т = (¿¡.„¡(^„Нкт- Построение двумерного сглаживающего окна представляет собой не |>еіиенную до конца задачу. Существующие подходы значительно подавляют высокие частоты, не учитывая его анизотропные свойства. Предложено использовать оконный фильтр, подстраивающийся под характер изображения

Нкт - Н(^/кк2 + (1 -к)т*). (25)

где 0 < к < 1. Вопрос выбора параметра к связан с неодинаковой протяженностью спектра по обеим частотным компонентам, которая в свою очередь зависит от неоднородности сигнала по той или иной координате. Усечение спектра по разным координатам будет приводить к разной степени эффекта Гиббса. поэтому параметр к в (25) должен определяться ориентацией анизотропного фрагмента. Воспользовшийсь спектральной мерой анизотропии для каждого блока изображения можно определить соответствующее значение параметра/с. Например, можно использовать следующую зависимость к от Л/^:

при Мд <1к = 0.5ехр(-(1/Мй-1)), а при Мй>\к = 1-0.5 ехр(-(М<г-1)).

Было исследовано влияние адаптивной фильтрации для подавления эффекта Гиббса на реальных изображениях. С помощью ДКП 8x8 производилось сжатие и восстановление изображений при числе используемых мод N от 1 до 8. В ходе экспериментов параметр к для каждого блока задавался соответствии с несколькими типами фильтрации: ослабление высокочастотных компонент спектра по горизонтали (к = 0.1), вертикали (к = 0.9), одинаковое по обеим координатам (к = 0.5), адаптивное с параметром к, определяемым анизотропией блока. Эксперименты показали, что адаптивный выбор направления фильтрации по анализу направления анизотропии внутри блока изображения помогает добиться лучших результатов, по сравнению с одинаковой фильтрацией по обоим направлениям.

В четвертой главе описывается модель видеокодека МС!БСТ-2, а также некоторые исследования, выполненные при его разработке. В кодеке реализованы алгоритмы, синтезированные с помощью методов, разработанных в настоящей диссертационной работе.

Структура видеокодека МСБСТ-2. Кодек МСБСТ-2 является дальнейшим развитием кодека МОБСТ, в котором производилось кодирование кадров I- и Р-типов. Главным отличием кодека МСБСТ-2 от МСБСТ является построение прогнозных кадров на основе оценки и компенсации движения между кадрами, что позволяет существенно улучшить межкадровое прогнозирование и тем самым сократить величину ошибки прогноза.

Кодек МСБСТ-2 работает по общепринятой схеме БРСМ. В качестве ортогонального преобразования используется алгоритм ОВСТ. Для сокращения числа вычислений, необходимых для оценки движения между кадрами, которая может требовать до 80% вычислительных ресурсов, кодек МСБСТ-2 использует спектральный обнаружитель изменившихся блоков.

Для устранения эффекта блочности, создающего ошибки при оценке и компенсации движения, в кодек МСБСТ-2 включен блок постобработки восстановленных кадров с методом деблочной фильтрации СБСТ_с1еЬ]оск.

Сравнительный анализ методов поиска экстремума. Были исследованы методы шаблонного поиска векторов движения, позволяющие существенно сократить число перебираемых точек. Данные методы представляют собой дискретные варианты покоординатного спуска. Проведен сравнительный анализ алгоритмов поиска на различных видеопоследовательностях. В качестве критерия точности находилась среднеквадратическая ошибка (МБЕ) и отношение сигнал/шум (PSNR) между текущим кадром и реконструированным на основе предыдущего опорного кадра. В качестве критерия величины вычислительных затрат считалось число точек поиска на кадр. Установлено, что оптимальное соотношение точности нахождения и числа точек поиска имеют алгоритмы, с использованием нескольких шабло-

нов, в зависимости от характера движения на видеопоследовательности. При этом использование возможности ранней остановки поиска и анализ значений функции несоответствия позволяют сократить число точек поиска. Градиентные методы дают хорошие результаты на последовательностях с небольшим движением, используя меньшее количество точек поиска, чем шаблонные методы, но при наличии сложного движения они работают значительно хуже.

Характеристики качества восстановленного видео в MGD СТ2. Выполнено сравнение кодеков MGDCT и MGDCT-2 на тестовых видеопоследовательностях. В качестве критериев сравнения были выбраны объективные метрики качества сжатого видео (PSNR, MSSIM) и верхний предел степени сжатия. Для оценки предела сжатия передаваемых спектральных коэффициентов была вычислена их энтропия. В качестве объективных метрик были выбраны пиковое отношение сигнал/шум (PSNR) и индекс структурного сходства (SSIM). В качестве верхнего предела сжатия передаваемых спектральных коэффициентов, которая позволяет оценить эффективность сокращения пространственной и временной избыточности, была оценена их энтропия. Сравнение было проведено для нескольких градаций качества и степени сжатия. На видеопоследовательностях с небольшим количеством движения («container», «news») у кодека MGDCT-2 энтропия передаваемых коэффициентов нескомпенсированной межкадровой разности несколько выше по сравнению в кодеком MGDCT, но при этом и объективные метрики качества реконструированной видеопоследовательности имеют значительно более высокие значения. При наличии достаточного количества перемещения на последовательности кадров применение оценки и компенсации движения у кодека MGDCT-2 сокращает энтропию передаваемых коэффициентов нескомпенсированной межкадровой разности и повышает объективные метрики качества реконструированной видеопоследовательности по сравнению с кодеком MGDCT. Данные закономерности наблюдаются на всех градациях качества.

В Заключении подведены итоги диссертационной работы в целом и сформулированы основные результаты:

1. Синтезированы и исследованы спектральные алгоритмы оценки сдвига фрагментов динамического поля при наличии аддитивного шума и неподвижного фона, обладающие новыми возможностями по сравнению с пространственными алгоритмами, в том числе по надежности оценки, вычислительной эффективности.

2. Получены аналитические выражения для корреляционных моментов спектральных коэффициентов подобластей поля при их произвольном сдвиге в различных базисах непрерывных и дискретных ортогональных преобразований, в том числе при неравномерной сетке отсчетов. Установлено, что дискретное Чебышевское преобразование (GDCT) обеспечивает меньшую корреляцию спектральных мод как внутри блока, так

и между блоками с произвольным сдвигом но сравнению с известными ортогональными преобразованиями.

3. Предложен новый способ определения анизотропии полей, основанный на анализе обобщенных спектров, подтвержденные экспериментально. На основе анализа анизотропии разработан алгоритм адаптивной коррекции эффекта Гиббса.

4. Реализован принцип видеокодирования на основе дискретного косинусного и Чебышевского преобразований, использующий спектральные алгоритмы обнаружения изменений в кадре, оценки движения блоков и обработку восстановленных изображений.

Список публикаций

1. Миляев, С. В. Корреляция спектральных коэффициентов обобщенных рядов фурье смещенных блоков сигнала / С. В. Миляев, Ю. С. Радчен-ко // Электромагнитные волны и электронные системы. — 2013. — № 2. — С. 51-61.

2. Миляев, С. В. О корреляции спектральных коэффициентов обобщенных рядов фурье в непрерывной области / С. В. Миляев, К). С. Радченко // Цифровая обработка сигналов. — 2012. — № 4. — С. 9-12.

3. Миляев, С. В. О корреляции спектральных коэффициентов обобщенных рядов фурье и дискретной области / С. В. Миляев, Ю. С. Радченко // Цифровая обработка сигналов. — 2012. — № 3. — С. 9-14.

4. Миляев, С. В. Спектральный анализ анизотропии изображений / С. В. Миляев, Ю. С. Радченко // Вестник Воронежского государственного университета. Серия: Физика. Математика. — 2011. — № 2. — С. 45-51.

5. Миляев, С. В. Оценка вектора сдвига фрагментов динамических изображений в асинхронном спектральном базисе / С. В. Миляев, Ю. С. Радченко // Вестник Воронежского государственного университета. Серия: Физика. Математика. — 2008. - № 1.'— С. 75-80.

6. Миляев, С. В. Принципы построения компенсированных кадров в перспективном кодеке па базе чебышевского преобразования / С. В. Миляев, К). С. Радченко // Труды 15-ой Международной конференции «Цифровая обработка сигналов и ее применение - DSPA 2013». — Т. 2. — 2013. — С. 279 283.

7. Миляев, С. В. Корреляция спектральных мод смещенных блоков при дискретных ортогональных преобразованиях / С. В. Миляев, Ю. С. Радченко // Труды 18-ой Международной научно-технической конференции «Радиолокация, навигация, связь - RLNC-2012». — Т. 1. — 2012. — С. 235-241.

8. Миляев, С. В. Особенности построения видеокодека на основе чебышевского преобразования (GDCT) с оценкой векторов сдвига блоков / С. В. Миляев, Ю. С. Радченко // Труды 14-ой Международной конференции «Цифровая обработка сигналов и ее применение - DSPA 2012». — Т. 2. - 2012,- С. 298-301.

9. Миляев, С. В. Внутриблочная и межблочная корреляция спектральных

мод преобразования чебышева / С. В. Милясв, Ю. С. Радченко // Труды 12-ой Международной научно-технической конференции «Кибернетика и высокие технологии XXI века - С&Т2011». - Т. 1. - 2011. - С. 254-2С0.

10. Булыгин, А. В. Корреляция спектральных мод при ортогональных преобразованиях БСТ, СШСТ / А. В. Булыгин. С. В. Миляев, Ю. С. Радченко // Труды 13-ой Международной конференции «Цифровая обработка сигналов и ее применение - БвРА 2011». — Т. 2. — 2011. — С. 176-179.

11. Миляев, С. В. Сравнительный анализ алгоритмов оценки векторов движения в видеопоследовательности / С. В. Миляев, Ю. С. Радченко // Труды 11-ой Международной научно- технической конференции «Кибернетика и высокие технологии XXI века - С&Т2010». -- Т. 2. — 2010. — С. 635-644.

12. Булыгин, А. В. Обнаружение, выделение и сопровождение изменившихся объектов в видеопоследовательности / А. В. Булыгин, С. В. Миляев // Труды 12-ой Международной конференции «Цифровая обработка сигналов и ее применение - БЭРА 2010»,- Т. 2. - 2010,- С. 123-126.

13. Лазарев, Е. А. Предобработка и постобработка изображений в кодеке МвБСТ / Е. А. Лазарев, С. В. Миляев, Ю. С. Радченко // Труды 12-ой Международной конференции «Цифровая обработка сигналов и ее применение - ББРА 2010». - Т. 2. - 2010. - С. 154-158.

14. Миляев, С. В. Сравнение пространственных и спектральных алгоритмов субпиксельной оценки сдвига подвижных фрагментов изображения / С. В. Миляев, Ю. С. Радченко // Труды 6-ой всероссийской научно-практической конференции «Современные проблемы создания и эксплуатации радиотехнических систем». — 2009. — С. 270-275.

15. Миляев, С. В. Исследование функционала сдвига фрагментов изображений в пиксельном и спектральном пространстве / С. В. Миляев, Ю. С. Радченко // Труды 10-ой Международной научно-технической конференции «Кибернетика и высокие технологии XXI века - С&Т2009». — Т. 2. - 2009. - С. 629-635.

Работы № 1-5 опубликованы в периодических изданиях, рекомендованных ВАК для публикации основных результатов диссертации

Подписано в печать 26.09.13. Формат 60*84 '¡,ь. Усл. иеч. л. 0,93. Тираж 100 экз. Заказ 961.

Отпечатано с готового ори: инал-макета в типографии Издатсльско-полиграфичсского ненгра Воронежского государственного университета. 394000, Воронеж, ул. Пушкинская, 3

 
Текст научной работы диссертации и автореферата по физике, кандидата физико-математических наук, Миляев, Сергей Владимирович, Воронеж

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ

ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ "ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"

На правах рукописи

04201363356

Миляев Сергей Владимирович

Оценка параметров сдвига фрагментов динамических полей в пространственной и спектральной областях

01.04.03 Радиофизика

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата физико-математических наук

Научный руководитель д. ф.-м. н., проф. Радченко Юрий Степанович

Воронеж - 2013

\ \

Содержание

Введение ................................... 4

Глава 1. Оптимальные и квазиоптимальные алгоритмы оценки

сдвига подобластей поля .......................10

1.1. Оптимальные алгоритмы оценки сдвига в пространственной и спектральной областях при наличии шума............12

1.2. Общая модель поля, включающего полезный сигнал, фон, тпум 17

1.3. Исследование функционала сдвига в пространственной области для общей модели поля.....................21

1.4. Исследование функционала сдвига в спектральной области . . 27

1.5. Применение спектрального подхода к оценке движения па видеопоследовательностях ......................, . 33

1.6. Выводы по главе 1..........................41

Глава 2. Корреляция спектральных мод фрагментов случайных процессов и полей.........................43

2.1. Модели дискретных последовательностей и их спектров при дискретных ортогональных преобразованиях...........44

2.2. Внутриблочная корреляция мод при ДКП и СЭСТ преобразованиях ................................51

2.3. Межблочная корреляция мод при ДКП и ОБСТ преобразованиях ..................................58

2.4. Корреляция спектров сдвинутых фрагментов сигналов.....65

2.5. Выводы по главе 2..........................82

Глава 3. Анализ анизотропии полей и его применение к алгоритмам обработки изображений ..................84

3.1. Градиентный подход к анализу анизотропии полей.......85

3.2. Спектральный подход к анализу анизотропии..........88

3.3. Метрики анизотропии и их статистический анализ.......92

3.4. Учет анизотропии при подавлении артефактов сжатия полей . 104

3.5. Выводы по главе 3..........................112

Глава 4. Реализация алгоритмов оценки движения в перспективном видеокодеке MGDCT2....................114

4.1. Структура видеокодека MGDCT-2.................115

4.2. Методы поиска экстремума при оценке сдвига фрагментов видсо125

4.3. Сравнительный анализ методов поиска экстремума.......140

4.4. Характеристики качества восстановленного видео в MGDCT2 . 146

4.5. Выводы по главе 4..........................153

Заключение..................................155

Литература..................................157

Введение

Актуальность работы. Современные телекоммуникационные системы ориентированы на передачу мультимедийной информации, наиболее емкой частью которой являются видеопоследовательности, представляющие собой двумерные динамические поля. Без существенного информационного сжатия подобных полей практически невозможна передача цифрового видео по каналам связи в реальном времени. В настоящее время стремительно растет востребованность в интеллектуальных системах удаленного видеонаблюдения. Эти системы должны обеспечивать передачу значительного объема видеоданных в реальном времени в любых условиях, которые часто ограничивают пропускную способность канала передачи, например, при передаче по беспроводному радиоканалу. Таким образом, дополнительно повышаются требования к степени сжатия передаваемой информации. Кроме того, такие системы должны обладать функцией интеллектуальной обработки видео, которая позволяет автоматически повышать качество передаваемого изображения и анализировать обрабатываемые кадры на предмет обнаружения и распознавания объектов интереса (автомобильные номера, лица людей) и анализа наблюдаемых сцен (слежение за объектами, распознавание опасных событий), что позволяет существенно сократить нагрузку на оператора системы видео-иаблюдения и повысить безопасность.

Эффективные алгортимы, решающие такие задачи, требуют значительных вычислительных ресурсов, которые также необходимы для сжатия передаваемого видеопотока с использованием современных стандартов видеокодирования МРЕС-4 и Н.264. Таким образом, возникает необходимость создания менее вычислительно затратных, но достаточно эффективных методов сжатия видеопоследовательностей.

Для видеопоследовательностей характерны пространственная и времен-

пая избыточности. Стандарты МРЕС4 и Н.264 осуществляют процедуру компрессии видео за счет сокращения пространственной избыточности кадра с помощью ортогональных преобразований и временной избыточности с помощью оценки и компенсации движения фрагментов между кадрами. Однако существующие подходы к синтезу алгоритмов оценки векторов движения, основанные на обработке видеопоследовательности в пространственной области приводят к весьма трудоемким вычислительным процедурам, иа которые может приходиться до 80% вычислительных ресурсов, необходимых для работы алгоритма сжатия в реальном времени. Таким образом, именно за счет оптимизации оценки движения между кадрами можно обеспечить значительное сокращение числа необходимых операций, что открывает возможность совместного использования сжатия видеопоследовательности и ее интеллектуального анализа.

Одним из перспективных направлений повышения эффективности процедур сжатия, восстановления и обработки видео является широкое применение обобщенных спектров в различных базисах. В качестве блочных ортогональных преобразований широко используются: дискретное косинусное,

целочисленное псевдокосинусное, Уолша-Адамара. В последнее время нояви-

лись работы о применении дискретного Чебышевского преобразования для данных целей.

Однако широкое применение спектральных алгоритмов обработки полей сдерживается недостаточной теоретической и экспериментальной проработкой большого числа вопросов. К ним относится возможность оценки сдвига фрагментов изображения, использующей неинвариантность обобщенных спектров к сдвигу подобластей. Данный вопрос связан с расчетом корреляции спектральных мод в подобластях поля с произвольным сдвигом и характеристиками спектральных функционалов, реагирующих па сдвиг. Без знания корреляции спектральных коэффициентов разложения поля затруднительно

рассчитать энтропию поля, т.е. определить предел информационного сжатия результатов регистрации поля. Еще одним фактором, усложняющим обработку полей, является их существенная неоднородность, поскольку сцены в кадре представлены объектами с разнообразной структурой. Существующие подходы к оценке параметров анизотропии поля не являются удовлетворительными, поскольку базируются на дифференциальных операторах. При наличии границ и контуров фрагментов данная математическая операция является некорректной. Поэтому необходимы новые подходы к оценке анизотропии поля, непротиворечивые с математической точки зрения и устойчивые к погрешностям наблюдения и вычислений. Одним из путей к новым методам оценки анизотропии является использование спектрального подхода.

Таким образом, анализ обобщенных спектров для сжатия, восстановления и обработки зарегистрированных полей является актуальным и практически значимым.

Целью диссертационной работы является синтез эффективных (по критерию точность - вычислительная сложность) алгоритмов оценки движения фрагментов полей в пространственной и спектральной областях и новых спектральных алгоритмов обработки полей. Для достижения этой цели были поставлены и решены следующие задачи:

1. Анализ методов оценки движения фрагментов полей при наличии аддитивного шума и фона.

2. Синтез алгоритмов оценки сдвига фрагментов поля в спектральной области, обладающих новыми возможностями по сравнению с пространственными алгоритмами, в том числе по надежности оценки, вычислительной эффективности.

3. Корреляционный анализ спектральных коэффициентов подобластей по-

ля при их произвольном сдвиге в различных базисах непрерывных и дискретных ортогональных преобразований.

4. Разработка методики анализа анизотропии полей по спектральным коэффициентам с целью адаптации алгоритмов сжатия, восстановления и обработки к неоднородности этого поля.

5. Разработка принципа видеокодирования, использующего спектральные алгоритмы обнаружения изменений в подобластях изображений, оценки и компенсации движения, сжатия и обработки восстановленных кадров.

Научная новизна:

1. Получены теоретические и экспериментальные зависимости коэффициентов корреляции спектральных коэффициентов подобластей поля с произвольным сдвигом в непрерывном и дискретном базисах.

2. Разработана методика расчета корреляции спектральных коэффициентов при неравномерной сетке отсчетов сигнала, которая применена к дискретному чебышевскому преобразованию.

3. Синтезированы и исследованы спектральные алгоритмы оценки сдвига фрагментов динамического поля при наличии аддитивного шума и неподвижного фона.

4. Предложен и подтвержден экспериментально способ определения анизотропии поля. На основе анализа анизотропии разработан алгоритм адаптивной коррекции эффекта Гиббса.

5. Реализован принцип видеокодирования со спектральным обнаружителем изменений на изображении, оценкой и компенсацией движения блоков между кадрами, кодирования/декодирования источника сигнала па

основе дискретного Чебышевского преобразования.

Практическая значимость. Результаты, полученные в диссертации, позволяют обосновать структуру и оценить характеристики нового принципа видеокодирования, основанного на широком применении спектральных алгоритмов сжатия, восстановления и обработки изображений. Полученные результаты направлены на повышение эффективности удаленного видеонаблюдения с использованием низкоскоростных, зашумленпых каналов, систем передачи мультимедийной информации, интеллектуальных систем технического зрения.

Результаты исследований внедрены в ОКР ЗАО «Кодофон».

На защиту выносятся следующие основные результаты и положения:

1. Алгоритмы оценки сдвига фрагментов поля в спектральной области, обладающие вычислительной эффективностью и повышенной надежностью поиска экстремума функционала сдвига.

2. Методика расчета зависимости корреляционных моментов спектральных коэффициентов подобластей поля с произвольным сдвигом в непрерывном и дискретном базисах, в том числе при неравномерной сетке отсчетов.

3. Подтверждение гипотезы, что дискретное Чебышевское преобразование (СОСТ) обеспечивает меньшую корреляцию спектральных мод как

внутри блока, так и между блоками с произвольным сдвигом по срав-

нению с известными ортогональными преобразованиями.

4. Новый способ определения анизотропии полей, а также новые метрики анизотропии, основанные на анализе обобщенных спектров, подтвержденные экспериментально.

5. Структура и программная реализация видеокодека на основе дискретного косинусного и Чебышевского преобразований, использующий спектральные алгоритмы обнаружения изменений в кадре, оценки движения блоков и обработки восстановленных изображений.

Апробация работы. Основные результаты диссертации докладывались и обсуждались на конференциях: Международные научно-технические конференции «Кибернетика и высокие технологии XXI века» (Воронеж, Россия, 2009-2011 гг.), Всероссийская научно-практическая конференция «Современные проблемы создания и эксплуатации радиотехнических систем» (Ульяновск, Россия, 2009 г.), Международные конференции «Цифровая обработка сигналов и ее применение» (Москва, Россия, 2010-2013 гг.), Международная научно-техническая конференция «Радиолокация, навигация, связь» (Воронеж, Воронеж, 2012 г.)

Публикации. Материалы диссертации опубликованы в 15 печатных работах, из них 5 статей в рецензируемых журналах, рекомендованных ВАК для публикации основных результатов диссертации, 9 статей в сборниках трудов конференций.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и библиографии. Общий объем диссертации 167 страниц, включая 57 рисунков и 9 таблиц. Библиография включает 81 наименование на 11 страницах.

Глава 1

Оптимальные и квазиоптимальные алгоритмы оценки сдвига подобластей поля

Среди различных способов наблюдения поля в оптической области наибольшее распространение получила регистрация пространственной структуры поля в дискретные моменты времени. Таким образом формируются кадры видеопоследовательности, которые обладают значительной информационной избыточностью. В современных видеокодеках существенное сжатие потока производится за счет удаления временной избыточности в видеопоследовательности [1]. Это достигается за счет применения оценки и компенсации движения фрагментов между кадрами [2-4]. Оценка движения позволяет сократить объем данных о межкадровой разности. Для сжатия видео дпиро-ко используется метод компенсации движения отдельных областей текущего кадра [2, 3]. Каждый кадр видеопоследовательности разбивается на множество неперекрывающихся квадратных областей заданного размера, называемых блоками изображения. При нахождении векторов движения для каждого блока обрабатываемого (анализируемого) кадра на предыдущем кадре (опорном) из блоков кандидатов выбирается тот, для которого функция различия принимает минимальное значение. Блоки кандидаты имеют тот же размер, что и блок для которого происходит оценка движения, но расположены с различными смещениями относительно этого блока, образуя область поиска. Смещение, соответствующее минимальному значению функции различия, и есть найденный вектор движения. Функция различия обычно вычисляется в пространственной области, т.е. оценивается разность между значениями блоков изображений. При помощи найденных векторов движения блоков и опорного кадра строится реконструированный кадр, который из-за наличия

движения между кадрами является более эффективным прогнозом дл^ обрабатываемого кадра, чем опорный кадр. Эффективный прогноз кадра позволяет передавать меньшее количество информации.

В работах [5, 6] показано, что дискретные преобразования в базисе ортогональных полиномов обладают свойством неинвариантности обощенньтх спектров к сдвигу сигналов. Это делает возможным реализацию спектральных алгоритмов оценки векторов движения фрагментов поля. Имеется два подхода к определению сдвига фрагмента. В первом ищется смещение отдельного блока целиком внутри области поиска. В этом случае формирование базисных функций не синхронизировано с границами блока в предыдущем кадре. Такой способ спектрального разложения называется асинхронным. Во втором случае определяется смещение фрагмента внутри блока по изменению спектра. Формирование базисных функций синхронизировано с границами блока в последовательности кадров. Такой способ спектрального разложения называется синхронным. На основе анализа синхронных обощенных спектров в [7] предложены алгоритмы оценки векторов движения в виде дискриминаторов.

В данной главе рассмотрен синтез и анализ алгоритмов оценки движения фрагментов полей при использовании обобщенных спектров блоков. Оценка параметра базируется на методе максимизации некоторой целевой функции (функционала). В качестве целевой функции берется логарифм функционала отношения правдоподобия или используются квазиправдоподобные алгоритмы.

1.1. Оптимальные алгоритмы оценки сдвига в

пространственной и спектральной областях при наличии шума

Пусть определен полезный сигнал в(г, ¿), г = (х,у), представляющий собой фрагмент пространственного сигнала в момент £ в области По (область поиска векторов движения) [7]. В момент £ + в подобласти П Е Г2о наблюдается поле (анализируемый кадр)

£(г,* + Д*) =в(г-т0,*)+97(г), (1.1)

представляющее собой смесь полезного сигнала5(г — то), смещённого на неизвестный вектор то = (тоа;,тоу), и флуктуационной помехи т?(г). Введение помехи обусловлено её неотделимостью от оптико-электронного преобразования сигналов и передачи их по каналам связи. Необходимо оценить неизвестный параметр сдвига то. В дальнейшем дискретная переменная времени £ не фигурирует и может быть опущена.

Для решения задачи оценки сдвига воспользуемся алгоритмом максимального правдоподобия, согласно которому в качестве целевой функции требуется сформировать логарифм функционала отношения правдоподобия (ЛФОП) и определить положение его максимума. Если гу(г) представляет собой гауссовский белый шум со спектральной плотностью мощности .Л/о/2, выражение для ЛФОП можно записать в следующем виде [8]

(£(ф(г - т)<1т -

о

п о

6'(г - т)2^г, (1.2)

и определить положение его максимума из системы уравнений правдоподобия

(6А(т, т0)/6тх) [т=Гт = 0, (¿Л(г, т0)/6ту) \т=тт = 0. (1.3)

12

Корректность использования гауссовского белого шума в качестве модели для г](г) обсуждалась в [9]. Наиболее общим видом шума, возникающего, например,