Статистический и информационный анализ обнаружения изменений в последовательности двумерных полей тема автореферата и диссертации по физике, 01.04.03 ВАК РФ

Булыгин, Алексей Владимирович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Воронеж МЕСТО ЗАЩИТЫ
2010 ГОД ЗАЩИТЫ
   
01.04.03 КОД ВАК РФ
Диссертация по физике на тему «Статистический и информационный анализ обнаружения изменений в последовательности двумерных полей»
 
Автореферат диссертации на тему "Статистический и информационный анализ обнаружения изменений в последовательности двумерных полей"

4612613

На правах рукописи

СТАТИСТИЧЕСКИЙ И ИНФОРМАЦИОННЫЙ АНАЛИЗ ОБНАРУЖЕНИЯ ИЗМЕНЕНИЙ В ПОСЛЕДОВАТЕЛЬНОСТИ ДВУМЕРНЫХ ПОЛЕЙ

01.04.03 - радиофизика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

1 1 НОЯ 2010

Воронеж-2010

004612613

Работа выполнена в Воронежском государственном университете.

Научный руководитель доктор физико-математических наук

Радченко Юрий Степанович

Официальные оппоненты: доктор технических наук,

Сирота Александр Анатольевич

кандидат физико-математических наук, Манелис Владимир Борисович

Ведущая организация Московский научно-исследовательский

телевизионный институт

Защита состоится 25 ноября 2010 г. в 1520 на заседании диссертационного совета Д 212.038.10 при Воронежском государственном университете по адресу: 394006, г. Воронеж, Университетская пл. 1, физический факультет, ауд. 435

С диссертацией можно ознакомиться в библиотеке Воронежского государственного университета.

Автореферат разослан 19 октября 2010 г.

Ученый секретарь диссертационного совета

В.К. МАРШАКОВ

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы.

Современные системы передачи информации функционируют в условиях, когда все возрастающие потоки данных передаются по каналам, пропускная способность которых ограничена действующими стандартами на частотные диапазоны, электромагнитной совместимостью, наличием помех.

Значительную часть передаваемой информации занимает мультимедиа контент, наиболее весомой составляющей которого является изображения и видео. Этот факт показывает важность и необходимость совершенствования технологий сжатия именно мультимедийных данных и в особенности динамических изображений. Для этого разработаны стандарты сжатия видео МРЕвМ, Н.261-264. Наиболее совершенные кодеки МРЕО-4, Н.264/АУС являются эффективными по критерию коэффициент сжатия потока — качество восстановленного видео, но весьма сложными в алгоритмическом и вычислительном плане. Телекоммуникационные устройства, использующие данные стандарты сжатия, предъявляют высокие требования к процессорам видеообработки, обладают повышенным энергопотреблением. Поэтому они не могут быть использованы, например, в мобильных и автономных устройствах передачи или хранения видеоинформации.

Основным недостатком существующих алгоритмов сжатия является способ кодирования видео, основанный на оценке векторов сдвига фрагментов изображения от кадра к кадру, предсказание текущего кадра по предыдущим кадрам и преобразования ошибки рассогласования с помощью дискретного косинусного преобразования фСТ). Еще одной особенностью существующих алгоритмов сжатия видео является их детерминированный характер, поскольку они разработаны без учета влияния помех. Поэтому возникает необходимость в разработке новых принципов пространственно-временной обработки зарегистрированных оптических полей, сочетающих достаточную вычислительную простоту с эффективным удалением информационной избыточности в видеопотоке и устойчивостью к наличию помех. Данная задача, во-первых, может решаться путем использования новых видов ортогональных преобразований, отличных от ДКП. Во-вторых, синтез алгоритмов должен основываться на методах статистической теории принятия решений, приводящих к оптимальным алгоритмам. Причем данные алгоритмы должны быть устойчивыми к помехам различной природы и априорной недостаточности относительно характеристик обрабатываемых полей. В-третьих, должны быть разработаны методы статистического и информационного анализа новых алгоритмов обработки, сжатия и восстановления пространственно - временных полей (динамических изображений).

Целью исследования является: синтез и анализ спектральных алгоритмов многоальтернативного обнаружения изменений в зарегистрированных полях (видеопоследовательностях), разработка методов расчета количества информации на основе анализа спектров гауссовских полей, обнаружение и оценка изменений в последовательности изображений с нечеткой математической моделью. Для реализации этой цели в диссертации поставлены и решены следующие задачи:

1. Синтез алгоритмов многоальтернативного обнаружения изменений в гауссовском поле на основе обобщенного спектрального описания.

2. Разработка методов анализа и получение расчетных соотношений для характеристик многоальтернативного обнаружения изменений в динамических изображениях, а также экспериментальная проверка эффективности предложенных алгоритмов.

3. Исследование статистических характеристик спектральных коэффициентов обобщенных рядов Фурье и дискретного спектрального преобразования. Разработка метода расчета количества информации и предела сжатия в изображении на основе статистического анализа спектров.

4. Разработка алгоритмов обнаружения и оценки изменений в полях с неопределенными статистическими характеристиками и нечеткой математической формализацией — и их экспериментальное исследование.

5. Определение методами статистического моделирования и натурных экспериментальных исследований применимости полученных алгоритмов и расчетных соотношений.

6. Разработка рекомендаций по алгоритмической структуре и рабочим параметрам для перспективного принципа видеокодирования МООСТ.

Методы проведения исследования. При решении поставленных задач в диссертации используются методы статистической радиофизики, математического анализа, теории вероятностей, математической статистики, случайных процессов, теории статистических решений. При экспериментальных исследованиях использовались реальные видеопоследовательности. При разработке программного обеспечения активно использовались методы объектно-ориентированного программирования на языке С++, а также процедурное программирование в пакете МАТЪАВ.

Научная новизна. В данной работе получены новые результаты:

1. Синтезирован блочный спектральный алгоритм многоальтернативного обнаружения изменений в последовательности полей на основе дискретного чебышевского (ОЭСТ) и дискретного косинусного преобразований (ОСТ).

2. Получены аналитические характеристики спектральных алгоритмов при попарной проверке гипотез: а) нет изменений в блоке; б) изменения, связанные со сдвигом; в) смена сюжета; г) пропадание блока - в том числе при использовании части спектральных коэффициентов. Показано, что характеристики устойчивы к выбору порога.

3. Предложен алгоритм обнаружения изменившихся фрагментов последовательности кадров на основе статистической сегментации. Алгоритм основан на анализе временных корреляционных матриц пространственных отсчетов поля и не требует знания их законов распределения.

4. Получены формулы для корреляционных моментов спектральных коэффициентов обобщенных рядов Фурье и дискретного косинусного преобразования гауссовских полей. Определены условия, когда внутриблочные и межблочные корреляционные моменты для спектральных коэффициентов пренебрежимо малы.

5. Разработан метод расчета количества информации (энтропии) цветного изображения на основе спектрального подхода.

6. Подтверждена экспериментально работоспособность синтезированных алгоритмов и методов их анализа, а также способов расчета энтропии изображения.

7. Предложены непараметрические критерии для обнаружения изменений в полях с неизвестной статистикой и нечеткой математической формализацией.

8. Даны рекомендации по алгоритмической структуре и рабочим параметрам нового принципа видеокодирования MGDCT.

Практическая ценность работы. Проведенный в работе цикл теоретических и экспериментальных исследований позволил обосновать структуру и задать рабочие параметры нового перспективного видеокодека MGDCT, обладающего хорошими характеристиками битрейт/качество в широком диапазоне скоростей передачи информации. Предложенные спектральные алгоритмы обработки и сжатия видеопоследовательностей просты в реализации, устойчивы к воздействию помех и искажений, а также к априорной неопределенности вида и свойств изображений.

Достоверность. Достоверность результатов, полученных в диссертационной работе, подтверждается корректностью использования математического аппарата, совпадением новых результатов с известными, результатами статистического моделирования и экспериментальными исследованиями на реальных видеопоследовательностях.

Внедренне научных результатов. Полученные в диссертации результаты исследований внедрены в ряде ОКР ЗАО «Кодофон», а также в учебном процессе в Воронежском госуниверситете.

Апробация работы. Основные положения диссертационной работы были представлены в виде докладов и обсуждались на:

- VIII, IX, X, XI и XII Международных конференциях «Цифровая обработка сигналов и ее применения - DSPA», Москва, 2006,2007,2008,2009,2010.

- XII, XIII, XIV Международных научно-технических конференциях «Радиолокация, навигация и связь», Воронеж, 2006, 2007, 2008.

- VII Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций», Самара, 2006.

- XI Международной научно-технической конференции «Кибернетика и высокие технологии XXI века», Воронеж, 2010.

Публикации. По теме диссертации опубликовано 14 печатных работ, три из которых в журналах, рекомендованных ВАК РФ для публикации результатов диссертационных работ.

Объем и структура работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы из 76 наименований и 3 приложений. Объем диссертационной работы вместе с приложениями составляет 205 страниц, в том числе 175 страниц основного текста, 8 таблиц и 53 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Во введении к диссертации обсуждается актуальность темы исследования, определяются цели и задачи предстоящих исследований. Рассматриваются вопросы научной новизны и практической значимости полученных в работе результатов.

В первой главе рассматриваются основные принципы кодирования источника сигнала в информационных радиотехнических системах. Рассчитаны объемы передаваемой мультимедийной информации и показана необходимость совершенствования алгоритмов компрессии. Дан обзор современных систем беспроводной передачи данных и их краткие характеристики. Приведен обзор стандартов сжатия видеопоследовательностей MPEG 1-4, Н.261-264. Рассмотрены дискретные ортогональные преобразования, используемые при компрессии: DCT, Wavelet, а также чебышевское преобразование GDCT. Выделены свойства и особенности поведения спектров GDCT, используемые в дальнейших исследованиях. Рассмотрены принципы построения видеокодека MGDCT.

Во второй главе выполнен синтез и анализ многоальтернативного обнаружения изменений в пространственно - временном поле. Рассмотрена общая постановка задачи, получены блочные спектральные алгоритмы обнаружения изменений. Разработан алгоритм обнаружения изменений в видеопоследовательности на основе статистической сегментации поля.

Постановка задачи. Пусть в подобласти г=(х,у)еП (блоке) наблюдается поле s(0(r,ti), представляющее собой фрагмент u(r)In(r)5(t-t;) пространственно -временного сигнала в дискретный момент времени tj, i=0,l,.... Здесь In(r) индикаторная функция подобласти. Кроме того, полагаем, что совместно с сигналом присутствует аддитивный белый гауссовский шум rj(r) с моментами <t|(r)>=0, <r|(r,)r|(r2)>=No8(ri-r2). Здесь <•> означает статистическое усреднение. При сравнении отдельного блока (i-l)-ro и i - го кадров можно выдвинуть гипотезы:

Н,: 4W = s,(r) + n(r), s,(r) = s(i)(r) = s(M)(r),

H2: £(r) = s2(r,x) + n(r), s2(r|x) = s(l)(r) = 8(М,(г,т) + Sf{r,x),

H3: ^(r) = s3(r) + л(г), s3(r) = s(l)(r) * s(|-"(r,x), (1)

H„: £(r) = n(r), s0(r) = 0.

которые отражают: неизменность сигнала, его сдвиг, появление другого сигнала неизвестной формы или пропадание сигнала. Необходимо на основе наблюдения с,(г) принять или отвергнуть основную гипотезу Hi.

Обработка сигнала s(l,(r) неизвестной формы в общем случае не имеет решения без использования некоторых дополнительных факторов. Один из способов преодоления данной априорной неопределенности является параметризация сигнала и, в частности, его представление в виде обобщенного ряда Фурье по некоторому базису (pk,m(r). Тогда для разных гипотез сигналы могут быть представлены следующим образом:

s,« = Sc^(r), s2(r[T) = £cS(T)<pta(r), s3(r) = XOPkm(r). (2)

k.m k,m k.m

Соответственно E(r) = ^Xkmtpkm(r), r|(r)= 2/|ктФкп/г) - разложение наблюдаемого

k,m kjn

поля ^(r) и его помеховой составляющей r|(r).

Блочные спектральные алгоритмы обнаружения изменений. Решение задачи проверки гипотез основывается на асимптотически оптимальном алгоритме максимального правдоподобия

тахЬп(^|С|п)) —тахЬу(^|с(у>) >ЬПУ, п * V, п,у = 1,2,3, тахЬ„(ф(п))>Ь0п

Здесь Ь„(^|С|П)) - логарифм функционала отношения правдоподобия (ЛФОП) для гипотезы Н„ относительно сигнала 8„(г) со спектром С<л)={Скт,п)} • Если для какой-нибудь гипотезы спектр С(п) известен точно (простая гипотеза), то максимизация не производиться, и в ЛФОП используется истинное значение параметра. Спектр С|3> - неизвестен.

Учитывая спектральное представление сигнала для каждой гипотезы, получаем набор решающих правил:

(НЬН2): тах

(Н„Нз): Е(С^-ХЬ„)2>Ь13, (Н0,Нз): ^(Х^)2^,

к,т=0 к,т=0

(НЬН0): тах £ (с^-Х^)2 >1^.

к,т=() 1 к,т=0

Для решающих правил (4) в работе найдены распределения соответствующих статистик и вычислены вероятности ошибочных решений Рпч, для каждой пары гипотез (Нп, Ну).

Для процедуры сжатия наибольший интерес представляет проверка гипотез (Н|, Н3). Ввиду того, что величина N0, определяющая мощность помех, на практике обычно неизвестна, в работе предложено применять алгоритмы: м м

2 ^кга _ ^"кт) н ^ _ ^ кт) н

оп = -

Найдены вероятности ошибочных решег—'

Результаты исследований характеристик обнаружений изменений в блоках. Для оценки возможности использовать предложенные алгоритмы были проведены экспериментальные исследования на видеопоследовательностях.

В ходе эксперимента были подсчитаны значения статистик и (5) для яркостных компонент для блоков двух разнесенных кадров видеопоследовательности 0 - ] = 2). В качестве анализируемых блоков, были выбраны блоки, характеризующие такие типы изменений как, практически

неизменные, слабо и сильно изменяющиеся блоки. Для каждого типа изменения находились гистограммы указанных статистик и их средние значения.

Установлено, что значения статистик для подвижных и неподвижных блоков отличаются на 2-3 порядка. Это делает некритичной проблему выбора порога, разделяющего подвижные и неподвижные блоки. Диапазон изменений метрики D0 примерно в 1,7-2 раза больше, чем у метрики DE. Поэтому статистика D0 предпочтительна. Вывод получен на основе анализа различных видеопоследовательностей. Визуализация результатов работы алгоритмов (5) приведена на рисунке 1, где выделены изменившиеся блоки.

Алгоритм обнаружения изменений в кадре на основе сегментации поля. В диссертационной работе решена задача обнаружения изменений в кадре на основе статистической сегментации и проверки гипотез о принадлежности каждой точки поля к сигналу или фону без ограничений на статистику поля.

Пусть в каждый момент времени t;, i = 0,1,... задано сечение пространственно-временного поля u(,)(x, у)=и(х, у, ti) в каждой точке (хк, уг).

Сечение uw(x, у) в комбинации с шумом r|(l)(x, у) задает наблюдаемое дискретное поле, называемое кадром:

^"'Оь Уг) = (s '(x, у) + г(,)(х, у)) П Т1("(хь уг). (6)

Здесь sw(x, у) = и('!(х, у)1(|'(х, у) - интересующий нас изменяющийся фрагмент поля; г0)(х, у) = u(l)(x, у) (1 - 1(,)(х, у)) - фон; 1(|)(х, у) - индикаторная функция подобласти, занятой анализируемым фрагментом.

На основе анализа кадра необходимо вынести решение по двум гипотезам: принадлежит ли точка (хк, уг) поля к сигналу или к фону.

Н0: ^(,)(xk, yr) е I(i,(xb yr), Н,: if (xb у,) е (1 - 1<"(хк, у,)). (7)

Статистическая сегментация, основана на анализе временной выборочной корреляционной функции:

K(i, j; xk, yr) = <е\хь Уг), yr)> =(1/N)|;|;^i4xk,yr)^)(xl(,yr), (8)

i=0 j=0

где i, j = 0, 1, ... N - 1, N - количество временных сечений поля Е, для расчета выборочных корреляционных функций. Алгоритм сегментации содержит два этапа: этап обучения и этап принятия решения. Сначала необходимо получить временные выборочные корреляционные функции вида (8), усредненные по группе точек, относящихся к фону Kb(i, j; xk', уг>). После этого для этапа принятия решения вычисляются временные выборочные корреляционные функции (8) каждой точки (хк, уг) поля ^(l>(xk, yr), i = 0..N-1.

Далее для каждой точки (хк, уг) поля ¡;(хк, уг) вычисляется мера близости |i (при помощи матричной нормы Фробениуса) усредненных временных выборочных корреляционных функций фона и временных выборочных корреляционных функций текущей точки (хк, уг):

H|K(i,j;xk,yr)-Kb(i,j;xk,,y,)||= 22|K(t1,t2;xk,yr)-Kb(t1,t2;xl,y,)|2

V tl-012=0

(9)

Если выполняется неравенство ц > Ь (Ь -порог меры близости, полученный эмпирическим путем), то принимается гипотеза Н0 о принадлежности текущей точки (хк, уг) поля ^(1)(хк, уг) к сигналу, иначе принимается альтернатива Н] о принадлежности точки (хк, уг) поля ^(1>(хк, уг) к фону. В качестве дополнения к

алгоритму обнаружения используются алгоритмы, позволяющие заключать изменившиеся фрагменты в рамки и следить за их перемещением с помощью фильтра Калмана. Иллюстрация работы алгоритма представлена на рисунке 2, где изменившиеся области выделены белым цветом.

В третьей главе выполнен анализ информационных характеристик сигналов и полей на основе спектрального представления. Предложен метод расчета энтропии, основанный на вероятностном анализе спектральных коэффициентов. Для этого рассмотрены вопросы внутриблочной и межблочной корреляции спектральных коэффициентов при непрерывных и дискретных ортогональных преобразованиях, определены условия, когда корреляцией можно пренебречь.

Корреляция спектральных коэффициентов поля.

Рассмотрим случайные сигналы Б(а\г), а=1,2 - номер соответствующего блока, заданные следующим образом:

8<с5(2) = 8(а,о(2) + а^(а)(2), (10)

где нормированный аргумент г принадлежит некоторой области П(а) (П е 9?), определяющей блок сигнала; 8<а)0(г) - детерминированная компонента сигнала; а - среднеквадратическое отклонение Б(г); - стационарный в широком

смысле случайный процесс, имеющий следующие характеристики: <£(г)> = 0,

Пусть {фш(г)} - ортогональный базис. Тогда коэффициенты С(а)т спектрального разложения сигнала примут следующий вид:

(£> = [ 8(">(2) • <?т(г)й2 = с£» + а • г£>, (11)

_ О(о)

здесь С^1 и - детерминированная и случайная компонента

коэффициента спектрального разложения

Корреляционный момент для спектральных коэффициентов (11) в общем случае имеет вид:

<((£> -С£>).(С® -с<»)> = а2-<еЧГ >• (12)

Здесь а, р = 1, 2.

Внутриблочная корреляция спектральных коэффициентов. Рассмотрим сначала непрерывные ортогональные преобразования. Тогда корреляционный момент случайных компонент коэффициентов спектрального разложения одного блока примет вид:

< • С >= }} г 1)Фт(г)Фк(2+«¿тек = | Я(| т ¡)м/тк(|т1)(1+(-1Гк)<к, (13)

здесь Утк(х)= {фп,(2)-фк(2 + т)ск и учтено, что утк(т) = [5^(т)Г"к -Ч/тк(|т|).

Выражение (13) можно переписать в виде: 0, при (т+к) не кратных 2,

<счг> =

2-|К(|т|)-»|/тк(|т|)<1т, при (т+к) кратных 2. (14)

Отсюда следует, что четные и нечетные спектральные коэффициенты

попарно некоррелированы между собой, при этом в общем случае наблюдается незначительная попарная корреляционная зависимость между собой только четных или нечетных мод.

Моменты и внутриблочная корреляция ненулевых спектральных мод при ОСТ преобразовании. Рассмотрим одномерный случай разложения при помощи дискретного косинусного преобразования. Принцип решения аналогичен предложенному выше с учетом дискретного характера процессов.

В качестве модели корреляционной функции Я возьмем функцию, которая обычно используется для гауссовских марковских процессов:

ВД - 0 = ехр(-[)' - ¡1-Дт/ю) = рЬ",р = ехр(-Дт/то). (15)

Здесь т0 - параметр дискретной корреляционной функции Я, Ат - шаг дискретизации, р - коэффициент корреляции между соседними отсчетами.

В случае дискретного косинусного преобразования спектральные коэффициенты для одного блока будут выражаться следующим образом:

С^)=уХ8гсо8(Л-т.^) = уС|па)+уа-е)- 06)

¡=1 п

Здесь у - константа преобразования ОСТ. Выражения для дисперсии, корреляционного момента и коэффициента корреляции случайных компонент Ё,(а'т и имеют вид:

ы Н п • п

к =< е • С" >= 12>!Н • соз(я • т. . С08(Я• к■ .

1 ' '' Г» п

¡=1 Ктк =

К

Я(р,0.3)

Я(р,0.4) Й(р,0.5)'

"V. ч-

ч Ч. V /

К(р.1,5)

(17)

(18) (19)

-0.1

-0.2

.X' у .............

О 0.2 0.4 0.6 0.8 0 0.2 0.4 Об 0.8

Р Р

а) б)

Рис. 3.

Как показано выше коэффициент корреляции между четными и нечетными спектральными коэффициентами равен нулю.

На рисунках За) и 36) представлены графики зависимости коэффициента корреляции спектральных коэффициентов нулевого и первого с остальными от р. Наибольший коэффициент корреляции между спектральными коэффициентами одного блока не превосходит по модулю 0,25 - 0,3, что

свидетельствует о несущественной статистическои зависимости, которой на практике можно пренебречь.

Моменты и межблочная корреляция нулевой спектральной моды при ИСТ преобразовании. На практике особый интерес представляет нулевой спектральный коэффициент С(а)о разложения (16), который может внести статистическую зависимость спектров между блоками.

Рассмотрим коэффициент корреляции нулевых спектральных коэффициентов соседних блоков. Пусть блок имеет размерность п элементов, тогда нулевые спектральные коэффициенты соседних блоков можно описать как:

Со' =У =у-Со' +

Математическое ожидание спектрального коэффициента < с;,"» >= С(0о) = -/¿Б"",,,, а = 1,2, а дисперсия:

СП:

О(СП=у2<лх^>), (21)

1=1 ¡=1 р!

При корреляционной функции (15) выражение (21) принимает вид:

0(^<С1)) = 2• (п + ^(п-0• р')-п = -—^■ [р°+1 + п- п- р-р]-п. (22) ¡=| (Р — и

Учитывая, что ОЕ,'1' = Э^'2', коэффициент корреляции между нулевыми спектральными коэффициентами (20) соседних блоков будет иметь следующий вид:

^ (УЧ<Я) р(р"-1У

О(^) 2р(р" -1)-п(р2 -1)

А »(р)

-.(23)

Рис. 4.

С<2'к дает значения,

На рисунке 4 представлен график зависимости коэффициента корреляции (23) от коэффициента корреляции между соседними отсчетами. Из графика видно, что при р < 0,8 коэффициент корреляции нулевых спектральных коэффициентов соседних блоков не превосходит 0,3.

Аналогичный расчет межблочной корреляции ненулевых спектральных коэффициентов Сп>т близкие к нулю.

Расчеты и исследования энтропии спектров цветных изображений.

При сжатии изображений, вычисление энтропии квантованных спектральных коэффициентов, позволяет оценить предельную степень сжатия изображения, не прибегая к энтропийным кодерам.

Для расчета энтропии в общем случае необходимо использовать совместное распределение вероятностей значений спектральных коэффициентов. Выше было показано, что при гауссовской модели поля коэффициент корреляции между спектральными коэффициентами не превосходит по модулю уровня 0,2 - 0,3. Поэтому их можно считать

статистически независимыми. Тогда энтропию изображения для яркостной компоненты Y можно рассчитывать по формуле:

HY_DCT=-Zp.-1°82(P,). (24)

t=i

где Р, - вероятность соответствующего значения квантованных спектральных коэффициентов, г - число уровней квантования.

Для цветоразностных компонент U и V число спектральных коэффициентов уменьшается в % раз за счет субдискретизации. Поэтому энтропия для них рассчитывается по формуле:

Hu,v=-1ZP,-log2(Pt)- (25)

X t=i

Расчет суммарной энтропии в битах на пиксель Hj алгоритма DCT для всего изображения производится исходя из аддитивных свойств информации:

Не = (Ну + Ни + Ну). (26)

Отличие расчета общей энтропии Hjgdct Для алгоритмов GDCT состоит в следующем. Исходное изображение после разбиения на блоки размером NlxNl преобразуются в блоки NxN из чебышевских сэмплов. Обозначим Nl/N = X. Тогда значение энтропии для всего изображения запишется в виде: HD odct = (Ну + Ни + Hv)/A. . (27) ""

На рисунке 5 приведен пример зависимости экспериментальной энтропии Н* от теоретической Не (26), (27). Из графиков видно, что Н*я Hv.

Таким образом, было экспериментально подтверждено, что при расчете энтропии квантованных спектральных коэффициентов изображения, внутриблочной и межблочной корреляцией можно пренебречь. При этом для преобразования GDCT наблюдается более сильная декорреляция спектральных коэффициентов, чем при DCT.

В четвертой главе решается задача обнаружения и оценки структурного подобия полей (изображений).

В этой главе приведен краткий обзор существующих критериев структурного подобия. Предложены непараметрические критерии структурного подобия. Исследовано влияние на качество изображения блочности, импульсных и квазигауссовых помех. На основе анализа зависимости качества от энтропии изображения определены структура и параметры MGDCT.

Непараметрические критерии структурного подобия.

В работе предлагается два вида критерия структурного подобия полей (изображений) на основе непараметрических методов (Mean Nonparametric Structural Similarity): MNSSIM1 и MNSSIM2, которые рассчитываются по формуле:

MNSSIM=-Yli(X,Y).ci(X,Y)-si(X,Y),

где X и У - векторы значений яркости в ]-ом блоке, V - число блоков.

Для МШ81М1 предлагается использовать функционалы:

1(Х,У)= 2"упу+С) С(Х,У)= 2с™хОТ"У+С2 (х у) = к (Х,У). (28) ^ тх2+ту2+С, ' атх+сгту+С2 4 ' ' у '

Здесь тх=тесНап(Х) , ту=тес11ап(У) - медианы векторов значений

яркости, отпх2=тесИап[(Х-тх)2], отпу2=тесНап[С¥'-ту)2], - ранговый

коэффициент корреляции Спирмена. Константы Сь Сг « 1. Для М№81М2 предлагается использовать вместо медианных оценок выборочные средние и выборочные дисперсии блоков. В работе проведено исследование влияния импульсных помех, блочности на качество восстановленного изображения с использованием известных критериев качества МБЭМ, МЕБЭШ и критериев МЫ881М1 и МЫ881М2. На рисунке 6 приведено изображение «Лена» при наличии импульсной помехи с вероятностью поражения пикселя р = 0.05 и соответствующие значения критериев.

Рис. 6. MSSIM=0,315; MESSIM=0,331; Рис. 7. MSSIM=0,634; MESSIM=0,578;

MNSSIM 1=0,899; MNSSIM2=0,902. MNSSIM1=0,073; MNSSIM2=0,079.

На рисунке 7 изображение «Лена», восстановленное после максимального сжатия при помощи JPEG. Как следует из рисунков 6, 7, известные критерии MSSIM и MESSIM заметно занижают значение качества изображения, а MNSSIM 1 и MNSSIM2 дают значения более адекватные зрительному восприятию.

При исследовании влияния блочности на качество восстановленного изображения использовались критерии MSSIM, MESSIM, MNSSIM 1, MNSSIM2 и алгоритмы сжатия GDCT и JPEG.

На рисунке 8 представлена зависимость названных критериев от энтропии (в бит/пиксел) для изображения «Лена», сжатого и восстановленного с помощью алгоритма GDCT.

В результате исследований установлено, что непараметрические критерии имеют большой диапазон изменений при изменении степени сжатия (энтропии), что говорит о чувствительности этих критериев к блочным искажениям. Кроме того, непараметрические критерии более адекватны к зрительному восприятию при наличии импульсных помех.

При наличии квазигауссовой помехи предлагаемые и известные критерии

дают близкие значения. Полученные данные свидетельствуют о том, что непараметрические критерии могли бы найти свое применение для обнаружения отличий в изображениях, подверженных искажениям различной природы и отслеживания контекстуального подобия изображений.

1,00 0,90

0,ВО 0,70 0,60 0,50 0,40 0,30 0,20 0,10 4,1:

0.662

Рис. 8. Рис. 9.

Связь структурного подобия с энтропией. В работе выполнен сравнительный анализ двух способов сжатия, основанных на ОСТ и ООСТ по параметрам энтропия - структурное подобие. Получены зависимости структурного подобия от энтропии при различных размерах блока, значениях коэффициента сэмплирования, методов интерполяции сэмплов. На рис. 9 приведен пример такой зависимости. Исследования показали, что при малой степени сжатия (больших Н) БСТ обеспечивает несколько большее качество восстановленного изображения. Но при достаточно сильном сжатии вОСТ предпочтительно.

Проведенные исследования позволили предложить структуру, выбрать параметры и оценить характеристики нового способа видеокодирования МвБСТ.

В заключении подведены итоги по диссертационной работе в целом и сформулированы основные результаты, которые сводятся к следующему.

1. В предположении аддитивной гауссовой модели поля синтезированы спектральные алгоритмы многоальтернативного обнаружения изменений в блоках поля: пропадание, сдвиг, смена полезного сигнала. Алгоритмы обнаружения мало критичны к выбору порога.

2. Получены формулы для законов распределения решающих статистик и характеристик обнаружения. Установлено, что обнаружение изменений можно производить по значительно усеченному спектру.

3. Предложен новый алгоритм обнаружения изменений в последовательности полей на основе статистической сегментации фрагментов. Алгоритм основан на анализе корреляционных свойств одноименных отсчетов в последовательности полей, не требует аддитивности сигнала, фона и шума, а так же знания закона распределения поля.

4. Разработана методика расчета внутриблочной и межблочной корреляции спектральных коэффициентов гауссовых полей. Определены условия, при которых корреляцией между спектральными модами обобщенных рядов Фурье и дискретного спектрального преобразования можно пренебречь.

5. Разработан метод расчета количества информации (энтропии) в цифровых изображениях на основе спектров отдельных блоков. Экспериментально установлено, что метод позволяет рассчитывать энтропию и предельный коэффициент сжатия реальных изображений.

6. Предложен новый непараметрический критерий MNSSIM структурного подобия полей с неопределенными статистическими характеристиками и нечеткой математической формализацией. Показано, что предлагаемый критерий обладает более широкой областью применения по сравнению с существующими.

7. Получены зависимости структурного подобия восстановленного после сжатия изображения от энтропии. На основе сравнительного анализа способов кодирования, использующих DCT и GDCT, определены области, где каждый их них обладает преимуществом.

8. Экспериментальные исследования, выполненные на реальных видеопоследовательностях, позволили не только произвести апробацию разработанных методов статистического и информационного анализа полей, но и получить ряд практических рекомендаций по структуре и параметрам нового принципа видеокодирования MGDCT.

Разработанные теоретические методы анализа обнаружения изменений в последовательности полей отличаются экономичностью, имеют достаточно общий характер и могут быть использованы в задачах синтеза и анализа различных радиофизических систем передачи мультимедийной информации.

Список публикаций:

1.Булыгин A.B. Исследование спектрального алгоритма обнаружения изменений в видеопоследовательности / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // Известия ВУЗов. Радиоэлектроника. - 2009. - №7. - С. 49-59.

2. Булыгин A.B. Сравнительный алгоритм сжатия изображений на основе дискретного косинусного (DCT) и чебышевского (GDCT) преобразований / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // Цифровая обработка сигналов. - 2006. - №4. - С. 15-19.

3. Булыгин A.B. Сравнительный анализ модификаций индекса структурного подобия / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // Цифровая обработка сигналов. - 2008. - №4. - С. 11-14.

4. Агибалов A.A. О взаимосвязи информационных и точностных характеристик восстановленных после сжатия изображений / A.A. Агибалов, A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // 13 международная конференция «Радиолокация, навигация, связь». -Воронеж, 2007. - Т. 1.-С. 152-162.

5. Булыгин A.B. Быстрые алгоритмы многоальтернативного обнаружения изменений при кодировании динамических изображений / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // 7 международная конференция «Проблемы техники и технологии телекоммуникаций». - Самара, 2006. -С. 52-54.

6. Булыгин A.B. Методы препарирования и обработки изображений в системах видеонаблюдения с автоматическим принятием решений / A.B. Булыгин, Ю.С. Радченко, О.В. Шульгина // 11 международная конференция «Кибернетика и высокие технологии XXI века». -Воронеж, 2010. - С. 626-635.

7. Булыгин A.B. Модификация индекса структурного подобия (MSSIM) на основе методов непараметрической статистики / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // Труды РНТО РЭС имени A.C. Попова -Москва, 2008. - Выпуск X - 2. - С. 505-508.

8. Булыгин A.B. О выборе параметров алгоритма сжатия изображений GDCT / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // 12 международная конференция «Радиолокация, навигация, связь». -Воронеж, 2006.-T. 1.-С. 129-134.

9. Булыгин A.B. Обнаружение, выделение и сопровождение изменившихся объектов в видеопоследовательности / A.B. Булыгин, C.B. Миляев // Труды РНТО РЭС имени A.C. Попова - Москва, 2010. - Выпуск XII - 2. -С. 123-126.

10. Булыгин A.B. Подсистема спектрального обнаружения межкадровых изменений в кодеке MGDCT/ A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // Труды РНТО РЭС имени A.C. Попова - Москва, 2009. -Выпуск XI - 2. - С. 424-427.

11. Булыгин A.B. Принципы построения комбинированного видеокодека MGDCT / A.B. Булыгин, Ю.С. Радченко, C.B. Сохнышев // Труды РНТО РЭС имени A.C. Попова - Москва, 2010. - Выпуск XII - 2. - С. 151-154.

12. Булыгин A.B. Спектральный алгоритм обнаружения изменений в видеопоследовательности / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко //14 международная конференция «Радиолокация, навигация, связь». -Воронеж, 2008.-T. 1.-С. 129-134.

13. Булыгин A.B. Сравнение алгоритмов сжатия изображений на основе чебышевского (GDCT) и дискретного косинусного (DCT) ортогональных преобразований / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // Труды РНТО РЭС имени A.C. Попова - Москва, 2006. -Выпуск VIII - 2. - С. 369-372.

14. Булыгин A.B. Экспериментальный кодек чебышевского сжатия/восстановления изображений (GDCT) и программный комплекс его исследования / A.B. Булыгин, Т.А. Радченко, Ю.С. Радченко // Труды РНТО РЭС имени A.C. Попова - Москва, 2007. - Выпуск IX - 1. -С. 208-211.

Работы № 1, 2, 3 опубликованы в журналах, рекомендованных перечнем ВАК РФ.

Подписано в печать 13.10.10. Формат 60*84 '/|б- Усл. печ. л. 0,93. Тираж 80 экз. Заказ 1304

Отпечатано с готового оригинала-макета в типографии Издательско-полиграфического центра Воронежского государственного университета. 394000, Воронеж, ул. Пушкинская, 3.

 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Булыгин, Алексей Владимирович

Введение.

1. Принципы кодирования источника сигнала в информационных радиотехнических системах.

1.1. Радиосистемы передачи мультимедийной информации.

1.1.1. Обобщенная структура системы передачи информации.

1.1.2. Инфомационные объемы мультимедийных приложений.

1.1.3. Современные системы передачи информации и их характеристики.

1.2. Существующие стандарты сжатия видео.

1.2.1. Принципы кодирования видеоизображений.

1.2.2. Семейство стандартов MPEG.

1.2.3. Семейство стандартов Н.26х.

1.3. Ортогональные преобразования сигналов и полей.

1.3.1. Ортогональное и биортогональное векторное преобразование сигналов.

1.3.2. Полиномиальное преобразование.

1.3.3. Дискретные преобразования сигналов DCT и Wavelet.

1.3.4. Дискретное чебышевское преобразование GDCT.

1.4. Структура и свойства спектров сигналов и полей.

1.5. Принцип видеокодирования MGDCT.

1.5.1. Особенности системы видеокодирования MGDCT.

1.5.2.Этапы кодирования MGDCT.

2. Синтез и анализ многоальтернативного обнаружения изменений поля.

2.1. Постановка задачи обнаружения: модели изменений.

2.2. Синтез блочных спектральных алгоритмов обнаружения изменений поля.

2.2.1. Оптимальные алгоритмы.

2.2.2. Квазиоптимальные алгоритмы.

2.3. Характеристики многоальтернативного обнаружения изменений в блоках.

2.3.1. Вероятности ошибочных решений при двух гипотезах.

2.3.2. Вероятности ошибок в многоальтернативном случае.

2.4. Экспериментальное исследование характеристик обнаружения изменений в блоках.

2.5. Алгоритм обнаружения изменений на основе сегментации поля.

3. Анализ информационных и статистических характеристик сигналов и полей на основе спектрального описания.

3.1. Информационное описание полей в спектральном представлении

3.2. Внутриблочная корреляция спектров при непрерывных ортогональных преобразованиях.

3.2.1. Спектральное разложение случайного поля в обобщенные ряды Фурье.

3.2.2. Корреляция спектральных коэффициентов при разложении по базису с неограниченной областью определения.

3.2.3. Корреляция спектральных коэффициентов при разложении по базису с ограниченной областью определения.

3.3. Межблочная корреляция спектральных коэффициентов при непрерывных ортогональных преобразованиях.

3.4. Корреляция спектральных коэффициентов при дискретных преобразованиях.

3.4.1. Моменты и межблочная корреляция нулевой спектральной моды при DCT преобразовании.

3.4.2. Моменты и внутриблочная корреляция ненулевых спектральных мод при DCT преобразовании.

3.4.3. Межблочная корреляция одноименных спектральных мод при DCT преобразовании.

3.5. Расчет и экспериментальное исследование энтропии спектра двумерного поля.

4. Обнаружение и оценка структурного подобия декодированных изображений.

4.1. Современные объективные критерии структурного подобия.

4.2. Исследование энтропии и структурного подобия декодированных изображений.

4.3. Непараметрические критерии структурного подобия.

4.4. Исследование структурного подобия при наличии искажений.

4.4.1. Структурное подобие при наличии импульсных помех.

4.4.2. Структурное подобие при наличии квазигауссовских помех.

4.4.3. Структурное подобие при наличии блочности.

4.4.4. Структурное подобие при наличии размытости.

4.4.4. О возможности использования критериев структурного подобия для обнаружения смены сцен.

 
Введение диссертация по физике, на тему "Статистический и информационный анализ обнаружения изменений в последовательности двумерных полей"

Актуальность работы. Современные системы передачи данных функционируют в условиях, когда все возрастающие потоки данных необходимо передавать по каналам, пропускная способность которых ограничена действующими стандартами на частотные диапазоны, электромагнитной совместимостью, наличием помех.

Большую часть всей передаваемой информации в настоящее время занимает мультимедиа контент, наиболее весомой частью, которого является видео изображения. Этот факт, показывает важность и необходимость совершенствования и постоянного развития технологий сжатия именно мультимедийных данных и в особенности динамических изображений. Для этого разработаны стандарты сжатия видео МРЕ01-4, Н.261-264. Наиболее совершенные кодеки МРЕО-4, Н.264 / АУС являются эффективными по критерию коэффициента сжатия видеопотока — качество восстановленного видео, но весьма сложными в алгоритмическом и вычислительном плане. Соответственно, телекоммуникационные устройства, использующие данные стандарты сжатия, предъявляют высокие требования к процессорам видеообработки, обладают повышенным энергопотреблением. Поэтому они не могут быть использованы, например, в мобильных и автономных устройствах передачи или хранения видеоинформации.

Основным недостатком существующих алгоритмов сжатия является способ кодирования видео, основанный на оценке векторов сдвига фрагментов изображения от кадра к кадру, предсказание текущего кадра по предыдущим кадрам и преобразования ошибки рассогласования с помощью дискретного косинусного преобразования (ДКП). Данный принцип кодирования в целом достиг предела своих возможностей. Еще одной особенностью существующих алгоритмов сжатия видео является их детерминированный характер, поскольку они разработаны без учета влияния 1 помех на обрабатываемое изображение. Поэтому возникает необходимость в разработке новых принципов пространственно-временной обработки зарегистрированных оптических полей, сочетающих достаточную вычислительную простоту с эффективным удалением информационной избыточности в видеопотоке и устойчивостью к наличию помех. Данная задача, во-первых, может решаться путем использования новых видов ортогональных преобразований, отличных от ДКП. Во-вторых, синтез алгоритмов должен основываться на методах статистической теории принятия решений, приводящих к оптимальным алгоритмам. Причем данные алгоритмы должны быть устойчивыми к помехам различной природы и априорной неопределенности относительно характеристик обрабатываемых полей. В-третьих, должны быть разработаны методы статистического и информационного анализа новых алгоритмов обработки, сжатия и восстановления динамических изображений (видеопоследовательностей).

Таким образом, недостатки существующих алгоритмов обработки и сжатия динамических изображений и необходимость применений новых принципов видеокодирования требуют решения указанных задач.

Цель работы. Целью работы является синтез и анализ спектральных алгоритмов многоальтернативного обнаружения изменений в зарегистрированных полях (видеопоследовательностях), разработка методов расчета количества информации в изображении на основе анализа спектров, обнаружение и оценка изменений в последовательности изображений с нечеткой математической моделью (структурное подобие). Для реализации этой цели в диссертации поставлены и решены следующие задачи:

1. Синтез алгоритмов многоальтернативного обнаружения изменений в блоках видеопоследовательности на основе обобщенного спектрального описания с учетом различной априорной информации об обрабатываемом изображении.

2. Разработка методов анализа и получения расчетных соотношений для характеристик многоальтернативного обнаружения изменений в динамических изображениях, а также экспериментальная проверка предложенных алгоритмов и методов анализа их эффективности.

3. Исследование статистических характеристик спектральных мод обобщенных рядов Фурье и дискретного спектрального преобразования гауссовских случайных полей и разработка, на основе проведенного анализа, метода расчета количества информации и предела сжатия в изображении.

4. Разработка алгоритмов обнаружения и оценка изменений в динамических изображениях с неопределенными статистическими характеристиками и нечеткой математической формами - критериев структурного подобия и их экспериментальное исследование.

5. Установление методами статистического моделирования и натурных экспериментальных исследований границ применимости расчетных соотношений.

6. Разработка рекомендаций по алгоритмической структуре и рабочим параметрам для перспективного принципа видеокодирования МСГОСТ, совместимого с кодированием на основе дискретного косинусного преобразования.

Методы проведения исследований. При решении поставленных задач в диссертации используются методы статистической радиофизики, математического анализа, теории вероятностей, математической статистики и случайных процессов, теории статистических решений. При экспериментальных исследованиях использовались реальные видеопоследовательности. При разработке пакета прикладных программ активно * использовались методы объектно-ориентированного программирования на языке С++, а также процедурное программирование в пакете МаШсас!.

Научная новизна работы. В данной работе получены новые результаты:

1. Синтезирован блочный спектральный алгоритм многоальтернативного обнаружения изменений в последовательности изображений, и исследована его реализация на основе дискретного чебышевского (ОБСТ) и дискретного косинусного преобразований.

2. Получены вероятностные характеристики при попарной проверке гипотез: а) нет изменений в блоке; б) изменения, связанные со сдвигом изображения; в) смена сюжета; г) пропадание блока - в спектральных алгоритмах обработки видеопоследовательности, в том числе при использовании части спектральных коэффициентов. Показано, что характеристики устойчивы к выбору порогов.

3. Предложен алгоритм обнаружения изменившихся фрагментов последовательности кадров на основе их статистической сегментации. Алгоритм основан на анализе временных корреляционных матриц каждого пространственного отсчета поля и не требует знания их законов распределения.

4. Получены корреляционные характеристики спектральных мод обобщенных рядов Фурье и дискретного косинусного преобразования гауссовских полей. Найдены внутриблочные и межблочные корреляционные моменты для спектральных коэффициентов и определены условия, когда корреляция пренебрежимо мала.

5. Разработан метод расчета количества информации (энтропии) цветного изображения на основе спектрального подхода.

6. Проведена экспериментальная проверка работоспособности синтезированных алгоритмов и методов их анализа, а также способов расчета энтропии изображения.

7. Предложены непараметрические алгоритмы обнаружения изменений в полях (изображениях) с неизвестной статистикой (структурой) и нечеткой математической формализацией.

В. Даны рекомендации по алгоритмической структуре и рабочим параметрам нового перспективного принципа видеокодирования МвБСТ.

Основные положения и результаты, выносимые на защиту. На защиту выносятся следующие результаты, впервые полученные в данной работе.

1. Блочные спектральные алгоритмы многоальтернативного обнаружения изменений в динамических изображениях, устойчивые к заданию порога принятия решения.

2. Теоретические и экспериментальные характеристики проверки гипотез о виде изменений в блоках изображений, учитывающие конечное число спектральных мод в решающих статистиках.

3. Новый алгоритм статистической сегментации изменяющихся фрагментов динамических изображений, не требующий знания законов распределения отсчетов поля.

4. Расчетные соотношения для внутриблочной и межблочной корреляции спектральных коэффициентов разложения поля в обобщенные ряды Фурье, позволяющие определить условия, при которых корреляцией можно пренебречь.

5. Методика расчета энтропии цветного (RGB) изображения на основе его спектрального анализа, экспериментальное подтверждение вывода о том, что чебышевское преобразование GDCT лучше удаляет информационную избыточность при сжатии изображений, чем классическое дискретное косинусное преобразование при соизмеримом качестве изображений.

6. Многофакторное обобщение классических метрик (PSNR др.) и новые непараметрические алгоритмы обнаружения и оценки изменений в полях с неизвестной статистической и нечеткой математической формализацией, названные непараметрическими критериями структурного подобия MNSSIM1 и MNSSIM2.

Практическая ценность. Проведенный в работе цикл теоретических и экспериментальных исследований позволил обосновать структуру и задать рабочие параметры нового перспективного видеокодека > MGDCT, обладающего хорошими характеристиками битрейт/качество в широком диапазоне скоростей, передачи информации. Предложенные спектральные алгоритмы обработки и сжатия видеопоследовательностей просты в реализации, устойчивы к воздействию помех и искажений, а также к априорной неопределенности вида и свойств изображений. Результаты исследований внедрены в ОКР ЗАО «Кодофон».

Достоверность. Достоверность результатов, полученных в диссертационной работе, подтверждается корректностью использования математического аппарата, совпадением новых результатов с известными, результатами статистического моделирования и экспериментальными исследованиями на реальных видеопоследовательностях.

Апробация работы. Результаты исследований, приведенные в данной диссертации, были представлены в виде докладов и обсуждались на:

- VIII, IX, X, XI и XII Международных конференциях «Цифровая обработка сигналов и ее применения - DSPA», Москва, 2006, 2007, 2008, 2009, 2010.

- XII, XIII, XIV Международных научно-технических конференциях «Радиолокация, навигация и связь», Воронеж, 2006, 2007, 2008.

- VII Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций», Самара, 2006.

- XI Международной научно-технической конференции «Кибернетика и высокие технологии XXI века», Воронеж, 2010.

Публикации. По теме исследования опубликовано 14 печатных работ, из них 3 — в журналах, рекомендованных ВАК к защите диссертации.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, приложения и списка литературы.

 
Заключение диссертации по теме "Радиофизика"

Результаты исследования приведены в таблице 4.3.1. Столбец «Параметр шума» характеризует интенсивность р зашумления изображения. Столбец «Тип шума» характеризует тип зашумления: «п» - «перец» изображение зашумляется черными точками, «с» - «соль» изображение зашумляется белыми точками, «п-с» - «перец-соль» изображение зашумляется и белыми и черными точками.

Рис. 4.4.4. Изображение «Лена», шум - "перец",/? = 0,2.

Как видно из таблицы 4.4.1 при одинаковом значении параметра шума, мы имеем различные значения критерия MS SIM. Например, при параметре шума р = 0,2 изображение зашумленное белыми точками имеет значение MS SIM почти на треть меньшее, чем при таком же значении параметра шума и зашумлении черными точками. Визуально такие изображения тоже кажутся разного качества, в чем можно убедиться, обратившись к рисункам 4.4.4, 4.4.5.

Рис. 4.4.5. Изображение «Лена», шум - "соль",/? = 0,2.

М881М = 0,196.

На рисунке 4.4.6 представлены зависимости значениев критериев М881М, МЫ881М1, МЫ881М2, МЕ881М от параметра интенсивности импульсного шума р.

Практически во всем диапазоне изменений р значения МТЧ881М1 и МЫ881М2 близки между собой и имеют значения более близкие к восприятию зрительной системы человека.

Таким образом, при исследовании влияния искажений в виде импульсного шума следует отдать предпочтение модифицированным критериям МЫ881М1 и МЫ881М2 [65].

1,00 0,70 0,40 0,10 -0,20 -0,50

--и—

0,05

0,2 а) Тип импульсного шума «соль».

-в— МвЭМ -^-МЫ331М1 —е— МЫЭЭШ -В-МЕ331М б) Тип импульсного шума «перец».

0,4 в) Тип импульсного шума «соль/перец». Рис.4.4.6. Зависимость значений критериев М881М, М^БПУП, МЫ881М2,

МЕ881М от интенсивности импульсного шума и типа шума.

4.4.2. Структурное подобие при наличии квазигауссовских помех Прежде всего, уточним понятие квазигауссовской помехи на цифровом изображении. Каждая из цветовых компонент RGB принимает о значение от 0 до 2 - 1 = 255 при целочисленном 8-битном представлении уровней сигнала. Поэтому каждая цветовая RGB компонента при наличии квазигауссовской помехи формировалась по закону у^Ху + Ест-л^ + г7, где Г)у ~ N(0, 1) - независимые гауссовские величины для каждого пикселя изображения с координатами (i, j); ст - нормирующий коэффициент, ст < 1; [•] - означает целую часть числа (•).

5 7

Нормирующий коэффициент 2 = 32 и смещение 2 =128 выбирались из расчета, чтобы результирующие значения с вероятностью Р = 0.995 попадали в интервал 0 < У,, < 255. Если результирующее значение выходило за границы этого интеврала, то есть Уу < 0 или Уу < 255, то производилось округление до Уу = 0 или Уу = 255 соответственно.

В качестве тестовых использовались изображения из базы данных изображений Laboratory for Image and Video Engineering [49]. Из указанной базы данных были использованы и значения субъективной оценки качества изображений DMOS [58]. Для зашумленных гауссовым шумом изображений были рассчитаны значения критериев MSSIM, MESSIM, MNSSIM1, MNSSIM2 и ранговые коэффициенты корреляции Спирмена между ними и значениями DMOS.

Коэффициент корреляции Спирмена определяется формулой (4.3.3):

6-Sd? Р=1—ц—.

Здесь п — число элементов в последовательности {х',}.

Значения р изменяются от -1 до 1, причем р = 0 указывает на отсутствие корреляции.

Ранговая корреляция признается значимой при [15] значениях коэффициента корреляции Спирмена р: р| > ра или S > Sa, (4.4.1) где ра и Sa - критические значения, равные при п > 10:

2" 0 0 i=l i=l ua - a-квантиль стандартного нормального распределения. Подсчет ранговых коэффициентов корреляции Спирмена между критериями MSSIM, MESSIM, MNSSIM1, MNSSIM2 и значениями DMOS осуществлялся следующим образом. Вычисленным значениям критериев MSSIM, MESSIM, MNSSIM1, MNSSIM2 присваивались ранги, также ранги были выставлены соответствующим значениям DMOS. После этого вычислялось значение коэффициента корреляции Спирмена по формуле (4.3.3). Для всех критериев качества и соответственно значений DMOS число элементов в последовательности п было равным 49. Также для каждого критерия качества MSSIM, MESSIM, MNSSIM1, MNSSIM2 было проверено выполнение условия значимости (4.4.1) для полученных коэффициентов корреляции.