Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса тема автореферата и диссертации по физике, 01.04.06 ВАК РФ

Бакаев, Александр Васильевич АВТОР
кандидата технических наук УЧЕНАЯ СТЕПЕНЬ
Таганрог МЕСТО ЗАЩИТЫ
2009 ГОД ЗАЩИТЫ
   
01.04.06 КОД ВАК РФ
Диссертация по физике на тему «Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса»
 
Автореферат диссертации на тему "Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса"

09-3 (

3874

На правах рукописи

БАКАЕВ Александр Васильевич

ИССЛЕДОВАНИЕ ВОКАЛЬНОЙ РЕЧИ КАК НЕСТАЦИНАРНОГО СЛУЧАЙНОГО ПРОЦЕССА И РАЗРАБОТКА КРИТЕРИЕВ ОБЪЕКТИВНОЙ ОЦЕНКИ ПЕВЧЕСКОГО ГОЛОСА

Специальности: 01.04.06-Акустика

05.12.04 - Радиотехника, в том числе системы и устройства телевидения

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Таганрог 2009

Работа выполнена на кафедре теоретических основ радиотехники Технологического института Южного федерального университета в г. Таганроге (ТТИ ЮФУ).

Научный руководитель: доктор физико-математических

наук, профессор РЫЖОВ В.П. (ТТИ ЮФУ, г. Таганрог)

Официальные оппоненты: доктор технических наук,

профессор ТИМОШЕНКО В.И. (ТТИ ЮФУ, г. Таганрог)

кандидат технических наук, доцент ХАРУТО A.B. (МГК им. П.И. Чайковского, г. Москва)

Ведущая организация: ООО Конструкторское бюро

морской электроники «Вектор» (г. Таганрог)

Защита состоится « 18 » июня 2009 г. в 1420 часов на заседании диссертационного совета Д 212.208.23 при Южном федеральном университете по адресу: Ростовская обл., г. Таганрог, ул. Шевченко, 2, ауд. Е-306

С диссертацией можно ознакомиться в библиотеке Южного федерального университета.

Автореферат разослан « 8 » мая 2009 г.

Ученый секретарь диссертационного совета, д.т.н., доцент

И.Б. Старченко

РОССИЙСКАЯ госуДАРСтееннАя еиЪлиотекА ао.Р.«----------пк

ЦАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. На современном этапе развития техники и технологий методы точных наук все более широко используются в гуманитарных областях. Электроакустические устройства и компьютерная техника применяются также в музыкознании. Не осталось ни одной области музыкальной теории и практики, где нельзя было бы использовать данные музыкальной акустики и ее средства, в частности, современные технологии цифровой обработки сигналов, для объективного изучения тех или иных музыкальных явлений. Традиционной областью применения акустических методов является музыка, в том числе вокальное искусство. Новые возможности компьютерной техники позволяют создавать модели акустических сигналов и разрабатывать алгоритмы их обработки.

Диссертационная работа направлена на исследование радиотехническими методами одного из важнейших коммуникативных сигналов - вокальной речи, которая оказывает на человека значительное эмоциональное воздействие. Научный интерес представляет природа образования высокой певческой форманты, нестационарность процесса звукоизвлечения, а также процессы исполнительской интонации, проявляющиеся в изменении мгновенной частоты акустических вокальных сигналов.

В рамках научного подхода в изучении процессов звукоизвлечения и звуко-восприятия за последнее столетие было создано множество акустических, механических, а впоследствии, радиотехнических, в том числе цифровых моделей голосового и слухового трактов (Р. Юссон, Г. Фант, Дж.Ф. Фланаган, М.А. Сапожков, В.Н. Сорокин, В.П. Морозов, Е.А. Рудаков, Л. Рабинер, Б. Гоулд, И,А. Алдошина и др.). Данные модели позволяют установить связь физиологических процессов в речеобразовании и слуховом восприятии с соответствующими им электрическими и цифровыми аналогами.

Вокальная речь имеет ряд существенных отличий от разговорной, так как является результатом профессиональной постановки голоса, под которой понимаются специфические музыкальные, физические и дыхательные упражнения и занятия на протяжении нескольких лет под руководством опытных педагогов-вокалистов, Исследованиями особенностей разговорной и вокальной речи, а также процессами ее обработки занимаются многие современные ученые (В.П. Морозов, A.B. Харуто, И.А. Алдошина, И.Б. Старченко, и др.).

Часто вокальные акустические сигналы нуждаются в коррекции, под которой подразумевается изменение соотношений между спектральными составляющими, для улучшения звучания голоса певца.

Как правило, используемые модели и способы исследования вокальной речи являются детерминистскими, в них не учитываются ее стохастические и нестационарные свойства.

Таким образом, целью диссертационной работы является выявление информативных признаков профессиональной вокальной речи, в частности, экспериментальное исследование спектров вокальных акустических сигналов профессиональных и непрофессиональных исполнителей, анализ вокальной речи как нестационарного случайного процесса и разработка способа коррекции звучания певческого голоса.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Исследовать особенности образования высокой певческой форманты на основе физической модели.

2. Экспериментально исследовать формантные характеристики спектров вокальных гласных профессиональных и непрофессиональных исполнителей во всем диапазоне исполнения, присущем группам мужских голосов.

3. Провести экспертную оценку полученных результатов.

4. Разработать метод анализа вокальной речи с учетом ее нестационарности. Исследовать вокальную речь как нестационарный случайный процесс.

5. Провести интонационный анализ исполнения произведений профессиональными вокалистами на основе анализа изменения мгновенной частоты основного тона.

6. Разработать и провести моделирование устройства, позволяющего педагогу-вокалисту производить коррекцию голоса обучающегося певца на основе коэффициента отношения интенсивностей формант.

Результаты, выносимые на защиту:

1. Уточненная модель образования высокой певческой форманты и исследования адекватности модели естественному процессу звукообразования.

2. Результаты экспериментального анализа спектров голосов профессиональных и непрофессиональных исполнителей на основе введенного коэффициента отношения интенсивностей формант (КОИФ). Экспериментально исследованные закономерности изменения КОИФ.

3. Результаты программного моделирования устройства коррекции голоса непрофессионального исполнителя.

4. Результаты экспертной оценки полученных после коррекции акустических сигналов.

5. Методика анализа вокальной речи как нестационарного случайного процесса.

6. Результаты корреляционного анализа вокальной речи как нестационарного случайного процесса.

7. Результаты интонационного анализа исполнения произведений профессиональными вокалистами и певческого вибрато на основе исследования изменения мгновенной частоты основного тона.

Научная новизна:

1. Обоснована уточненная модель механизма образования высокой певческой форманты (ВПФ) и представлена доказательная база к объединению теорий образования ВПФ В.П. Морозова и Е.А. Рудакова на основе расчета физической модели.

2. В качестве критерия оценки певческого голоса на основе экспериментальных исследований спектров вокальных гласных профессиональных и непрофессиональных исполнителей введен коэффициент отношения интенсивностей формант (КОИФ).

3. Выявлена зависимость изменения КОИФ от частоты основного тона для всех типов мужских голосов.

4. Разработан новый способ корреляционного анализа вокальных акустических сигналов как нестационарных случайных процессов. Получены «нестацио-

нарные портреты» голосов профессиональных и непрофессиональных исполнителей.

Практическая значимость:

1. Результаты исследования позволяют дополнить субъективные оценки голоса начинающего певца объективными характеристиками на основе КОИФ и тем самым уменьшить вероятность ошибочных решений при его обучении.

2. На основе данных, полученных при экспериментальном исследовании спектров вокальных гласных профессиональных исполнителей, разработан алгоритм и произведено моделирование устройства коррекции певческого голоса с использованием КОИФ. Полученные программные решения могут быть применены в практике обучения вокалистов с целью прогнозирования звучания их голосов в будущем, а также при обработке старых аудиозаписей с грампластинок и в других областях.

3. Разработанный и экспериментально апробированный метод корреляционного анализа вокальных акустических сигналов как нестационарных случайных процессов позволяет проводить визуальную трактовку результатов без специального технического образования.

4. Разработана методика анализа изменения мгновенной частоты акустических вокальных сигналов, позволяющая оценить форму и размах певческого вибрато, а также его нестационарный характер.

Методы исследования. Проведенные в работе исследования базируются на применении теории спектрального анализа, а также корреляционного анализа случайных процессов. Используются также методы экспериментальных исследований акустических сигналов и методы цифрового моделирования сигналов и устройств.

Внедрение результатов работы. Полученные при выполнении диссертационной работы результаты нашли в научных исследованиях и учебном процессе кафедры теоретических основ радиотехники ТТИ ЮФУ в курсах «Акустика» и «Зрительно-слуховое восприятие аудиовизуальных программ», а также в Ростовской государственной консерватории (академии) им. C.B. Рахманинова. Использование новых научных результатов позволило улучшить методическое обеспечение, повысить наглядность по указанным дисциплинам, а также повысить эффективность учебного процесса у студентов-вокалистов.

Апробация работы. Отдельные результаты работы докладывались и обсуждались на следующих конференциях: VII и VIII Всероссийская научная конференция студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления» Таганрог, ТРТУ, 2004 г., 2006 г.; Международные научные конференции «Оптимальные методы решения научных и практических задач» (2005 г.), «Цифровые методы и технологии», (2005 г.), «Информационные технологии в современном мире» (2006 г.), «Проблемы развития естественных, технических и социальных систем» (2007 г.), «Проектирование новой реальности» (2007 г.); «Информация, сигналы, системы: вопросы методологии, анализа и синтеза» (2008 г.), «Инновации в обществе, технике и культуре» (2008 г.), Таганрог, ТРТУ, ТТИ ЮФУ; Международная научно-техническая конференция студентов, аспирантов и ученых «Молодежь и современные проблемы радиотехники и телекоммуникаций «РТ-2006», Севастополь, СевНТУ, 17-21 апреля 2006 г.; Международная научно-практическая конференция студентов и аспирантов «Музыкальное

искусство и наука в современном мире», Астрахань, АГК, 18 мая 2006 г.; Международная научная конференция «Информационная культура общества и личности в XXI веке», Краснодар, КГУКиИ, 20-23 сентября 2006 г.; Всероссийская научная конференция «Психология и фониатрия: их роль в воспитании молодых вокалистов», Астрахань, АГК, 2007 г.; LIII научно-техническая конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ, Таганрог, ТТИ ЮФУ, 2008 г.; Всероссийская научная конференция с международным участием «Исполнительское искусство и музыковедение. Параллели и взаимодействия», Москва, ГКА им. Маймонида, 6-9 апреля 2009 г.; IV Международная научная конференция «Музыка народов мира: проблемы изучения», Москва, МГК им. П.И. Чайковского, 11-12 апреля 2009 г.

Публикации. По теме диссертации опубликовано 16 научных работ, из них 5 статей (3 статьи в центральной печати) и 11 статей и тезисов докладов на научно-технических конференциях.

Структура диссертационной работы. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы. Содержание диссертации изложено на 146 страницах и включает 105 рисунков, 32 таблицы и список литературы из 65 наименований.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, обозначены цель и основные задачи, которые необходимо решить для достижения поставленной цели, показаны научная новизна и практическая значимость работы, сформулированы научные положения, выносимые на защиту, приведено краткое содержание диссертационной работы.

В первой главе рассмотрены основные характеристики и особенности разговорной и вокальной речи. В п. 1.1 описаны процессы образования речевых сигналов, рассмотрена резонаторная функция речевого аппарата, приведен обзор физических и электрических моделей формирования речевого и вокального звука, а также моделей голосового тракта. В п. 1.2 рассматриваются основные характеристики вокальной речи.

Следствием отличий вокальной речи от разговорной является более широкий частотный диапазон, большой динамический диапазон, особое спектральное распределение мощности и пр.

Субъективные оценки тембра певческого голоса связаны, прежде всего, с его спектральными характеристиками, которые зависят как от спектрального состава звука, создаваемого голосовым источником, так и от использования резонансных свойств артикуляционных органов. Поэтому особые требования к тембру певческого голоса приводят к особенностям в настройке резонансов голосового тракта, т.е. его формантных частот.

Одним из главных отличий вокальной речи от разговорной является высокая певческая форманта - это группа усиленных обертонов в области 2000-2700 Гц у мужчин и 2700-3500 Гц у женщин, придающих голосу «звонкость» и «полетность» (по терминологии педагогов-вокалистов). Также в спектре голоса певца присутствуют область низкой певческой (первой речевой) форманты (НПФ)

(200 Гц - 1200 Гц) и область средней певческой (второй речевой) форманты (СПФ) (800 Гц-1800 Гц).

Природа образования НПФ общепризнанна и не подвергается сомнению со стороны исследователей, однако механизм образования ВПФ вызывает споры.

В п. 1.3 рассматриваются две основных теории образования высокой певческой форманты: образование ВПФ посредством эффекта «краевых тонов» Е.А. Рудакова и резонансная теория происхождения ВПФ В.П. Морозова.

В диссертации предлагается взгляд на эту проблему с точки зрения теории сигналов.

Модель формирования ВПФ голосовыми связками была представлена в виде периодической последовательности импульсов с огибающей в форме усеченных косинусоид с высокочастотным заполнением. После небольших преобразований амплитудный спектр этой последовательности выражается формулой:

(1)

лЛ

т

А ■ п

А • ж

и'„ + п ■ 1С

... 2

- (»>„ - п • И')3

- О1'« •

где А„ - амплитуда п-й гармоники спектра; г - длительность импульса; уи=2т$-

частота основного тона; м^ - частота заполнения; Т - период следования импульсов основного тона.

После расчетов видно (см. рис, 1), что спектр такой последовательности имеет гармоники (номера гармоник 21 - 28) большой интенсивности (здесь и далее под интенсивностью понимается амплитуда спектральных составляющих) именно на частоте высокой певческой форманты. Для вычисления спектра данного сигнала частоту основного тона взяли равной 123 Гц (что соответствует л/ малой октавы), частоту высокочастотного заполнения усеченных косинусоид, равную 3000 Гц.

Анализ голосов профессиональных исполнителей показал, что добротность резонансных полостей, настроенных на область высокой певческой форманты, имеет значения в пределах от 3 до 7. Такие значения добротности резонаторов не могут обеспечить высокую интенсивность ВПФ, которая наблюдается в спектрах голосов профессиональных вокалистов.

Рис. 1. Спектр представленной периодической последовательности импульсов с огибающей в форме усеченны косинусоиде высокочастотным заполнением

Таким образом, при постановке голоса у профессиональных исполнителей возникает механизм образования ВПФ посредством эффекта «краевого тона» с последующим выделением в резонаторной области, поэтому теории образования высокой певческой форманты Е.А. Рудакова и В.П. Морозова являются взаимодополняющими.

Во второй главе описывается методика и приводятся результаты экспериментального анализа певческих голосов на основе коэффициента отношения интен-сивностей формант.

В п. 2.1 описывается методика спектрального анализа вокальных гласных и производится оценка погрешностей измерений.

Для получения спектра акустического сигнала используется дискретное преобразование Фурье. Для нестационарных сигналов типа речевых сигналов преобразование Фурье всей реализации нецелесообразно, так как спектр речи изменяется во времени. Более полезной характеристикой распределения энергии речевого сигнала является преобразование Фурье на коротком интервале (мгновенный спектр):

Х(а>, пТ) = ^х(гТЩпТ-гТ)е-МгТ > (2)

где п = 0,1,2,..., N-1, имеет физический смысл времени; к = 0,1,2,..., N-1, имеет физический смысл частоты; Т- интервал между отсчетами; су - угловая частота.

Для данной работы спектры вокальных гласных были получены с помощью программ Cool Edit Pro 2.0 и Adobe Audition 1.5 с применением алгоритма быстрого преобразования Фурье.

В этом подразделе также описывается методика экспериментального исследования голосов профессиональных исполнителей (Н. Гяурова, Б. Христова, Г. Отса, Д. Хворостовского, М. Ланца, С. Лемешева и др.) путем записи фонограммы с аудионосителя на жесткий диск компьютера с применением цифровой обработки аудиосигнала. Представлены спектры вокальных гласных профессиональных исполнителей.

В п. 2.2 представлены результаты экспериментального исследования фор-мантных характеристик спектров вокальных гласных профессиональных и непрофессиональных исполнителей. Исследования проводились для групп мужских голосов «бас», «баритон» и «тенор». Формантные области их голосов следующие: область НПФ для баса: (300-700) Гц, для баритона: (380-700) Гц, для тенора: (500-900) Гц; область ВПФ для баса: (1600-2600) Гц, для баритона: (2000-2700) Гц, для тенора: (2100-2800) Гц (рис. 2).

Определено влияние изменения частоты основного тона на изменение отношения интенсивностей высокой и низкой певческих формант на отдельно взятом произведении для двух вокальных гласных: «А» и «Е» (исполнители: Г. Отс, Н. Гяуров и Д. Хворостовский, произведение - романс П.И. Чайковского «Серенада Дон Жуана»), Гласные взяты из одних и тех же слов, чтобы не нарушать эмоциональный настрой, заложенный в произведении.

Проведено исследование отношения интенсивностей высокой и низкой певческих формант на разных частотах основного тона, распределенных не в отдельных

гласных, взятых из разных слов вокального произведения, а по отдельно взятым музыкальным фразам романса П.И. Чайковского «Примиренье» в исполнении Е. Образцовой, Д. Хворостовского и С. Лемешева.

' дБ

......... О

................................................ -12

I -24

ЕТ • -36

/И- ^ -48

■ -84

• -к

• -108

АН

......... ........■ V

о 0.1 0,2 0.5 1 2 3 5 10 кГц

Рис. 2. Д. Хворостоиский. Гласная «А»,/а# 1 октавы (370 Гц). Длительность 1,2 с.

ЧОТ - частота основного тона, НПФ - нижняя певческая форманта, СПФ - средняя певческая форманта, ВПФ - высокая певческая форманта

Для удобства анализа голосов исполнителей коэффициент отношения интен-сивностей ВПФ и НПФ был назван коэффициентом отношения интенсивностей формант (КОИФ):

КОИФ = (3)

УтхНПФ

Полученные данные сведены в таблицы, а также представлены графически (например, рис. 3). Исследовано поведение КОИФ для трех разных профессиональных исполнителей (Е. Образцовой, Д. Хворостовского и С. Лемешева).

Из проведенного анализа видно, что значение КОИФ, в основном, тем выше, чем выше частота основного тона. Следовательно, будет уместно более подробное исследование поведения коэффициента отношения интенсивностей формант в зависимости от частоты основного тона для всего диапазона исполнения голоса как профессиональных, так и непрофессиональных исполнителей с целью выявления определенных закономерностей и использования последних для решения практических задач.

Для проведения исследования были выбраны диапазоны исполнения музыкальных звуков, присущие каждой группе мужских голосов (бас, баритон, тенор). Всего по 12 тонов (полутоны нами не учитывались, так как в данном случае принципиального значения это не имеет). На каждой ноте вычислялось значение отношения интенсивностей высокой и низкой певческих формант для каждой из шести основных вокальных гласных (А, Э, И, О, У, Ы) для того, чтобы впоследствии можно было проследить изменение этого отношения в зависимости от частоты основного тона.

Также был вычислен средний (по диапазону частот) коэффициент отношения интенсивностей высокой и низкой певческих формант для шести гласных на каждой ноте. Проведенные исследования выявили закономерность изменения коэффициента отношения интенсивностей высокой и низкой певческих формант в зависимости от частоты основного тона: КОИФ зависит от частоты основного тона и носит возрастающий характер (рис. 4).

[—Хворостовский -•— Образцова -л— Лемешев|

Рис. 3. Вторая музыкальная фраза из романса П.И. Чайковского «Примиреиье», исполненная тремя разными вокалистами (Д. Хворостовский - баритон; Е. Образцова - меццо-сопрано; С. Лемешев - тенор)

87 98 110 123 131 147 165 175 196 220 247 262 294 330 349 392 440 Частота основного тона, Гц —•—Басы -»-Баритоны —л— Теноры —к— Непроф. йен.

Рис. 4. Усредненное изменение КОИФ в зависимости от частоты основного тона для

групп мужских голосов

В третьей главе рассмотрены вопросы коррекции вокальных гласных непрофессионального исполнителя с помощью КОИФ путем приближения его значения к эталонному. В п. 3.1 производится сравнение КОИФ с Коэффициентом звонкости В.П. Морозова, который определяется как отношение интенсивности ВПФ к общей суммарной интенсивности гласного, в котором эта форманта измеряется. Однако, на восприятие слушателем певца, влияет не только звонкость его голоса, определяемая ВПФ, но и низкочастотные обертоны, принадлежащие области НПФ (грудной резонатор). Исходя из этого, можно сделать предположение, что коэффициент отношения интенсивностей формант является количественной характеристикой этого баланса. Значения КОИФ для профессиональных певцов, как эталонные, можно применить в практике обучения вокалистов, программно или аппаратно изменяя интенсивности певческих формант в спектрах вокальных гласных непрофессиональных исполнителей с целью прогнозирования звучания их голосов в дальнейшем при правильной постановке голоса.

В п. 3.2 исследуется влияние соотношения высокой и низкой певческих формант на восприятие вокального звука. Производится сопоставление КОИФ для

разных певцов и рассматривается отличие их голосов в субъективном восприятии. Из статистических данных, приведенных в предыдущей главе, отчетливо наблюдается рост коэффициента отношения интенсивностей формант как в зависимости от частоты основного тона, так и в зависимости от типа голоса исполнителя. Чем выше тип голоса, тем больше значение КОИФ.

КОИФ дает возможность выявить его оптимальное значение отношения интенсивностей высокой и низкой певческих формант для достижения наилучшего эмоционального и эстетического воздействия на слушателя. Количественно оценить степень такого воздействия можно с помощью экспертной оценки. Для этих целей на примере вокальной гласной «А» в исполнении Д. Хворостовского на ноте/а# 1 октавы (частота основного тона 370 Гц, длительность 1,7 с) используется несколько значений КОИФ для этого акустического сигнала: 0,8 (исходное значение); 0,1; 5; 10.

Как показали результаты экспертной оценки (см. табл. 1) для звонкости, математическое ожидание с ростом КОИФ увеличилось, что указывает на субъективное увеличение звонкости. Однако чрезмерное увеличение звонкости ведет к резкому ухудшению тембра голоса, что негативно сказывается на слуховом восприятии по отношению к исходному фрагменту. Так же изменение КОИФ влияет и на субъективное восприятие громкости сигнала, хотя при КОИФ=Ю (что заведомо является очень высоким значением), субъективно, громкость ниже, чем у исходного фрагмента.

Таблица 1

Вероятностные характеристики экспертной оценки

КОИФ Звонкость Тембр Громкость |

т'х о: • т\ а\ К о:

0,8 (исх.) 3,4 0,24 0,49 4,4 0,64 0,80 3,4 0,24 0,49

0,1 2,6 0,64 0,80 3,6 0,24 0,49 2,8 0,56 0,74

5 4,4 0,24 0,49 2,8 0,56 0,74 4,0 0,40 0,63

10 4,6 0,64 0,80 1,4 0,24 0,49 2,6 0,64 0,80

где т'х - оценка математического ожидания;

О", сг'х ~ оценки дисперсии и среднеквадратического отклонения экспериментальных значений

В п. 3.3 разрабатывается структурная схема устройства коррекции (рис. 5). Согласно данной структурой схеме, звуковой сигнал подвергается фильтрации. В блоках ПФ1 (полосовой фильтр 1) и ПФ2 (полосовой фильтр 2) происходит выделение из спектра сигнала областей нижней и верхней формант (ОНПФ и ОВПФ соответственно). Далее, в блоке анализа, происходит сравнение модулей максимумов огибающей спектра и вычисляется отношение интенсивностей верхней и нижней формант (коэффициент К), присущее данному исполнителю. В следующем блоке происходит сравнение полученного коэффициента К с эталонным (КЭТ1). Если они не равны, то коэффициент К увеличивается до нужного значения Кэт|. Затем происходит коррекция вокальных гласных непрофессионального ис-

полнителя с помощью эталонного коэффициента в соответствующем блоке коррекции. Далее выходной сигнал блока коррекции суммируется с входным сигналом и поступает на выход корректирующего устройства.

Входной Сигнал

Рис. 5. Структурная схема устройства коррекции характеристик певческого голоса

В п. 3.4 произведено моделирование цифровых полосовых формантных фильтров. Для выделения формантных областей наиболее подходящей является амплитудно-частотная характеристика (АЧХ), приближающаяся к прямоугольной, но в то же время не слишком высокого порядка (для уменьшения переходных процессов). Расчет полосового фильтра рассмотрен на примере фильтра Чебыше-ва. Синтез цифрового фильтра осуществлен методом обобщенного билинейного преобразования. Наиболее компактная реализация получается при использовании рекурсивных фильтров.

В п. 3.5 проводится исследование способа коррекции на компьютерной модели. Моделирование прохождения акустического сигнала через корректирующее устройство производится в программной среде Ма^аЬ 5.3, используя разработанный алгоритм. Приводятся результаты работы программы улучшения звучания голоса непрофессионального исполнителя путем приближения значения его КОИФ к эталонному. На рис. 6, 7 представлены спектры сигналов до и после коррекции.

Щ/Vi/

.......................................................!.....г.....|...................*..................^

..и

........

МЧ

ll ail -'h i': 'J(l ' % ' lio lib '■':> ■'.I'. vh ' ' loba '.'l-.1 ЛМЯ ' '-.П'р ' ЛМ.Г l'oioD

Рис. 6. Певец B.C. Усредненный спектр отрезка вокального произведения длительностью 46 секунд (до коррекции)

■AM

-\/W

...........-f

J...........................................:.....:..............N"

.....V

■"4».....

\

lio ''■>> ' I0ÚD ' ■:::„' ¡[¡m Hi

Рис. 7. Певец B.C. Усредненный спектр отрезка вокального произведения длительностью 46 секунд (после коррекции)

Таблица 2

Вероятностные характеристики экспертной оценки

№ п/п Характеристика Hcxojo ( (НЫЙ звуковой )рагмент Скорректированный звуковой фрагмент

* 4 К я; +

1 Звонкость 2,0 0,39 0,63 4,6 0,24 0,49

2 3 Тембр 2,8 0,96 0,98 4,0 0,40 0,63

Громкость 2,4 0,64 0,80 4,2 0,56 0,74

Экспертная оценка показала, что субъективное восприятие звонкости улучшилось в 2,3 раза, тембра - в 1,4 раза и громкости - в 1,8 раза. Субъективное восприятие отчетливости отдельных слов и музыкального текста в целом улучшилось в 1,9 раза.

Таким образом, увеличение уровня ВПФ (в пределах эталонных значений профессиональных исполнителей) приводит к улучшению субъективного восприятия отчетливости вокальной речи наравне с повышением звонкости и красоты тембра голоса непрофессионального исполнителя.

В четвертой главе вокальная речь рассматривается как нестационарный случайный процесс. В п. 4.1 приводятся основные характеристики вокальной речи и описываются ее нестационарные особенности на примере певческого вибрато. Показано, что применение автоматического вибрато для голоса не приемлемо, поскольку исполнительское вибрато представляет осмысленное, основанное на искусстве дополнение и развитие мелодического рисунка и служит средством и элементом художественной выразительности. Поэтому намеренное допущение при анализе вокальной речи того, что она является стационарной, лишает исследователя полезной информации об индивидуальности исполнителя.

В п. 4.2 представлены результаты разработки цифрового метода и алгоритма анализа вокальных акустических сигналов как нестационарного случайного процесса.

Приводятся значения оценки дисперсии нестационарного процесса. Разработан метод анализа автокорреляционной функции (АКФ) нестационарных акустических вокальных сигналов.

При измерении автокорреляционной функции Л,(/;, /¡) по совокупности N реализаций х/(/), / = 1, 2, принадлежащих нестационарному случайному процессу, нужно найти среднюю по ансамблю оценку:

Воспользуемся следующим приемом - фиксирование при переменном Ь. Пусть ¡1 = / и 12 = /- г, где т - фиксированный сдвиг по времени. Тогда функция

ВД/-г) = !;£>,(О*,(5) А' м

в случае стационарного процесса является только функцией т, а в случае нестационарного процесса функцией I и г. Для каждого фиксированного значения сдвига т и каждой реализации х,(0 вычисляются и запоминаются произведения *,■(/) л',(/ - г). Эта операция повторяется для всех N реализаций, а последующее осреднение по ансамблю дает оценку (5). Вся последовательность вычислений должна повторяться для каждого значения т.

Структурная схема измерения АКФ нестационарных акустических вокальных сигналов изображена на рис. 8.

Рис. 8. Схема измерения нестационарной автокорреляционной функции вокальной речи

Алгоритм измерения данной автокорреляционной функции был программно реализован в среде Matlab 5.3. Приводятся результаты вычисления автокорреляционной функции вокальных акустических сигналов как стационарного случайного процесса (когда АКФ является функцией т), и вычисления автокорреляционной функции акустических вокальных сигналов как нестационарных случайных процессов (НСП), являющейся функцией t и т (см. рис. 9).

Интервал корреляции для профессионалов практически совпадает и находится в пределах 10-20 мс, для непрофессионального певца интервал корреляции находится в пределах 110-150 мс.

Из приводимых в работе графиков АКФ НСП видно, что голос профессионального певца остается неизменным на всем диапазоне исполнения. Это подтверждает то, что в процессе постановки голоса педагог-вокалист добивается одинакового звучания (выравнивания регистров) голоса ученика на всем диапазоне звучания. Значение интервала корреляции в пределах 10 - 20 мс обусловлено на-

личием в голосе профессионального певца флюктуационных составляющих, несущих эмоционально-смысловую нагрузку.

Рис. 9. Д. Хворостовский. АКФ НСП. Гласная «А», ге 1 октавы (ЧОТ 293 Гц) В практике обучения вокалистов можно активно применять данный метод. Достаточно в конце каждого года обучения записывать вокальные гласные на всем диапазоне исполнения, представляя их в виде нестационарного случайного процесса и оценивать автокорреляционную функцию предложенным способом с применением соответствующе программы. В качестве примера приводятся результаты исследования записей голоса певца А. (баса), сделанные 3 года назад и в настоящее время (рис. 10, 11). В течение этих трех лет вокалист занимался профессиональной постановкой голоса с педагогом-вокалистом.

Из приводимых графиков видно, что интервал корреляции существенно уменьшился (с 80-110 мс до 20-50 мс), автокорреляционная функция имеет более острую форму. При прослушивании так же отмечена положительная тенденция. Тембр голоса стал более насыщенным, звонким, появилось устойчивое вибрато, увеличилась интенсивность высокой певческой форманты.

Применение метода анализа вокальной речи как нестационарного случайного процесса позволило количественно оценить тенденцию к улучшению характеристик голоса в процессе обучения. Удалось получить нестационарный «портрет голоса» вокалиста, по которому можно судить о профессионализме исполнителя по визуальной оценке графиков, не имея специальной математической и технической подготовки, что будет удобно при использовании данного метода педагогами-вокалистами в музыкальных учебных заведениях.

Рис. 10. Певец А. АКФ НСП, Гласная «А», с1о первой октавы (ЧОТ 261 Гц). Исполнение 3 года назад

Рис. 11. Певец А. АКФ НСП. Гласная «А», с!о первой октавы (ЧОТ 261 Гц). Исполнение в настоящее время

В п. 4.3 приводится интонационный анализ исполнения профессиональными вокалистами (Е. Образцовой и Д. Хворостовским) романса П.И. Чайковского «Примиренье». Исследование певческой интонации показало, что эмоциональный настрой исполнителя отражается на звуковысотном воспроизведении. При общем грустном характере исполняемого произведения и на звуковом нюансе пиано у профессиональных певцов проявляется тенденция к занижению тона (до 40 центов), а при звуковых нюансах форте и фортиссимо, наоборот, ноты завышаются (до 60 центов). Так же завышается основной тон и перед взятием более высокой ноты через большой интервал. Это, возможно, объясняется внутренней подготовкой певца к исполнению высокой ноты.

В п. 4.4 приведены результаты исследования изменения мгновенной частоты основного тона (вибрато) у профессиональных исполнителей (рис. 12, 13). Разработан алгоритм анализа мгновенной частоты с использованием преобразования Гильберта. Способ измерения мгновенной частоты, основанный на преобразовании Гильберта, удобен при программной реализации. Это объясняется тем, что во многие программные пакеты встроена функция преобразования Гильберта с использованием алгоритма быстрого преобразования Фурье. Он также характеризуется значительным динамическим диапазоном уровней сигнала. Алгоритм программно реализован в среде Ма(1аЬ 5.3.

Рис. 12. Анализ мгновенной частоты сгенерированного вибрато по значениям реального сигнала

Рис. 13. Анализ мгновенной частоты вибрато реального сигнала. Д. Хворостовский. Гласная «А», ЧОТ 370 Гц

Приводимые графики изменения частоты во времени указывают на то, что форма реального вибрато меняется, меняется также и его размах.

При применении весовой функции при анализе этих сигналов можно добиться уменьшения краевых эффектов, однако в данном случае это не играет существенного значения, поскольку целью эксперимента является наглядная демонстрация отклонения реального вибрато от автоматического.

В заключении сформулированы основные научные и практические результаты диссертационной работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Основные теоретические и практические результаты, полученные в диссертационной работе состоят в следующем:

1. Обоснована уточненная модель механизма образования высокой певческой форманты (ВПФ) и представлена доказательная база к объединению теорий образования ВПФ В.П. Морозова и Е.А. Рудакова на основе расчета физической модели.

2. Экспериментально исследованы спектры вокальных гласных профессиональных и непрофессиональных исполнителей для всего диапазона исполнения групп мужских голосов бас, баритон и тенор. По результатам экспериментального анализа введен коэффициент отношения ин-тенсивностей формант (КОИФ).

3. Выявлена зависимость изменения КОИФ от частоты основного тона для всех типов мужских голосов - КОИФ монотонно растет по диапазону исполнения, причем для высоких голосов он имеет большее значение.

4. Рассмотрена задача коррекции голоса непрофессионального исполнителя с помощью КОИФ с целью приближения его звучания к эталонному значению.

5. Проведенная экспертная оценка исходного и скорректированного фрагментов показала улучшение основных характеристик голоса (звонкость, громкость, тембр), в среднем, в 2,4 раза.

6. Разработан и экспериментально апробирован новый метод корреляционного анализа вокальных акустических сигналов как нестационарных случайных процессов. Получены «нестационарные портреты» голосов профессиональных и непрофессиональных исполнителей, по которым можно судить о профессионализме исполнителя по визуальной оценке графиков.

7. Исследованы интонационные особенности исполнения вокальных произведений профессиональными певцами. Показано, что неосознанное изменение частоты основного тона, обусловленное эмоциональным настроем исполнителя, благотворно сказывается на восприятии вокальных произведений.

8. Разработан алгоритм анализа изменения мгновенной частоты акустических вокальных сигналов, позволяющий оценить форму и размах певческого вибрато, а также его нестационарный характер. Показано, что для профессиональных исполнителей изменение во времени формы и размаха певческого вибрато находится в пределах 20-40%, Отклонение характеристик реального вибрато от автоматического положительно сказывается на восприятии вокальной речи.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи в журналах из списка ВАК:

1. Бакаев A.B. Анализ формантной структуры певческого голоса//Известия ЮФУ. Технические науки. - Таганрог: Изд-во ТТИ ЮФУ. - 2008. №1 (78). - С. 7-8.

Статьи в других изданиях и тезисы докладов на конференциях:

2. Бакаев A.B. Цифровой формантный фильтр. Часть 1//Современные проблемы теории радиотехнических сигналов, цепей и систем. Сборник научных статей. - Таганрог: Изд-во ТРТУ. - 2004. - С. 54-57.

3. Бакаев A.B. Цифровой формантный фильтр. Часть 2//Сборник тезисов докладов VII всероссийской научной конференции студентов и аспирантов. Техническая кибернетика, радиоэлектроника и системы управления. - Таганрог: Изд-во ТРТУ. - 2004. - С. 5-6.

4. Бакаев A.B. Вопросы оптимизации вокального звучания на основе исследования спектров профессиональных вокалистов//Материалы международной научной конференции «Оптимальные методы решения научных и практических задач» - часть 3 - Таганрог: Изд. Антон, ТРТУ. - 2005. -С.4-9.

5. Бакаев A.B. Анализ певческих голосов на основе цифрового анализа спектров/Материалы международной научной конференции «Цифровые методы и технологии» - часть 1 - Таганрог: Изд. Антон, ТРТУ. - 2005. - С. 7-13.

6. Бакаев A.B. Анализ певческих голосов с помощью цифрового анализа спектров//Молодежь и современные проблемы радиотехники и телекоммуникаций «РТ-2006»: Материалы международной научно-технической конференции студентов, аспирантов и ученых, 17-21 апреля 2006 г. - Севастополь: Изд-во СевНТУ. - 2006. - С. 165.

7. Бакаев A.B. Исследование формантной структуры певческих голо-сов//Музыкальное искусство и наука в современном мире: Материалы Международной научно-практической конференции студентов и аспирантов 18 мая 2006 года. - Астрахань - Ростов-на-Дону: Фолиант. - 2006. -С. 152-158.

8. Бакаев A.B. Коэффициент отношения интенсивностей формант//Сборник тезисов докладов VIII всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления». - Таганрог: Изд-во ТРТУ. -2006. - С. 10-11.

9. Бакаев A.B. Информационные технологии как инструмент исследования певческих голосов//Приложение к региональному научному журналу «Культурная жизнь Юга России». Материалы международной научной конференции «Информационная культура общества и личности в XXI веке», 20-23 сентября 2006 г. - Краснодар: Изд-во КГУКиИ. - 2006. - С. 401-403.

10. Бакаев A.B. Информационный подход к исследованию музыкальных фраз на основе коэффициента отношения интенсивностей формант/Материалы международной научной конференции «Информационные технологии в современном мире» - часть 1 - Таганрог: ТРТУ. - 2006. -С. 12-16.

11. Бакаев A.B. Особенности формантной структуры вокальной речи/Материалы международной научной конференции «Проблемы развития естественных, технических и социальных систем» - часть 2 - Таганрог: Изд-во Антон, ТТИ ЮФУ. - 2007. - С. 5 - 8.

12. Бакаев A.B. Особенности формирования высокой певческой форман-ты//Психология и фониатрия: их роль в воспитании молодых вокалистов: Сборник статей по материалам научной конференции 8-9 ноября 2007 года. / Гл. ред. - Л.В. Савина. - Астрахань: Изд-во ОГОУ ДПО АИПКП. -2007.-С. 311-315.

13. Бакаев A.B. Об особенностях формантных областей певческого голоса/Материалы международной научной конференции «Проектирование новой реальности» - часть 3 - Таганрог: Изд-во ТТИ ЮФУ. - 2007. - С. 510.

14. Бакаев A.B. Вокальная речь как нестационарный случайный процесс// Материалы международной научной конференции «Информация, сигналы, системы: вопросы методологии, анализа и синтеза» - часть 1 - Таганрог: Изд-во ТТИ ЮФУ. - 2008. - С. 4-8.

15. Бакаев A.B. Влияние формантных областей на разборчивость ре-чи//Информационное противодействие угрозам терроризма: научн-практ. журн./ФГПУ НТЦ, Москва. - 2008. - №12. - С. 51-56.

16. Бакаев A.B. Сравнение характеристик вокальной речи на основе корреляционного анализа/Материалы международной научной конференции «Инновации в обществе, технике и культуре» - часть 2 - Таганрог: Изд-во ТТИ ЮФУ. - 2008. - С. 5-12.

09-123

Издательство Технологического института Южного федерального университета в г. Таганроге Таганрог, 28, ГСП 17А, Некрасовский, 44 Зак. № ■ Тираж 100 экз.

2008166665

 
Содержание диссертации автор исследовательской работы: кандидата технических наук, Бакаев, Александр Васильевич

ВВЕДЕНИЕ.

1. ОБЗОР МЕТОДОВ ИССЛЕДОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ И МОДЕЛЕЙ ФОРМИРОВАНИЯ РЕЧИ И СЛУХОВОГО ВОСПРИЯТИЯ.

1.1. Модели формирования речевого и вокального звука.

1.2. Основные характеристики вокальной речи.

1.3. Об особенностях формирования высокой певческой форманты.

Выводы по разделу.

2. МЕТОДИКА И РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНОГО АНАЛИЗА ПЕВЧЕСКИХ ГОЛОСОВ НА ОСНОВЕ КОЭФФИЦИЕНТА ОТНОШЕНИЯ ИНТЕНСИВНОСТЕЙ ФОРМАНТ (КОИФ).

2.1. Методика спектрального анализа вокальных гласных и оценка погрешностей измерений.:.

2.2. Исследование спектров вокальных гласных.

2.2.1. Исследование музыкальных фраз.

2.2.2. Исследование формантной структуры основных вокальных гласных на основе КОИФ на всем диапазоне исполнения мужских голосов (бас, баритон, тенор).

Выводы по разделу.

3. КОРРЕКЦИЯ ВОКАЛЬНЫХ ГЛАСНЫХ НЕПРОФЕССИОНАЛЬНОГО ИСПОЛНИТЕЛЯ С ПОМОЩЬЮ КОИФ.

3.1. Сравнение КОИФ с Коэффициентом звонкости (Кзв) В.П. Морозова.

3.2. Исследование влияния соотношения высокой и низкой певческих формант на восприятие вокального звука.

3.2.1. Сопоставление КОИФ для разных певцов. Отличие их голосов в субъективном восприятии.

3.2.2. Моделирование для одного певца различных соотношений КОИФ.

3.2.3. Экспертная оценка результатов.

3.3. Разработка структурной схемы устройства коррекции.

3.4. Моделирование цифровых полосовых фильтров для выделения областей верхней и нижней формант в устройстве коррекции.

3.5. Исследование корректирующего устройства.

3.6. Экспертная оценка скорректированного музыкального фрагмента.

Выводы по разделу.

4. ПРЕДСТАВЛЕНИЕ ВОКАЛЬНОЙ РЕЧИ КАК НЕСТАЦИОНАРНОГО СЛУЧАЙНОГО ПРОЦЕССА. ВОПРОСЫ ОЦЕНКИ ИЗМЕНЕНИЯ

МГНОВЕННОЙ ЧАСТОТЫ.

4.1. Вокальная речь как нестационарный случайный процесс.

4.2. Разработка цифрового метода и алгоритма анализа вокальных акустических сигналов как нестационарного случайного процесса.

4.3. Интонационный анализ исполнения романса П.И. Чайковского профессиональными вокалистами.

4.4. Исследование изменения мгновенной частоты основного тона (вибрато) у профессиональных исполнителей.

Выводы по разделу.

 
Введение диссертация по физике, на тему "Исследование вокальной речи как нестационарного случайного процесса и разработка критериев объективной оценки певческого голоса"

Актуальность работы. На современном этапе развития техники и технологий методы точных наук все более широко используются в гуманитарных областях. Электроакустические устройства и компьютерная техника применяются также в музыкознании. Не осталось ни одной области музыкальной теории и практики, где нельзя было бы использовать данные музыкальной акустики и ее средства, в частности, современные технологии цифровой обработки сигналов, для объективного изучения тех или иных музыкальных явлений. Традиционной областью применения акустических методов является музыка, в том числе вокальное искусство. Новые возможности компьютерной техники позволяют создавать модели акустических сигналов и разрабатывать алгоритмы их обработки.

Диссертационная работа направлена на исследование радиотехническими методами одного из важнейших коммуникативных сигналов - вокальной речи, которая оказывает на человека значительное эмоциональное воздействие. Научный интерес представляет природа образования высокой певческой форманты, нестационарность процесса звукоизвлечения, а также процессы исполнительской интонации, проявляющиеся в изменении мгновенной частоты акустических вокальных сигналов.

В рамках научного подхода в изучении процессов звукоизвлечения и звуковосприятия за последнее столетие было создано множество акустических, механических, а впоследствии, радиотехнических, в том числе цифровых моделей голосового и слухового трактов (Р. Юссон, Г. Фант, Дж.Ф. Фла-наган, М.А. Сапожков, В.Н. Сорокин, В.П. Морозов, Е.А. Рудаков, Л. Раби-нер, Б. Гоулд, И.А. Алдошина и др.). Данные модели позволяют установить связь физиологических процессов в речеобразовании и слуховом восприятии с соответствующими им электрическими и цифровыми аналогами.

Вокальная речь имеет ряд существенных отличий от разговорной, так как является результатом профессиональной постановки голоса, под которой понимаются специфические музыкальные, физические и дыхательные упражнения и занятия на протяжении нескольких лет под руководством опытных педагогов-вокалистов. В ходе занятий вырабатываются оптимальные условия звукоизвлечения, которые позволяют певцу исполнять произведения любой технической и эмоциональной сложности, не травмируя при этом свой голосовой аппарат, являющийся хрупким музыкальным инструментом.

В.П. Морозов описал основные особенности голоса профессионального певца: звонкость, полетность (возможность певческого голоса «прорезать» оркестр и заполнять большие концертные залы без микрофона) и «серебристость» тембра (по терминологии вокальных педагогов). Эти характеристики обусловлены наличием ярко выраженных максимумов огибающих низкочастотных и высокочастотных составляющих спектра певческого голоса - фор-мантных областей, а также амплитудно-частотной модуляцией звуковых колебаний во времени (вибрато). Высокая певческая форманта — это группа усиленных обертонов в спектре певческого голоса, обладающая высокой интенсивностью у профессиональных исполнителей. Частота области высокой (третьей речевой) форманты лежит в пределах от 1800 Гц до 3500 Гц (в зависимости от типа голоса исполнителя).

Исследованиями особенностей разговорной и вокальной речи, а также процессами ее обработки занимаются многие современные ученые (Ю.А. Кропотов, Е.В. Лаврентьева, И.Б. Старченко, A.B. Харуто, И.А. Алдо-шина и др.).

Вопросам формирования высокой певческой форманты у певцов также уделяется большое внимание со стороны исследователей. Так у Е.А. Рудакова механизмом происхождения высокой певческой форманты является «краевой тон» голосовых связок, образующийся подобно свисту.

По В.П. Морозову звук, порождаемый голосовыми связками, попадая в резонаторы, усиливается, образуя при этом формантные области и, в частности, область высокой певческой форманты.

В данной работе приводится обоснование дополнения этих теорий друг другом с радиотехнической точки зрения путем моделирования механизма образования высокой певческой форманты согласно теории Е.А. Рудакова.

Порой вокальные акустические сигналы нуждаются в коррекции, при которой подразумевается изменение соотношений между спектральными составляющими, для улучшения звучания голоса певца.

Описанные выше модели и способы исследования речи являются детерминированными и не учитывают стохастических и нестационарных свойств разговорной и вокальной речи.

Таким образом, цель диссертационной работы заключается в выявление информативных признаков профессиональной вокальной речи, в частности, экспериментальном исследовании спектров вокальных акустических сигналов профессиональных и непрофессиональных исполнителей, анализе вокальной речи как нестационарного случайного процесса и разработке способа коррекции звучания певческого голоса.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Исследовать особенности образования высокой певческой форманты на основе физической модели.

2. Экспериментально исследовать формантные характеристики спектров вокальных гласных профессиональных и непрофессиональных исполнителей во всем диапазоне исполнения, присущем группам мужских голосов.

3. Провести экспертную оценку полученных результатов.

4. Разработать метод анализа вокальной речи с учетом ее нестационарности. Исследовать вокальную речь как нестационарный случайный процесс.

5. Провести интонационный анализ исполнения произведений профессиональными вокалистами на основе анализа изменения мгновенной частоты основного тона.

6. Разработать и провести моделирование устройства, позволяющего педагогу-вокалисту производить коррекцию голоса обучающегося певца на основе коэффициента отношения интенсивностей формант.

Результаты, выносимые на защиту:

1. Уточненная модель образования высокой певческой форманты и исследования адекватности модели естественному процессу звукообразования.

2. Результаты экспериментального анализа спектров голосов профессиональных и непрофессиональных исполнителей на основе введенного коэффициента отношения интенсивностей формант (КОИФ). Экспериментально исследованные закономерности изменения КОИФ.

3. Результаты программного моделирования устройства коррекции голоса непрофессионального исполнителя.

4. Результаты экспертной оценки полученных после коррекции акустических сигналов.

5. Методика анализа вокальной речи как нестационарного случайного процесса.

6. Результаты корреляционного анализа вокальной речи как нестационарного случайного процесса.

7. Результаты интонационного анализа исполнения произведений профессиональными вокалистами и певческого вибрато на основе исследования изменения мгновенной частоты основного тона.

Научная новизна:

1. Обоснована уточненная модель механизма образования высокой певческой форманты (ВПФ) и представлена доказательная база к объединению теорий образования ВПФ В.П. Морозова и Е.А. Рудакова на основе расчета физической модели.

2. В качестве критерия оценки певческого голоса на основе экспериментальных исследований спектров вокальных гласных профессиональных и непрофессиональных исполнителей введен коэффициент отношения интенсивностей формант (КОИФ).

3. Выявлена зависимость изменения КОИФ от частоты основного тона для всех типов мужских голосов.

4. Разработан новый способ корреляционного анализа вокальных акустических сигналов как нестационарных случайных процессов. Получены «нестационарные портреты» голосов профессиональных и непрофессиональных исполнителей.

Практическая значимость:

1. Результаты исследования позволяют дополнить субъективные оценки голоса начинающего певца объективными характеристиками на основе КОИФ и тем самым уменьшить вероятность ошибочных решений при его обучении.

2. На основе данных, полученных при экспериментальном исследовании спектров вокальных гласных профессиональных исполнителей, разработан алгоритм и проведено моделирование устройства коррекции певческого голоса с использованием КОИФ. Полученные программные решения могут быть применены в практике обучения вокалистов с целью прогнозирования звучания их голосов в будущем, а также при обработке старых аудиозаписей с грампластинок и в других областях.

3. Разработанный и экспериментально апробированный метод корреляционного анализа вокальных акустических сигналов как нестационарных случайных процессов позволяет проводить визуальную трактовку результатов без специального технического образования.

4. Разработана методика анализа изменения мгновенной частоты акустических вокальных сигналов, позволяющая оценить форму и размах певческого вибрато, а также его нестационарный характер.

Методы исследования. Проведенные в работе исследования базируются на применении теории спектрального анализа, теории планирования эксперимента, а также корреляционного анализа случайных процессов. Используются также методы экспериментальных исследований акустических сигналов и методы цифрового моделирования.

Внедрение результатов работы. Полученные при выполнении диссертационной работы результаты нашли применение в научных исследованиях и учебном процессе кафедры теоретических основ радиотехники ТТИ ЮФУ в курсах «Акустика» и «Зрительно-слуховое восприятие аудиовизуальных программ», а также в Ростовской государственной консерватории (академии) им. C.B. Рахманинова. Использование новых научных результатов позволило улучшить методическое обеспечение, повысить наглядность и дать новые знания по указанным дисциплинам, а также повысить эффективность учебного процесса у студентов-вокалистов.

Апробация работы. Отдельные результаты работы докладывались и обсуждались на следующих конференциях: VII и VIII Всероссийская научная конференция студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления» Таганрог, ТРТУ, 2004 г., 2006 г.; Международные научные конференции «Оптимальные методы решения научных и практических задач» (2005 г.), «Цифровые методы и технологии», (2005 г.), «Информационные технологии в современном мире» (2006 г.), «Проблемы развития естественных, технических и социальных систем» (2007 г.), «Проектирование новой реальности» (2007 г.); «Информация, сигналы, системы: вопросы методологии, анализа и синтеза» (2008 г.), «Инновации в обществе, технике и культуре» (2008 г.), Таганрог, ТРТУ, ТТИ ЮФУ; Международная научно-техническая конференция студентов, аспирантов и ученых «Молодежь и современные проблемы радиотехники и телекоммуникаций «РТ-2006», Севастополь, СевНТУ, 17-21 апреля 2006 г.; Международная научно-практическая конференция студентов и аспирантов «Музыкальное искусство и наука в современном мире», Астрахань, АГК, 18 мая 2006 г.; Международная научная конференция «Информационная культура общества и личности в XXI веке», Краснодар, КГУКиИ, 20-23 сентября 2006 г.; Всероссийская научная конференция «Психология и фониатрия: их роль в воспитании молодых вокалистов», Астрахань, АГК, 8-9 ноября 2007 г.; LIII научно-техническая конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ, Таганрог, ТТИ ЮФУ, 2008 г.; Всероссийская научная конференция с международным участием «Исполнительское искусство и музыковедение. Параллели и взаимодействия», Москва, ГКА им. Маймонида, 6-9 апреля 2009 г.; IV Международная научная конференция «Музыка народов мира: проблемы изучения», Москва, МГК им. П.И. Чайковского, 11-12 апреля 2009 г.

Публикации. По теме диссертации опубликовано 16 научных работ, из них 5 статей (3 статьи в центральной печати) и 11 статей и тезисов докладов на научно-технических конференциях.

Структура диссертационной работы. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы. Содержание диссертации изложено на 146 страницах и включает 105 рисунков, 32 таблицы и список литературы из 65 наименований.

 
Заключение диссертации по теме "Акустика"

Выводы по разделу

Рассмотренные автокорреляционные функции вокальной речи как нестационарного случайного процесса позволяют выявить различия между профессиональным и непрофессиональным исполнением и использовать эти данные при анализе и синтезе вокальной речи.

Поскольку голоса профессиональных певцов обладают низкой степенью корреляции по сравнению с непрофессиональным исполнением, то можно говорить о том, что в голосе профессионала присутствует больше случайных составляющих, отвечающих за эмоциональность речи, что положительно воспринимается слушателем, который, в свою очередь, и делает вывод о качестве исполнения.

Показано, что существенную роль при восприятии вокальной речи слушателем играет изменение мгновенной частоты. Это относится и к музыкальной интонации и к певческому вибрато.

Исследование певческой интонации показало, что эмоциональный настрой исполнителя отражается на звуковысотном воспроизведении. При общем грустном характере исполняемого произведения и на звуковом нюансе пиано у профессиональных певцов проявляется тенденция к занижению тона, а при звуковых нюансах форте и фортиссимо, наоборот, ноты завышаются. Так же завышается основной тон и перед взятием более высокой ноты через большой интервал. Это, возможно, объясняется внутренней подготовкой певца к исполнению высокой ноты. Вероятно, изменение во времени формы и размаха певческого вибрато также обусловлено эмоциональным настроем исполнителя. Отклонение характеристик реального вибрато от автоматического положительно сказывается на восприятии вокальной речи.

ЗАКЛЮЧЕНИЕ

Выполненные исследования позволили как уточнить известные модели и характеристики певческого голоса, так и ввести новые критерии и разработать методики совершенствования вокального исполнения.

В диссертационной работе получены новые результаты по исследованию механизма образования высокой певческой форманты и представлена доказательная база к объединению теорий образования ВПФ Морозова В.П. и Рудакова Е.А.

Проведено исследование формантных характеристик спектров вокальных гласных профессиональных исполнителей групп мужских голосов: бас, баритон и тенор, а также были исследованы вокальные гласные непрофессиональных исполнителей. Введен коэффициент отношения интенсивностей высокой и низкой певческих формант в зависимости от частоты основного тона (КОИФ).

Проведенные исследования выявили закономерность изменения коэффициента отношения интенсивностей высокой и низкой певческих формант в зависимости от частоты основного тона. КОИФ зависит от частоты основного тона и носит возрастающий характер.

Установлено, что для профессиональных певцов характерна значительная величина КОИФ, который монотонно растет по диапазону, причем, для голосов с высокой тесситурой, он имеет большее значение (бас - средний КОИФ - 0,5; баритон — 0,86; тенор - 1,04). У непрофессиональных исполнителей средний КОИФ для всего диапазона равен 0,29.

Исследования такого рода могут быть полезны для практики обучения вокалистов.

Разработан способ коррекции звучания вокальных гласных непрофессионального исполнителя путем приближения отношения интенсивностей высокой и низкой певческих формант в зависимости от частоты основного тона к эталонному значению (коэффициент КЭт ¡)

Проведено моделирование устройства коррекции голоса непрофессионального исполнителя в программной среде МаНаЬ. Проведенная экспертная оценка исходного и скорректированного сигналов выявила, что математическое ожидание, играющее роль средней оценки для каждой характеристики (громкость, звонкость, тембр, отчетливость), увеличилось, в среднем в два раза, что указывает в целом на приближение звучания голоса певца к эталонному (профессиональному).

Результаты проделанной работы позволяют технически реализовать устройство коррекции вокального голоса на современной элементной базе, работающее в реальном масштабе времени. Предварительные эксперименты на компьютере показывают приемлемость параметров для целей обработки и постановки голоса в учебной практике, в концертной практике для корректировки недостатков певческих данных, а также для восстановления старых записей с грампластинок, в амплитудно-частотной характеристике которых наблюдается резкий спад в области высоких частот.

Вычисленные автокорреляционные функции вокальной речи как нестационарного случайного процесса позволяют выявить различия между профессиональным и непрофессиональным исполнением и использовать эти данные при анализе вокальной речи.

Выявлено, что интервал корреляции автокорреляционной функции у профессиональных певцов находится в пределах 10-15 мс, у непрофессиональных исполнителей на порядок больше - 110-150 мс.

Применение метода анализа вокальной речи как нестационарного случайного процесса позволило количественно оценить тенденцию к улучшению характеристик голоса в процессе обучения. Получен нестационарный «портрет голоса» вокалиста, по которому можно судить о профессионализме исполнителя по визуальной оценке графиков, не имея специальной математической и технической подготовки, что удобно при использовании данного метода педагогами-вокалистами в музыкальных учебных заведениях.

Показано, что существенную роль при восприятии вокальной речи слушателем играет изменение мгновенной частоты. Это относится к музыкальной интонации и к певческому вибрато.

Исследование певческой интонации показало, что эмоциональный настрой исполнителя отражается на точности высотного интонирования. При общем грустном характере исполняемого произведения и на звуковом нюансе пиано у профессиональных певцов проявляется тенденция к занижению тона, а при звуковых нюансах форте и фортиссимо, наоборот, ноты завышаются. Так лее завышается основной тон и перед взятием более высокой ноты через большой интервал. Это объясняется внутренней подготовкой певца к исполнению высокой ноты.

Выявлено, что изменение во времени формы и размаха певческого вибрато в пределах 20-40% обусловлено эмоциональным настроем исполнителя. Отклонение характеристик реального вибрато от автоматического положительно сказывается на восприятии вокальной речи.

Таким образом, основные задачи диссертационного исследования выполнены, но объект исследования настолько сложен, что имеется перспектива дальнейшего развития предложенных методов.

 
Список источников диссертации и автореферата по физике, кандидата технических наук, Бакаев, Александр Васильевич, Таганрог

1. Алдошина И.А. Основы психоакустики. Часть 17. Слух и речь. Часть 1 // Звукорежиссер, 2002, №1.

2. Алдошина И.А. Основы психоакустики. Часть 17. Слух и речь. Часть 3: Акустические характеристики речи // Звукорежиссер, 2002, №4.

3. Алдошина И.А. Основы психоакустики. Часть 17. Слух и речь. Часть 5: Акустические характеристики вокальной речи // Звукорежиссер, 2002, №9.

4. Анциперов B.E. Сегментация изолированных слоев на основе динамики параметров коротких корреляционных функций / В. Е. Анциперов, В. А. Морозов, С. А. Никитов // Радиотехника и электрон. 2006. - Т. 51, № 12.-С. 1441-1453.

5. Бакаев A.B. Цифровой формантный фильтр. Часть 1//Современные проблемы теории радиотехнических сигналов, цепей и систем. Сборник научных статей. Таганрог: Изд-во ТРТУ, 2004. С. 54 - 57.

6. Бакаев A.B. Цифровой формантный фильтр. Часть 2//Сборник тезисов докладов VII всероссийской научной конференции студентов и аспирантов. Техническая кибернетика, радиоэлектроника и системы управления. -Таганрог: Изд-во ТРТУ, 2004. С. 5 6.

7. Бакаев A.B. Анализ певческих голосов на основе цифрового анализа спек-тров//Материалы международной научной конференции «Цифровые методы и технологии» часть 1 - Таганрог: Изд. «Антон», ТРТУ, 2005. С. 7-13.

8. Бакаев A.B. Коэффициент отношения интенсивностей формант//Сборник тезисов докладов VIII всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления». Таганрог: Изд-во ТРТУ, 2006. С. 10-11.

9. Н.Бакаев A.B. Особенности формантной структуры вокальной ре-чи//Материалы международной научной конференции «Проблемы развития естественных, технических и социальных систем» часть 2 — Таганрог: Изд-во «Антон», ТТИ ЮФУ, 2007. С. 5 - 8.

10. Бакаев A.B. Об особенностях формантных областей певческого голо-са//Материалы международной научной конференции «Проектирование новой реальности» часть 3 - Таганрог: Изд-во ТТИ ЮФУ,2007. С. 5 - 10.

11. Бакаев A.B. Влияние формантных областей на разборчивость речи// Информационное противодействие угрозам терроризма: научн-практ. журн./ФГПУ НТЦ гос. per. №0320600189, Москва. 2008, №12. С. 51 56.

12. Бакаев A.B. Вокальная речь как нестационарный случайный процесс// Материалы международной научной конференции «Информация, сигналы, системы: вопросы методологии, анализа и синтеза» часть 1 - Таганрог: Изд-во ТТИ ЮФУ, 2008. С. 4 - 8.

13. Бакаев A.B. Сравнение характеристик вокальной речи на основе корреляционного анализа/ТМатериалы международной научной конференции «Инновации в обществе, технике и культуре» часть 2 - Таганрог: Изд-во ТТИ ЮФУ, 2008. С. 5-12.

14. Баскаков С.И. Радиотехнические цепи и сигналы: Учебник. М.: Высш. школа., 1983. - 536 е., ил.

15. Бендат Дж., Пирсол А. Измерение и анализ случайных процессов. М.: Изд-во «Мир», 1974. 464 с.

16. Бондаренко В.П. Сегментация и параметрическое описание речевого сигнала / В. П. Бондаренко, А. А. Конев, Р. В. Мещеряков // Изв.вузов. Приборостроение. 2007. - Т.50, № 10.- С. 3 - 7.

17. Володин A.A. Электронные музыкальные инструменты, М., «Энергия», 1970.

18. Герасимов A.B. Применение метода модифицированного линейного предсказания к задачам выделения акустических признаков речевых сигналов /

19. А. В. Герасимов, О. А. Морозов, В. Р. Фидельман // Радиотехника и электрон. 2005. - Т. 50, № 10.-С. 1287- 1291.

20. Гольденберг JI.M. и др. Цифровая обработка сигналов: Учеб. Пособие для вузов.- 2-изд., перераб. и доп.-М.:Радио и связь, 1990. -256 е.: ил.

21. Гоноровский И.С. Радиотехнические цепи и сигналы: Учебник для вузов. 4-е изд., перераб. и доп. - М.: Радио и связь, 1986. - 512 е.: ил.

22. Ермолаев В.Г., Левин А.Л. Практическая аудиология, 1969. Л.: Медицина, 1969, 240 с.

23. Колоколов A.C. Сглаживание спектра речевого сигнала // Автомат.и теле-мех. 2006.- №7. -С. 161 - 169.

24. Кропотов Ю.А. Временной интервал определения закона распределения вероятности амплитуд речевого сигнала // Радиотехника. 2006. - № 6. — С. 97-98.

25. Кропотов Ю.А. Алгоритм определения параметров экспоненциальной аппроксимации закона распределения вероятности амплитуд речевого сигнала // Радиотехника. 2007. - № 6. - С. 44 - 47.

26. Лабутин В.К., Молчанов А.П. Модели механизмов слуха. М.: Энергия, 1973.200 с. ил.

27. Лаврентьева Е.В. Спектр и разборчивость прерываемой ре-чи//Радиотехника. 2004. - № 8. - С.23-25.

28. Маркович И.И. Сборник лабораторных работ по цифровой обработке сигналов, ТРТУ, НКБ ЦОС, 2003.

29. Мережин Н.И. Аудиотехника. Часть 1. Системы передачи звуковой информации. Свойства слуха и параметры звуковых сигналов: Конспект лекций. Таганрог: Изд-во ТРТУ, 2004. - 48 с.

30. Морозов В.П. Тайны вокальной речи. Д.: Наука, 1967., 204 с.

31. Морозов В.П. Биофизические основы вокальной речи. Д.: Наука, 1977., 232с.

32. Морозов В.П. Искусство резонансного пения. Основы резонансной теории и техники. ИП РАН, МГК им. П.И. Чайковского, Центр «Искусство и наука». М., 2002. 496 е., ил.

33. Морозов В.П., Кузнецов Ю.М., Харуто A.B. Об особенностях спектра голоса певцов разных жанров // Труды Академии информатизации. М.; Краснодар, 1995. С. 147-156.

34. Рабинер Д., Гоулд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1978., 848 с.

35. Рагс Ю. Вибрато и восприятие высоты//Применение акустических методов исследования в музыкознании. Сборник статей. Ред. С.С. Скребков. М.: Музыка, 1964. С. 38 60.

36. Рудаков Е.А. Новая теория образования верхней певческой форман-ты//Применение акустических методов исследования в музыкознании. Сборник статей. Ред. С.С. Скребков. М.: Музыка, 1964. С. 18-37.

37. Рыжов В.П. Электромузыкальные инструменты: Текст лекций. Часть 1. Таганрог: Изд-во ТРТУ, 2000. 64 с.

38. Савченко В.В. Автоматическая обработка речи по критерию минимума информационного рассогласования на основе обеляющего фильтра // Радиотехника и электрон. 2005. - Т. 50, № 3. С. 309 - 314.

39. Сапожков М.А. Речевой сигнал в кибернетике и связи. Связьиздат, М.: 1963., 452 с.

40. Сахалтуева О. Интонационный анализ исполнения первой части концерта для скрипки с оркестром Мендельсона // Применение акустических методов исследования в музыкознании. Сборник статей. Ред. С.С. Скребков. М.: Музыка, 1964., с. 61 78.

41. Сахалтуева О., Назайкинский Е. О взаимосвязях выразительных средств в музыкальном исполнении (на примере анализа пьесы Р. Шумана «Грезы»)//Музыкальное искусство и наука. Выпуск 1. Сборник статей под ред. Е.В. Назайкинского. М.: Музыка, 1970. С. 59 94.

42. Смирнов H.H., Федосов В.П., Цветков Ф.А. Измерение характеристик случайных процессов / Под ред. В.П. Федсова: Учеб. Пособие для вузов. -М.: САЙНС-ПРЕСС, 2004. 64 е.: ил.

43. Сорокин В.Н. Первичный анализ речевых сигналов // Акуст.журн. 2005. -Т.51, № 4.-С.536-542.

44. Старченко И.Б., Тимошенко В.И. Стохастические и динамические модели в акустике и биомедицине. — Ростов-на-Дону : ООО «Ростиздат», 2007. — 320 с.

45. Фланаган Дж. Ф. Анализ, синтез и восприятие речи. М., Связь, 1968.

46. Фролов М.В. и др. Диагностика функциональных и депрессивных состояний по характеристикам интонации и временного потока речи // Био-мед.технол. и радиоэл. 2004. - № 12. - С.8-15

47. Фролов М.В. и др. Анализ речевых сигналов в оценке нарушений эмоциональных состояний человека // Биомед.технол. и радиоэл. 2005. - № 1-2.-С. 4-9.

48. Харуто А. В. Об исследовании характеристик вибрато в академическом пении. // Сб. трудов XVI сессии Российского акустического общества. Т2., — М: ГЕОС, 2005. С. 40-44.

49. Харуто A.B. Тувинское горловое пение: акустический анализ и модель звукообразования//Сборник трудов XX сессии российского акустического общества. Москва: ГЕОС, 2008. С. 106-110.

50. Христиан Э., Эйземан Е. Таблицы и графики по расчету фильтров. М.: Связь, 1975.-408 с.

51. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации. Перевод с немецкого под редакцией Б.Г. Белкина. М., «Связь», 1971. 255 с. с илл.

52. Цифровая обработка сигналов/А.Б. Сергиенко СПб.:Питер, 2002.-608 с.:ил.

53. Штейнпресс Б.С., Ямпольский И.М. Энциклопедический музыкальный словарь. 2-изд., перераб. и доп.- М.: Советская энциклопедия, 1966.- 632 е.: ил.

54. Электрорадиоизмерения. Учебн. Пособие для вузов, под ред. В.И. Винокурова. М.: Высшая школа, 1976. 264 е., ил.

55. Юссон Р. Певческий голос. М.: Высшая школа, 1974., 262 с.